Hurtownie danych i analiza danych

Zasady naboru:

kolejność złoszeń

 

Terminy zajęć:

  • sobota/ 3 razy w miesiącu
  • 84 godziny lekcyjne wykładow, 100 godzin zajęć laboratoryjnych, 20 godzin zajeć projektowych
 

Profil kształcenia:

Studia podyplomowe „Hurtownie danych i analiza danych” są adresowane do osób zajmujących się praktycznie zagadnieniami projektowania, implementowania i administrowania systemami hurtowni oraz analizy i eksploracji danych. Nowoczesne firmy są zarządzane w oparciu o wiedzę, dzięki której są uruchamiane odpowiednie działania biznesowe. Wiedza ta, z kolei, jest zdobywana w oparciu o informacje płynące zarówno z otoczenia jak i z wewnętrznych systemów firmowych. Jednym z podstawowych źródeł pozyskiwania informacji są wewnątrzfirmowe systemy gromadzące dane, które podlegają zaawansowanym analizom, a ich wyniki stanowią podstawę podejmowania decyzji biznesowych. Tego typu analizy są możliwe dzięki dwóm technologiom: hurtowni danych i inteligencji biznesowej bazującej na eksploracji danych. Hurtownie danych pozwalają na integrację danych z różnych heterogenicznych źródeł danych oraz prostą analizę tych danych, natomiast technologia eksploracji danych pozwalała na zaawansowaną analizę danych, odkrywanie wiedzy, wzorców, trendów i reguł w danych przechowywanych w bazach i hurtowniach danych.
Studia oferują słuchaczom kompetencje w dziedzinie modelowania, projektowania, implementacji i administrowania nowoczesnymi systemami hurtowni danych, technologii integracji danych, zasilania i odświeżania hurtowni danych, architektury i organizacji wewnętrznej hurtowni danych,baz danych NoSQL  a także technik analizy danych, podstawowych metod i algorytmów eksploracji danych oraz zaawansowanych technik eksploracji sieci społecznościowych. Program studiów obejmuje następujące przedmioty (wykład + laboratorium):

Architektury i technologie integracji danych (problematyka integracji danych, systemy mediacyjne, sfederowane, architektury hurtowni danych);

Modelowanie hurtowni danych (konceptualny model wielowymiarowy, implementacja konceptualnego modelu wielowymiarowego-ROLAP, MOLAP, schemat gwiazdy, płatka śniegu, konstelacji faktów, gwiazda-płatek śniegu, dyskusja dot. wyboru właściwego schematu, problematyka modelowania wymiarów, wymiary wolnozmienne, taksonomia hierarchii wymiarów);

Technologie zasilania i odświeżania HD (ETL/ELT, problematyka czyszczenia danych, case study); - Organizacja wewnętrzna HD (struktury indeksowe (B-drzewo, bitmapowy, połączeniowy, bitmapowy połączeniowy, sklastrowany, MDC), perspektywy zmaterializowane, partycjonowanie, kompresja, optymalizacja zapytań gwiaździstych);

Klasyczna analiza danych (zaawansowane funkcje analityczne w języku SQL, rozszerzenia grupowania w SQL);

Techniki i algorytmy eksploracji danych;

Zaawansowane techniki analizy danych - sieci społecznościowe;

Składowanie i analiza gigadanych (Big Data) (koncepcja serwerów baz danych NoSQL, sposoby dostępu do danych w NoSQL, indeksowanie, platforma Hadoop, Sparc);

Projekt systemu HD (wykorzystanie zdobytej wiedzy w ramach projektu systemu hurtowni danych od analizy wymagań, poprzez profilowanie źródeł danych, modelowanie schematu hurtowni danych, budowanie przepływów ETL/ELT, implementowanie aplikacji analitycznych).

Zajęcia są prowadzone przez wykładowców o dużym dorobku naukowym i dydaktycznym bezpośrednio związanym z ww. przedmiotami, posiadających liczne doświadczenia w realizacji krajowych i międzynarodowych projektów badawczo-rozwojowych, od wielu lat specjalizujących się w transferze wiedzy i technologii przetwarzania danych wśród przedsiębiorstw informatycznych jak i instytucji publicznych.

附加信息