Hurtownie danych i analiza danych

Zasady naboru:

kolejność złoszeń

 

Terminy zajęć:

  • sobota/ 3 razy w miesiącu
  • liczba godzin - 206
 

Profil kształcenia:

Nowoczesne firmy są zarządzane w oparciu o wiedzę, dzięki której są uruchamiane odpowiednie działania biznesowe. Wiedza ta, z kolei, jest zdobywana w oparciu o informacje płynące zarówno z otoczenia jak i z wewnętrznych systemów firmowych. Jednym z podstawowych źródeł pozyskiwania informacji są wewnątrzfirmowe systemy gromadzące dane, które podlegają zaawansowanym analizom, a ich wyniki stanowią podstawę podejmowania decyzji biznesowych. Tego typu analizy są możliwe dzięki dwóm technologiom: hurtowni danych (HD) i inteligencji biznesowej (BI) bazującej na eksploracji danych i uczeniu maszynowym. Hurtownie danych pozwalają na integrację danych z różnych heterogenicznych źródeł danych oraz prostą analizę tych danych, natomiast technologia eksploracji danych i uczenia maszynowego pozwalała na zaawansowaną analizę danych, odkrywanie wiedzy, wzorców, trendów i reguł w danych przechowywanych w bazach i hurtowniach danych.

Studium podyplomowe „Hurtownie danych i analiza danych” jest adresowane do osób zajmujących się praktycznie zagadnieniami projektowania, implementowania i administrowania systemami hurtowni oraz analizy i eksploracji danych. Studium jest adresowane, z jednej strony, do osób zajmujących się praktycznie zagadnieniami budowy i wdrażania systemów wspomagania podejmowania decyzji na bazie systemów HD i BI, z drugiej, do menadżerów, którzy dzięki studium będą posiadali wiedzę, umiejętności i kompetencje do zarządzania projektem budowy systemu HD i BI oraz do opracowania kompetencji utrzymania i rozwoju takiego systemu. 

Studium oferuje słuchaczom kompetencje w dziedzinie modelowania, projektowania, implementacji i administrowania nowoczesnymi systemami hurtowni danych, technologii integracji danych, zasilania i odświeżania hurtowni danych, architektury i organizacji wewnętrznej hurtowni danych, baz danych NoSQL a także technik analizy danych, podstawowych metod i algorytmów eksploracji danych, zaawansowanych technik eksploracji sieci społecznościowych, oraz programowania w R. Program studiów obejmuje następujące przedmioty (wykład + laboratorium): (1) Architektury i technologie integracji danych (problematyka integracji danych, systemy mediacyjne, sfederowane, architektury hurtowni danych), (2) Modelowanie hurtowni danych, (3) Technologie zasilania i odświeżania HD (ETL/ELT, problematyka czyszczenia danych, case study), (4) Organizacja wewnętrzna HD (struktury indeksowe, perspektywy zmaterializowane, partycjonowanie, kompresja, optymalizacja zapytań), (5) Klasyczna analiza danych (zaawansowane funkcje analityczne w języku SQL), (6) Techniki i algorytmy eksploracji danych, (7) Zaawansowane techniki analizy danych - sieci społecznościowe, (8) Składowanie i analiza gigadanych (Big Data) (koncepcja serwerów baz danych NoSQL, sposoby dostępu do danych w NoSQL, indeksowanie, platforma Hadoop, Sparc), (9) Programowanie w R, (10) Projekt systemu HD (wykorzystanie zdobytej wiedzy w ramach projektu systemu hurtowni danych od analizy wymagań, poprzez profilowanie źródeł danych, modelowanie schematu hurtowni danych, budowanie przepływów ETL/ELT, implementowanie aplikacji analitycznych).

Zajęcia są prowadzone przez wykładowców o dużym dorobku naukowym i dydaktycznym bezpośrednio związanym z ww. przedmiotami, posiadających liczne doświadczenia w realizacji krajowych i międzynarodowych projektów badawczo-rozwojowych, od wielu lat specjalizujących się w transferze wiedzy i technologii przetwarzania danych wśród przedsiębiorstw informatycznych jak i instytucji publicznych.

Strona internetowa

Visit a website

Dodatkowe informacje