dr Mariusz Rafało


Big Data [223090-0421]


Zaliczenie i zasady
# Tematyka Slajdy Kod
1 Wprowadzenie do tematyki Big Data. Architektura Big data. Wybrane komponenty pdf kod
2 Przetwarzanie rozproszone: koncepcja, przykłady i zastosowania pdf kod
3 Wybrane komponenty ekosystemu Big Data (technologie) pdf kod
4 Warsztat (churn telco) z wykorzystaniem Apache Spark pdf kod
5 Analityka na platformie Big Data. Integracja ekosystemu Big Data z hurtownią danych pdf n/d
6 Analizowanie danych typu JSON n/d kod
7 Analizowanie danych w czasie rzeczywistym (Kafka) pdf kod
8 Analizowanie danych w czasie rzeczywistym (Kafka producer) n/d kod
9 Wybrane zagadnienia związane z etyką i prywatnością danych pdf n/d
10 Case study: omówienie rzeczywistego wdrożenia systemu Big Data pdf n/d

Dane, z których korzystamy:
# Zbiór danych Plik Źródło
1 Churn w telekomunikacji (2) telco3.zip Using Customer Behavior Data to Improve Customer Retention
2 Transakcje kartą kredytową creditcard.zip kaggle.com
3 USA shootings shootings.zip kaggle.com


Copyright © Mariusz Rafało