dr Mariusz Rafało
Big Data [223090-0421]
Zaliczenie i zasady
# | Tematyka | Slajdy | Kod |
---|---|---|---|
1 | Wprowadzenie do tematyki Big Data. Architektura Big data. Wybrane komponenty | kod | |
2 | Przetwarzanie rozproszone: koncepcja, przykłady i zastosowania | kod | |
3 | Wybrane komponenty ekosystemu Big Data (technologie) | kod | |
4 | Warsztat (churn telco) z wykorzystaniem Apache Spark | kod | |
5 | Analityka na platformie Big Data. Integracja ekosystemu Big Data z hurtownią danych | n/d | |
6 | Analizowanie danych typu JSON | n/d | kod |
7 | Analizowanie danych w czasie rzeczywistym (Kafka) | kod | |
8 | Analizowanie danych w czasie rzeczywistym (Kafka producer) | n/d | kod |
9 | Wybrane zagadnienia związane z etyką i prywatnością danych | n/d | |
10 | Case study: omówienie rzeczywistego wdrożenia systemu Big Data | n/d |
Dane, z których korzystamy:
# | Zbiór danych | Plik | Źródło |
---|---|---|---|
1 | Churn w telekomunikacji (2) | telco3.zip | Using Customer Behavior Data to Improve Customer Retention |
2 | Transakcje kartą kredytową | creditcard.zip | kaggle.com |
3 | USA shootings | shootings.zip | kaggle.com |