dr Mariusz Rafało


Hadoop & Spark


Zaliczenie i zasady
# Tematyka Slajdy Kod
1 Wprowadzenie do ekosystemu Apache Hadoop cz.1 cz.2 cz.1 cz.2
2 Techniki i technologie przetwarzania danych pdf Kod
3 Wprowadzenie do platformy Databricks n/d Kod
4 Wybrane technologie ekosystemu Big Data cz.1 cz.2 cz.3 cz.4 Kod
5 Formaty plików w ekosystemie Apache Hadoop pdf 1 2 3
6 Hadoop a bazy danych pdf kod
7 Konfiguracja Apache Cassandra html kod
8 Przetwarzanie danych w czasie rzeczywistym pdf
9 Konfiguracja Apache Kafka html kod
10 Aplikacja: integracja Kafka i Spark Streaming pdf
11 Ćwiczenia: Aplikacja batch pdf
12 Ćwiczenia: Aplikacja real-time pdf
13 Ćwiczenia: Pliki pdf
14 Ćwiczenia: Delays pdf kod
15 Ćwiczenia: baza danych pdf
16 Ćwiczenia: Kafka pdf
17 Czyszczenie środowiska Databricks (QUOTA_EXCEEDED) html

Dane, z których korzystamy:
# Zbiór danych Plik Źródło
1 Zgłoszenia incydentów na policję police-department-incidents.zip kaggle.com
2 Airline On-Time Performance and Causes of Flight Delays delays.zip data.gov


Copyright © Mariusz Rafało