dr Mariusz Rafało


Hadoop & Spark


Zasady zaliczenia

Zasady współpracy podczas promowania pracy dyplomowej
# Tematyka Slajdy Kod
1 Wprowadzenie do ekosystemu Apache Hadoop pdf cz.1 cz.2
2 Ekosystem Apache Spark pdf Kod
3 Technologie przetwarzania danych pdf cz.1 cz.2
4 Technologie automatyzacji pdf
5 Technologie składowania danych pdf
6 Technologie administrowania pdf
7 Formaty plików pdf cz.1cz.2cz.3
8 Big data a hurtownia danych pdf
9 Analiza danych w czasie rzeczywistym pdf
10 Technologie real-time pdf
11 Bezpieczeństwo pdf
12 Ćwiczenia: Formaty plików pdf
13 Ćwiczenia: flight delays pdf
14 Czyszczenie środowiska Databricks (QUOTA_EXCEEDED) html

Dane, z których korzystamy:
# Zbiór danych Plik Źródło
1 Zgłoszenia incydentów na policję police-department-incidents.zip kaggle.com
2 Airline On-Time Performance and Causes of Flight Delays delays.zip data.gov


Copyright © Mariusz Rafało