Idealny dla zespołów, które…
Praktyczne warsztaty z AI i analityki danych — na realnych przypadkach Twojego zespołu.
Podstawowa znajomość programowania obiektowego w Java lub Python
Znajomość podstaw Big Data i/lub Hadoop będzie dodatkowym atutem
Co konkretnie robimy
- · Podstawowe pojęcia i warstwy architektury Big Data: dane, przetwarzanie, zarządzanie, analiza.
- · Modele architektury: Data Lake, Lambda, Kappa i Data Lakehouse.
- · Omówienie kryteriów projektowania: typ danych, skalowalność, charakterystyka batch i stream processing.
- · Przegląd sposobów przetwarzania danych: batch vs stream.
- · Architektura HDFS – rola NameNode i DataNode, rozproszony system plików.
- · Przetwarzanie wsadowe z MapReduce – podstawy i zastosowania.
- · Administracja i monitorowanie klastra Hadoop.
- · Zalety funkcjonalnego podejścia i porównanie Pythona z Javą.
- · Elementy języka Python wykorzystywane przy przetwarzaniu danych: praca z DataFrame, funkcje lambda, komprehensje, map, filter.
- · Ćwiczenia praktyczne: proste przetwarzanie danych, integracja z narzędziami Big Data (np. PySpark).
- · Apache Kafka: architektura, producent, konsument, partycje, replikacja.
- · Apache NiFi: zarządzanie przepływami danych – integracja źródeł i odbiorników.
- · Praktyczne ćwiczenia: tworzenie przepływów danych i monitorowanie.
- · Spark: architektura, RDD, DataFrame, Spark SQL.
- · Flink: zastosowania do stream processing, okna czasowe, zarządzanie stanem.
- · Projektowanie zadań batch i streamingowych, optymalizacja i tuning, Catalyst.
- · Integracja z Apache Hadoop i deployment aplikacji.
- · Apache Iceberg – format tabel skalowalnych, wsparcie ACID, optymalizacja zapytań.
- · Apache Atlas – metadane, governance danych, śledzenie linii pochodzenia danych.
- · Apache Druid - Architektura i komponenty Druid, indeksowanie danych. Zarządzanie danymi w czasie rzeczywistym i batch.
- · Projektowanie workflow danych i zarządzanie zależnościami z Airflow.
- · Praktyczne aspekty implementacji potoków danych oraz automatyzacji przetwarzania.
- · Integracja z narzędziami CI/CD oraz zarządzanie środowiskami produkcyjnymi.
- · Automatyzacja i orkiestracja procesów data pipeline.
- · Definiowanie DAG, praca z taskami w Python i Bash.
Od briefu do retro w 30 dniach.
Brief i diagnoza
Rozmowa z liderem zespołu + krótka ankieta dla uczestników. Określamy cele, gap, kontekst.
Modyfikacja programu
Dostosowujemy moduły, case studies i przykłady kodu pod Twój stack. Akceptacja w 5 dni.
Warsztat
Sesje z trenerem, hands-on, code review. Mentor dostępny też pomiędzy sesjami.
Retro + raport
Raport z efektami dla zespołu i lidera. 30 dni konsultacji w cenie.
Wyślij brief. Odezwiemy się w 1 dzień.
Po krótkim briefie przygotujemy program i wycenę. Bez zobowiązań — to tylko punkt wyjścia do rozmowy.
Dziękujemy!
Odezwiemy się w ciągu 1 dnia roboczego.
Inne programy dla zespołów
Zobacz wszystkie →AI dla analityków: od danych do decyzji
Praktyczne warsztaty z AI i analityki danych — na realnych przypadkach Twojego zespołu.
AI jako narzędzie wspierające modernizację aplikacji
Praktyczne warsztaty z AI i analityki danych — na realnych przypadkach Twojego zespołu.
AI szkolenie ogólne
Praktyczne warsztaty z AI i analityki danych — na realnych przypadkach Twojego zespołu.