AI & Data

Szkolenie Azure Databricks

Azure Databricks jest usługą big data opartą o platformę Apache Spark, która umożliwia tworzenie, uczenie i eksplorację danych w chmurze.

Czas trwania
24h / 3 dni · 3h
Dla kogo

Idealny dla zespołów, które…

1 Dla osób, które chcą wykorzystywać dane do optymalizacji procesów.
2 Osób, które chcą lepiej poznać Apache Spark.
3 Dla osób, które mają podstawową wiedzę z zakresu analizy danych.
4 Dla programistów, Data Engineerów i Data Scientist.
Efekty po programie

Praktyczne warsztaty z AI i analityki danych — na realnych przypadkach Twojego zespołu.

Poznasz fundamenty platformyu Azure Databricks.

Nauczysz się obróbki i przygotowywania danych.

Dowiesz się jak analizować dane z Databricks SQL

Nauczysz się korzystać z Apache Spark

Program · 15 modułów

Co konkretnie robimy

M01
What is the Databricks Lakehouse Platform
  • · Describe what the Databricks Lakehouse Platform is.
  • · Explain the origin of the Lakehouse data management paradigm.
  • · Outline fundamental challenges related to managing and using data.
  • · Describe security features of the Databricks Lakehouse Platform.
  • · Give examples of organizations that have benefited from using the Databricks Lakehouse Platform
M02
What is Databricks SQL
  • · Summarize fundamental concepts for using Databricks SQL effectively
  • · Identify tools and features in Databricks SQL for querying data and sharing insights
  • · Explain how Databricks SQL supports data analysis workflows that allow users to extract and share business insights
M03
What is Databricks Machine Learning
  • · Describe the basic overview of Databricks Machine Learning.
  • · Identify how using Databricks Machine Learning benefits data science and machine learning teams
  • · Summarize the fundamental components and functionalities of Databricks Machine Learning
  • · Exemplify successful use cases of Databricks Machine Learning by real Databricks customers
M04
What is Databricks Data Science and Data Engineering Workspace
  • · Describe the basic overview of Databricks Data Science and Engineering Workspace
  • · Identify assets provided by the workspace
  • · Describe a simple development workflow that queries and aggregates data
M05
Databricks Workspaces And Services
  • · Databricks Architecture and Services
  • · Data Science and Engineering Workspace
  • · Create and Manage Interactive Clusters
  • · Notebook Basics
  • · Git Versioning with Databricks Repos
  • · Using Databricks Repos
  • · Getting Started with the Databricks Platform
M06
Delta Lakehouse
  • · What is Delta Lake
  • · Managing Delta Tables
  • · Manipulating Tables with Delta Lake
  • · Advanced Delta
M07
Relational entities on Databricks
  • · Databases and Views
  • · Views and CTEs
M08
ETL with Spark Sql
  • · Query Files Directly
  • · Providing Options
  • · Creating Delta Tables
  • · Writing to Tables
  • · Cleaning Data
  • · Advanced SQL Transformations
  • · UDF
M09
Getting Started with Databricks Sql
  • · Getting Started with Databricks Sql
  • · Navigating Databricks SQL
  • · Unity Catalog on Databricks Sql
  • · Schemas, Tables and Views on Databricks SQL
M10
Basic SQL on Databricks Sql
  • · Ingesting Data for Databricks Sql
  • · Ingesting Data
  • · Joins
  • · Delta Commands in Databricks Sql
M11
Presenting Data Visually
  • · Data Visualization
  • · Data Visualizations on Databricks Sql
  • · Dashboards on Databricks Sql
  • · Notifying Stakeholders
M12
Apache Spark Programming – Dataframes
  • · Databricks platform
  • · Databricks Ecosystem
  • · Spark Sql
  • · Dataframes
  • · SparkSession
  • · Reader and writer
  • · Data Sources
  • · Dataframe and column
  • · Column and Expression
  • · Transformation ACtions and Rows
M13
Apache Spark Programming – Transformations
  • · Aggregation
  • · Aggregation Functions
  • · Datetimes
  • · Dates and Timestamps
  • · Complex Types
  • · Complex Types
  • · Additional Functions
  • · UDFS
  • · UDFs Vectorized Functions
M14
Apache Spark Programming – Spark Internals
  • · Spark Architecture
  • · Spark Cluster, Spark Execution
  • · Shuffling and Caching
  • · Query Optimization
  • · Partitioning
M15
Apache Spark Programming – Structured Streaming
  • · Apache Spark Programing
  • · Streaming Concepts
Każdy moduł modyfikujemy pod Twój stack i kontekst. Powyższe to punkt wyjścia — nie sztywna agenda.
Jak pracujemy

Od briefu do retro w 30 dniach.

01

Brief i diagnoza

Rozmowa z liderem zespołu + krótka ankieta dla uczestników. Określamy cele, gap, kontekst.

02

Modyfikacja programu

Dostosowujemy moduły, case studies i przykłady kodu pod Twój stack. Akceptacja w 5 dni.

03

Warsztat

Sesje z trenerem, hands-on, code review. Mentor dostępny też pomiędzy sesjami.

04

Retro + raport

Raport z efektami dla zespołu i lidera. 30 dni konsultacji w cenie.

Zapytanie

Wyślij brief. Odezwiemy się w 1 dzień.

Po krótkim briefie przygotujemy program i wycenę. Bez zobowiązań — to tylko punkt wyjścia do rozmowy.

Wycena w 48h od briefu
Pierwsza sesja w 30 dni
Pilotaż przed pełną decyzją
Faktura VAT, możliwość płatności w transzach

Ochrona antyspamowa (Cloudflare Turnstile) zostanie aktywowana po wpięciu klucza.