AI & Data

Szkolenie Azure Databricks

Azure Databricks jest usługą big data opartą o platformę Apache Spark, która umożliwia tworzenie, uczenie i eksplorację danych w chmurze.

Czas trwania

24h / 3 dni · 3h

Zapytaj o program → Zobacz wszystkie

Dla kogo

Idealny dla zespołów, które…

1 Dla osób, które chcą wykorzystywać dane do optymalizacji procesów.

2 Osób, które chcą lepiej poznać Apache Spark.

3 Dla osób, które mają podstawową wiedzę z zakresu analizy danych.

4 Dla programistów, Data Engineerów i Data Scientist.

Efekty po programie

Praktyczne warsztaty z AI i analityki danych — na realnych przypadkach Twojego zespołu.

✓

Poznasz fundamenty platformyu Azure Databricks.

✓

Nauczysz się obróbki i przygotowywania danych.

✓

Dowiesz się jak analizować dane z Databricks SQL

✓

Nauczysz się korzystać z Apache Spark

Program · 15 modułów

Co konkretnie robimy

M01

What is the Databricks Lakehouse Platform

· Describe what the Databricks Lakehouse Platform is.
· Explain the origin of the Lakehouse data management paradigm.
· Outline fundamental challenges related to managing and using data.
· Describe security features of the Databricks Lakehouse Platform.
· Give examples of organizations that have benefited from using the Databricks Lakehouse Platform

M02

What is Databricks SQL

· Summarize fundamental concepts for using Databricks SQL effectively
· Identify tools and features in Databricks SQL for querying data and sharing insights
· Explain how Databricks SQL supports data analysis workflows that allow users to extract and share business insights

M03

What is Databricks Machine Learning

· Describe the basic overview of Databricks Machine Learning.
· Identify how using Databricks Machine Learning benefits data science and machine learning teams
· Summarize the fundamental components and functionalities of Databricks Machine Learning
· Exemplify successful use cases of Databricks Machine Learning by real Databricks customers

M04

What is Databricks Data Science and Data Engineering Workspace

· Describe the basic overview of Databricks Data Science and Engineering Workspace
· Identify assets provided by the workspace
· Describe a simple development workflow that queries and aggregates data

M05

Databricks Workspaces And Services

· Databricks Architecture and Services
· Data Science and Engineering Workspace
· Create and Manage Interactive Clusters
· Notebook Basics
· Git Versioning with Databricks Repos
· Using Databricks Repos
· Getting Started with the Databricks Platform

M06

Delta Lakehouse

· What is Delta Lake
· Managing Delta Tables
· Manipulating Tables with Delta Lake
· Advanced Delta

M07

Relational entities on Databricks

· Databases and Views
· Views and CTEs

M08

ETL with Spark Sql

· Query Files Directly
· Providing Options
· Creating Delta Tables
· Writing to Tables
· Cleaning Data
· Advanced SQL Transformations
· UDF

M09

Getting Started with Databricks Sql

· Getting Started with Databricks Sql
· Navigating Databricks SQL
· Unity Catalog on Databricks Sql
· Schemas, Tables and Views on Databricks SQL

M10

Basic SQL on Databricks Sql

· Ingesting Data for Databricks Sql
· Ingesting Data
· Joins
· Delta Commands in Databricks Sql

M11

Presenting Data Visually

· Data Visualization
· Data Visualizations on Databricks Sql
· Dashboards on Databricks Sql
· Notifying Stakeholders

M12

Apache Spark Programming – Dataframes

· Databricks platform
· Databricks Ecosystem
· Spark Sql
· Dataframes
· SparkSession
· Reader and writer
· Data Sources
· Dataframe and column
· Column and Expression
· Transformation ACtions and Rows

M13

Apache Spark Programming – Transformations

· Aggregation
· Aggregation Functions
· Datetimes
· Dates and Timestamps
· Complex Types
· Complex Types
· Additional Functions
· UDFS
· UDFs Vectorized Functions

M14

Apache Spark Programming – Spark Internals

· Spark Architecture
· Spark Cluster, Spark Execution
· Shuffling and Caching
· Query Optimization
· Partitioning

M15

Apache Spark Programming – Structured Streaming

· Apache Spark Programing
· Streaming Concepts

Każdy moduł modyfikujemy pod Twój stack i kontekst. Powyższe to punkt wyjścia — nie sztywna agenda.

Jak pracujemy

Od briefu do retro w 30 dniach.

Brief i diagnoza

Rozmowa z liderem zespołu + krótka ankieta dla uczestników. Określamy cele, gap, kontekst.

Modyfikacja programu

Dostosowujemy moduły, case studies i przykłady kodu pod Twój stack. Akceptacja w 5 dni.

Warsztat

Sesje z trenerem, hands-on, code review. Mentor dostępny też pomiędzy sesjami.

Retro + raport

Raport z efektami dla zespołu i lidera. 30 dni konsultacji w cenie.

Zapytanie

Wyślij brief. Odezwiemy się w 1 dzień.

Po krótkim briefie przygotujemy program i wycenę. Bez zobowiązań — to tylko punkt wyjścia do rozmowy.

✓Wycena w 48h od briefu

✓Pierwsza sesja w 30 dni

✓Pilotaż przed pełną decyzją

✓Faktura VAT, możliwość płatności w transzach

Inne programy dla zespołów

Zobacz wszystkie →

AI & Data

AI dla analityków: od danych do decyzji

Praktyczne warsztaty z AI i analityki danych — na realnych przypadkach Twojego zespołu.

16h / 2 dni →

AI & Data

AI jako narzędzie wspierające modernizację aplikacji

Praktyczne warsztaty z AI i analityki danych — na realnych przypadkach Twojego zespołu.

3 godziny →

AI & Data

AI szkolenie ogólne

Praktyczne warsztaty z AI i analityki danych — na realnych przypadkach Twojego zespołu.

AI & Data →

Szkolenie Azure Databricks

Idealny dla zespołów, które…

Praktyczne warsztaty z AI i analityki danych — na realnych przypadkach Twojego zespołu.

Co konkretnie robimy

Od briefu do retro w 30 dniach.

Brief i diagnoza

Modyfikacja programu

Warsztat

Retro + raport

Wyślij brief. Odezwiemy się w 1 dzień.

Dziękujemy!

Inne programy dla zespołów

AI dla analityków: od danych do decyzji

AI jako narzędzie wspierające modernizację aplikacji

AI szkolenie ogólne