Strona główna / Szkolenia / Databricks – analiza i przetwarzanie danych w chmurze
Databricks to platforma analityczna oparta na Apache Spark, działająca w środowiskach chmurowych takich jak AWS i Azure. Szkolenie obejmuje architekturę platformy, zarządzanie klastrami oraz interaktywne środowisko pracy w notebookach.
Uczestnicy uczą się pracy z notebookami w językach Python, SQL i Scala. Omawiane są podstawy Apache Spark, RDD, DataFrame oraz Spark SQL, a także eksploracja i transformacja danych z różnych źródeł.
Szkolenie obejmuje import danych z plików CSV, JSON, baz danych oraz chmury, operacje czyszczenia danych, łączenie zbiorów, agregacje oraz grupowanie danych. Uczestnicy poznają zaawansowane transformacje w Spark SQL i DataFrames.
Delta Lake rozszerza możliwości Spark o wersjonowanie danych, operacje CRUD oraz schema enforcement. Uczestnicy uczą się zarządzać jakością danych i budować niezawodne pipeline’y ETL w środowisku Big Data.
Kurs obejmuje harmonogramowanie zadań, automatyzację procesów ETL, monitorowanie pracy klastra oraz optymalizację zapytań. Omawiana jest również integracja z narzędziami BI takimi jak Power BI i Tableau.
Tak. Program zawiera studia przypadków oraz praktyczne scenariusze analityczne z obszaru Big Data, umożliwiające zastosowanie poznanych technik w realnych projektach biznesowych.
BPMN 2.0 – modelowanie procesów biznesowych
Analiza biznesowa w Agile i Scrum
Analiza biznesowa dla Product Ownerów i Managerów
Databricks – analiza i przetwarzanie danych w chmurze
ArcGIS – zaawansowana analiza przestrzenna
Nie widzisz szkolenia, którego szukasz?
Żadna tematyka nas nie ogranicza – jesteśmy otwarci i stworzymy szkolenie idealnie dopasowane do Twoich potrzeb.
Przykładowe szkolenia: Cisco, Analiza biznesowa, BPMN, UML, PowerBi, Elasticsearch, Sztuczna inteligencja, Python, C++, C#, Selenium, Jenkins, Szkolenia miękkie, UX, Social Media i Marketing, Sprzedaż, Zarządzanie projektami, Design Thinking, Linux, Embedded, Postman, Ms Excel, Adobe, Docker, Kubernetes, Terraform, Azure, SAP, UiPath, Machine Learning.