PySpark - Big Data Analytics mit Apache Spark und Python
computer Online: online Training 26. Mär 2026 bis 27. Mär 2026Details ansehen event 26. März 2026, 09:00-17:00, online Training, Seminar 54450 |
computer Online: online Training 28. Mai 2026 bis 29. Mai 2026Details ansehen event 28. Mai 2026, 09:00-17:00, online Training, Seminar 54450 |
computer Online: online Training 16. Jul 2026 bis 17. Jul 2026Details ansehen event 16. Juli 2026, 09:00-17:00, online Training, Seminar 54450 |
placeFrankfurt am Main 21. Sep 2026 bis 22. Sep 2026Details ansehen event 21. September 2026, 09:00-17:00, Frankfurt am Main, Seminar 54450 |
computer Online: online Training 21. Sep 2026 bis 22. Sep 2026Details ansehen event 21. September 2026, 09:00-17:00, online Training, Seminar 54450 |
computer Online: online Training 16. Nov 2026 bis 17. Nov 2026Details ansehen event 16. November 2026, 09:00-17:00, online Training, Seminar 54450 |
Einführung in Apache Spark Grundlagen:
- Verortung und Kontext des Frameworks (Vergleich mit Pyspark, Hadoop und Kubernetes)
- Grundlegende Prinzipien der verteilten Datenverarbeitung durch Apache Spark
Erste Schritte in der PySpark-Welt:
- Essenzielle DataFrames-Grundlagen
- Einbindung von JSON- und CSV-Daten
- Einfache Datentransformationen (Projektionen, Filterung, grundlegende Funktionen...)
Weitere Datentransformationen erkunden:
- Gruppierte Aggregationen verstehen
- Sortierung von Daten
- Joins von Datensätzen
UDF - User Defined Functions verwenden:
- Effiziente Nutzung von Pandas UDFs in PySpark
- Einsatzbereiche von UDFs
Datenhaltung und Speicherung:
- Überblick über kompatible Dateiformate
Gru…
Es wurden noch keine FAQ hinterlegt. Falls Sie Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice. Wir helfen gerne weiter!
Einführung in Apache Spark Grundlagen:
- Verortung und Kontext des Frameworks (Vergleich mit Pyspark, Hadoop und Kubernetes)
- Grundlegende Prinzipien der verteilten Datenverarbeitung durch Apache Spark
Erste Schritte in der PySpark-Welt:
- Essenzielle DataFrames-Grundlagen
- Einbindung von JSON- und CSV-Daten
- Einfache Datentransformationen (Projektionen, Filterung, grundlegende Funktionen...)
Weitere Datentransformationen erkunden:
- Gruppierte Aggregationen verstehen
- Sortierung von Daten
- Joins von Datensätzen
UDF - User Defined Functions verwenden:
- Effiziente Nutzung von Pandas UDFs in PySpark
- Einsatzbereiche von UDFs
Datenhaltung und Speicherung:
- Überblick über kompatible Dateiformate
Grundlagen des Maschinellen Lernens:
- Modelltraining und -entwicklung
- Einführung in Regressionsmodelle
- Verwendung von Trainings- und Validierungsdaten
- Bewertungsmetriken für Modellleistungen
- Praktische Übung mit dem Datensatz des NYC Taxis
Vorbereitung der Daten:
- Formatumwandlungen für beschleunigte Verarbeitung
- Integration diverser Datenquellen
Datenexploration:
- Anfängliche einfache Datenanalysen und -visualisierungen
- Datenreduktion durch Aggregation
Modelltraining:
- Maschinelles Lernen mit PySpark umsetzen
Verfeinerung des Modells:
- Bewertung des Modells mittels geeigneter Metriken
- Optimierung durch Integration neuer Eigenschaften
- Austausch von Ideen zur weiteren Verbesserung
Cegos Integrata GmbH – Ihr Business Partner für Performance Learning
Seit 60 Jahren unterstützen wir Unternehmen jeder Größenordnung und Einzelpersonen mit praxisbezogenen Weiterbildungen für Fach- und Führungskräfte in der Mitarbeiterentwicklung.
Wir begleiten sie von der Konzeption bis zur Umsetzung eines Qualifizierungskonzepts und bilden Fach- und Führungskräfte mit modernen Methoden und innovativen Lernformaten weiter, die als Live Online Training, Hybridformat oder als Präsenzveranstaltung durchgeführt werden. Unsere passgenauen Lernangebote schaffen ein einzigartiges Lernerlebnis. Dabei legen wir großen Wert auf einen nachhaltigen Wissenstransfer, der einen nahtlosen Übergang in die Arbeitspraxis gewährleistet.
Mit über 1.000 Seminarthemen aus allen betrieblichen Bereichen decken wir ein umfangreiches Leistungsspektrum ab und sorgen mit einem Partnernetzwerk von mehr als 750 erfahrenen Trainern, Coaches und Consultants für einen nachhaltigen Wissenstransfer.
Als Unternehmen der Cegos Group, des internationalen Marktführers für die berufliche Weiterbildung, investieren wir kontinuierlich in Lerninnovationen, die unsere Kunden befähigt, mit der Digitalisierung und Transformation der Arbeitswelt Schritt zu halten. Rund 1.500 weltweite Mitarbeiter:innen tragen dazu bei, mit Performance Learning schlüsselfertige und individualisierbare Lösungen anzubieten, die in nationalen und internationalen Kundenprojekten jeder Größenordnung zum Einsatz kommen.
Es wurden noch keine FAQ hinterlegt. Falls Sie Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice. Wir helfen gerne weiter!
