PySpark - Big Data Analytics mit Apache Spark und Python

Dauer
Ausführung
Vor Ort, Online
Startdatum und Ort

PySpark - Big Data Analytics mit Apache Spark und Python

Cegos Integrata GmbH
Logo von Cegos Integrata GmbH
Bewertung: starstarstarstarstar_border 8,2 Bildungsangebote von Cegos Integrata GmbH haben eine durchschnittliche Bewertung von 8,2 (aus 53 Bewertungen)

Tipp: Haben Sie Fragen? Für weitere Details einfach auf "Kostenlose Informationen" klicken.

Startdaten und Startorte
computer Online: online Training
26. Mär 2026 bis 27. Mär 2026
Details ansehen
event 26. März 2026, 09:00-17:00, online Training, Seminar 54450
computer Online: online Training
28. Mai 2026 bis 29. Mai 2026
Details ansehen
event 28. Mai 2026, 09:00-17:00, online Training, Seminar 54450
computer Online: online Training
16. Jul 2026 bis 17. Jul 2026
Details ansehen
event 16. Juli 2026, 09:00-17:00, online Training, Seminar 54450
placeFrankfurt am Main
21. Sep 2026 bis 22. Sep 2026
Details ansehen
event 21. September 2026, 09:00-17:00, Frankfurt am Main, Seminar 54450
computer Online: online Training
21. Sep 2026 bis 22. Sep 2026
Details ansehen
event 21. September 2026, 09:00-17:00, online Training, Seminar 54450
computer Online: online Training
16. Nov 2026 bis 17. Nov 2026
Details ansehen
event 16. November 2026, 09:00-17:00, online Training, Seminar 54450
Beschreibung

Einführung in Apache Spark Grundlagen:

  • Verortung und Kontext des Frameworks (Vergleich mit Pyspark, Hadoop und Kubernetes)
  • Grundlegende Prinzipien der verteilten Datenverarbeitung durch Apache Spark

Erste Schritte in der PySpark-Welt:

  • Essenzielle DataFrames-Grundlagen
  • Einbindung von JSON- und CSV-Daten
  • Einfache Datentransformationen (Projektionen, Filterung, grundlegende Funktionen...)

Weitere Datentransformationen erkunden:

  • Gruppierte Aggregationen verstehen
  • Sortierung von Daten
  • Joins von Datensätzen

UDF - User Defined Functions verwenden:

  • Effiziente Nutzung von Pandas UDFs in PySpark
  • Einsatzbereiche von UDFs

Datenhaltung und Speicherung:

  • Überblick über kompatible Dateiformate

Gru…

Gesamte Beschreibung lesen

Frequently asked questions

Es wurden noch keine FAQ hinterlegt. Falls Sie Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice. Wir helfen gerne weiter!

Noch nicht den perfekten Kurs gefunden? Verwandte Themen: Apache Spark, Big Data, Apache Webserver, Data Analytics und Python.

Einführung in Apache Spark Grundlagen:

  • Verortung und Kontext des Frameworks (Vergleich mit Pyspark, Hadoop und Kubernetes)
  • Grundlegende Prinzipien der verteilten Datenverarbeitung durch Apache Spark

Erste Schritte in der PySpark-Welt:

  • Essenzielle DataFrames-Grundlagen
  • Einbindung von JSON- und CSV-Daten
  • Einfache Datentransformationen (Projektionen, Filterung, grundlegende Funktionen...)

Weitere Datentransformationen erkunden:

  • Gruppierte Aggregationen verstehen
  • Sortierung von Daten
  • Joins von Datensätzen

UDF - User Defined Functions verwenden:

  • Effiziente Nutzung von Pandas UDFs in PySpark
  • Einsatzbereiche von UDFs

Datenhaltung und Speicherung:

  • Überblick über kompatible Dateiformate

Grundlagen des Maschinellen Lernens:

  • Modelltraining und -entwicklung
  • Einführung in Regressionsmodelle
  • Verwendung von Trainings- und Validierungsdaten
  • Bewertungsmetriken für Modellleistungen
  • Praktische Übung mit dem Datensatz des NYC Taxis

Vorbereitung der Daten:

  • Formatumwandlungen für beschleunigte Verarbeitung
  • Integration diverser Datenquellen

Datenexploration:

  • Anfängliche einfache Datenanalysen und -visualisierungen
  • Datenreduktion durch Aggregation

Modelltraining:

  • Maschinelles Lernen mit PySpark umsetzen

Verfeinerung des Modells:

  • Bewertung des Modells mittels geeigneter Metriken
  • Optimierung durch Integration neuer Eigenschaften
  • Austausch von Ideen zur weiteren Verbesserung
  •  

Cegos Integrata GmbH – Ihr Business Partner für Performance Learning

Seit 60 Jahren unterstützen wir Unternehmen jeder Größenordnung und Einzelpersonen mit praxisbezogenen Weiterbildungen für Fach- und Führungskräfte in der Mitarbeiterentwicklung.

Wir begleiten sie von der Konzeption bis zur Umsetzung eines Qualifizierungskonzepts und bilden Fach- und Führungskräfte mit modernen Methoden und innovativen Lernformaten weiter, die als Live Online Training, Hybridformat oder als Präsenzveranstaltung durchgeführt werden. Unsere passgenauen Lernangebote schaffen ein einzigartiges Lernerlebnis. Dabei legen wir großen Wert auf einen nachhaltigen Wissenstransfer, der einen nahtlosen Übergang in die Arbeitspraxis gewährleistet.

Mit über 1.000 Seminarthemen aus allen betrieblichen Bereichen decken wir ein umfangreiches Leistungsspektrum ab und sorgen mit einem Partnernetzwerk von mehr als 750 erfahrenen Trainern, Coaches und Consultants für einen nachhaltigen Wissenstransfer.

Als Unternehmen der Cegos Group, des internationalen Marktführers für die berufliche Weiterbildung, investieren wir kontinuierlich in Lerninnovationen, die unsere Kunden befähigt, mit der Digitalisierung und Transformation der Arbeitswelt Schritt zu halten. Rund 1.500 weltweite Mitarbeiter:innen tragen dazu bei, mit Performance Learning schlüsselfertige und individualisierbare Lösungen anzubieten, die in nationalen und internationalen Kundenprojekten jeder Größenordnung zum Einsatz kommen.

Werden Sie über neue Bewertungen benachrichtigt
Es wurden noch keine Bewertungen geschrieben.
Schreiben Sie eine Bewertung
Haben Sie Erfahrung mit diesem Kurs? Schreiben Sie jetzt eine Bewertung und helfen Sie Anderen dabei die richtige Weiterbildung zu wählen. Als Dankeschön spenden wir € 1,00 an Stiftung Edukans.

Es wurden noch keine FAQ hinterlegt. Falls Sie Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice. Wir helfen gerne weiter!

Bitte füllen Sie das Formular so vollständig wie möglich aus

(optional)
(optional)
(optional)
(optional)
(optional)
(optional)
(optional)

Haben Sie noch Fragen?

(optional)

Anmeldung für Newsletter

Damit Ihnen per E-Mail oder Telefon weitergeholfen werden kann, speichern wir Ihre Daten.
Mehr Informationen dazu finden Sie in unseren Datenschutzbestimmungen.