Optimizing Apache Spark Applications

Dauer

Optimizing Apache Spark Applications

ExperTeach GmbH
Logo von ExperTeach GmbH
Bewertung: starstarstarstarstar_border 8,0 Bildungsangebote von ExperTeach GmbH haben eine durchschnittliche Bewertung von 8,0 (aus 38 Bewertungen)

Tipp: Haben Sie Fragen? Für weitere Details einfach auf "Kostenlose Informationen" klicken.

Startdaten und Startorte
Es gibt keine bekannten Startdaten für dieses Produkt.

Beschreibung

Dieser praxisorientierte Schulungskurs vermittelt die wichtigsten Konzepte und das Fachwissen, das Entwickler benötigen, um die Leistung ihrer Apache Spark-Anwendungen zu optimieren. Während des Kurses lernen Sie, wie Sie häufige Ursachen für schlechte Leistung in Spark-Anwendungen identifizieren, Techniken zu deren Vermeidung oder Lösung sowie Best Practices für die Überwachung von Spark-Anwendungen.

Der Kurs stellt die Architektur und die Konzepte hinter Apache Spark und der zugrunde liegenden Datenplattform vor und baut dann auf diesem grundlegenden Verständnis auf, indem Ihnen beigebracht wird, wie sie Spark-Anwendungscode optimieren. Das Kursformat konzentriert sich auf von einem Traine…

Gesamte Beschreibung lesen

Frequently asked questions

Es wurden noch keine FAQ hinterlegt. Falls Sie Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice. Wir helfen gerne weiter!

Noch nicht den perfekten Kurs gefunden? Verwandte Themen: Apache Spark, Apache Webserver, Data Mining, Hadoop und RabbitMQ.

Dieser praxisorientierte Schulungskurs vermittelt die wichtigsten Konzepte und das Fachwissen, das Entwickler benötigen, um die Leistung ihrer Apache Spark-Anwendungen zu optimieren. Während des Kurses lernen Sie, wie Sie häufige Ursachen für schlechte Leistung in Spark-Anwendungen identifizieren, Techniken zu deren Vermeidung oder Lösung sowie Best Practices für die Überwachung von Spark-Anwendungen.

Der Kurs stellt die Architektur und die Konzepte hinter Apache Spark und der zugrunde liegenden Datenplattform vor und baut dann auf diesem grundlegenden Verständnis auf, indem Ihnen beigebracht wird, wie sie Spark-Anwendungscode optimieren. Das Kursformat konzentriert sich auf von einem Trainer geleitete Demonstrationen, die sowohl Leistungsprobleme als auch die Techniken veranschaulichen, die diese beheben, gefolgt von praktischen Übungen, die Ihnen die Möglichkeit geben, das Gelernte in einer interaktiven Notebook-Umgebung zu üben.

Wenn Sie diesen Kurs erfolgreich abgeschlossen haben, werden Sie zu folgendem in der Lage sein:

  • Verstehen der Architektur und die Auftragsausführung von Apache Spark und wie Techniken wie Lazy Execution und Pipelining die Laufzeitleistung verbessern können
  • Bewerten der Leistungsmerkmale von Kerndatenstrukturen wie RDD und DataFrames
  • Auswählen der Dateiformate, die die beste Leistung für Ihre Anwendung bieten
  • Identifizieren und Beheben von Performance-Problemen, die durch Datenverzerrung verursacht werden
  • Verwenden von Partitionierungs-, Bucketing- und Join-Optimierungen, um die SparkSQL-Leistung zu verbessern
  • Verstehen des Leistungsaufwands von Python-basierten RDDs, DataFrames und benutzerdefinierten Funktionen
  • Nutzen von Vorteilen des Cachings für eine bessere Anwendungsleistung
  • Verstehen, wie die Catalyst- und Tungsten-Optimierer funktionieren
  • Erfahren, wie Workload XM bei der Fehlerbehebung und proaktiven Überwachung der Leistung von Spark-Anwendungen helfen kann
  • Erfahren, wie die Engine für die adaptive Abfrageausführung die Leistung verbessert
Kursinhalt
  • Spark Architecture
  • Data Sources and Formats
  • Inferring Schemas
  • Dealing With Skewed Data
  • Catalyst and Tungsten Overview
  • Mitigating Spark Shuffles
  • Partitioned and Bucketed Tables
  • Improving Join Performance
  • Pyspark Overhead and UDFs
  • Caching Data for Reuse
  • Workload XM (WXM) Introduction
  • What's New in Spark 3.0?
Zielgruppe

Dieser Kurs richtet sich an Softwareentwickler, Ingenieure und Datenwissenschaftler, die Erfahrung mit der Entwicklung von Spark-Anwendungen haben und lernen möchten, wie sie die Leistung ihres Codes verbessern können. Dies ist keine Einführung in Spark.

Voraussetzungen

Spark-Beispiele und praktische Übungen werden in Python präsentiert und die Fähigkeit, in dieser Sprache zu programmieren, ist erforderlich. Grundlegende Vertrautheit mit der Linux-Befehlszeile wird vorausgesetzt. Grundlegende Kenntnisse von SQL sind hilfreich.

Hierzu empfehlen wir Ihnen auch unsere Trainings im Bereich Programmiersprachen und Softwareentwicklung sowie Linux.

Kursziel

In diesem Kurs lernen Sie, wie Sie die Leistung von Apache Spark-Anwendungen durch effektives Tuning und Optimierung steigern können. Sie erwerben Fähigkeiten zur Identifizierung und Behebung von Performance-Engpässen sowie zur effizienten Ressourcennutzung. 

Werden Sie über neue Bewertungen benachrichtigt
Es wurden noch keine Bewertungen geschrieben.
Schreiben Sie eine Bewertung
Haben Sie Erfahrung mit diesem Training? Schreiben Sie jetzt eine Bewertung und helfen Sie Anderen dabei die richtige Weiterbildung zu wählen. Als Dankeschön spenden wir € 1,00 an Stiftung Edukans.

Es wurden noch keine FAQ hinterlegt. Falls Sie Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice. Wir helfen gerne weiter!

Bitte füllen Sie das Formular so vollständig wie möglich aus

(optional)
(optional)
(optional)
(optional)
(optional)

Anmeldung für Newsletter

Damit Ihnen per E-Mail oder Telefon weitergeholfen werden kann, speichern wir Ihre Daten und teilen sie ggf. mit ExperTeach GmbH. Mehr Informationen dazu finden Sie in unseren Datenschutzbestimmungen.