Apache Spark 3 Grundlagen

Dauer
Ausführung
Vor Ort, Online
Startdatum und Ort

Apache Spark 3 Grundlagen

GFU Cyrus AG
Logo von GFU Cyrus AG
Bewertung: starstarstarstar_halfstar_border 7,2 Bildungsangebote von GFU Cyrus AG haben eine durchschnittliche Bewertung von 7,2 (aus 9 Bewertungen)

Tipp: Haben Sie Fragen? Für weitere Details einfach auf "Kostenlose Informationen" klicken.

Startdaten und Startorte

placeKöln
4. Jul 2024 bis 5. Jul 2024
computer Online: Zoom
4. Jul 2024 bis 5. Jul 2024
placeKöln
10. Okt 2024 bis 11. Okt 2024
computer Online: Zoom
10. Okt 2024 bis 11. Okt 2024

Beschreibung

Schulungen der Extraklasse ✔ Durchführungsgarantie ✔ Trainer aus der Praxis ✔ Kostenfreies Storno ✔ 3=2 Kostenfreie Teilnahme für den Dritten ✔ Persönliche Lernumgebung ✔ Kleine Lerngruppen

Seminarziel

Nach diesem Seminar kennen sie die Apache Spark Architektur und wissen, welche Lösungen mit Spark in einem Big Data Umfeld entwickelt werden können. Nutzen Sie die Spark Streamingfähigkeiten und die Möglichkeiten von Machine Learning für Ihre Data Science-Anwendungen.

Inhalt

  • Einführung in Spark - Erste Schritte
    • Was ist Spark und was ist sein Zweck?
    • Komponenten des Spark-Unified-Stacks
    • Stabiler verteilter Datensatz (RDD)
    • Herunterladen und Installieren von Spark Standalone
    • Überblick über Scala und Python
    • Starten und Verwenden der Scala- und Python-Shell von Spark
  • Belastbarer verteilter Datensatz und DataFrames
    • Verstehen, wie man parallelisierte Sammlungen und externe Datensä…

Gesamte Beschreibung lesen

Frequently asked questions

Es wurden noch keine FAQ hinterlegt. Falls Sie Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice. Wir helfen gerne weiter!

Noch nicht den perfekten Kurs gefunden? Verwandte Themen: Apache Spark, Scala, Apache Webserver, Data Science und Data Mining.

Schulungen der Extraklasse ✔ Durchführungsgarantie ✔ Trainer aus der Praxis ✔ Kostenfreies Storno ✔ 3=2 Kostenfreie Teilnahme für den Dritten ✔ Persönliche Lernumgebung ✔ Kleine Lerngruppen

Seminarziel

Nach diesem Seminar kennen sie die Apache Spark Architektur und wissen, welche Lösungen mit Spark in einem Big Data Umfeld entwickelt werden können. Nutzen Sie die Spark Streamingfähigkeiten und die Möglichkeiten von Machine Learning für Ihre Data Science-Anwendungen.

Inhalt

  • Einführung in Spark - Erste Schritte
    • Was ist Spark und was ist sein Zweck?
    • Komponenten des Spark-Unified-Stacks
    • Stabiler verteilter Datensatz (RDD)
    • Herunterladen und Installieren von Spark Standalone
    • Überblick über Scala und Python
    • Starten und Verwenden der Scala- und Python-Shell von Spark
  • Belastbarer verteilter Datensatz und DataFrames
    • Verstehen, wie man parallelisierte Sammlungen und externe Datensätze erstellt
    • Arbeiten mit RDD-Operationen (Resilient Distributed Dataset)
    • Gemeinsame Variablen und Schlüssel-Werte-Paare verwenden
  • Spark-Anwendungsprogrammierung
    • Verstehen des Zwecks und der Verwendung des SparkContextes
    • Initialisierung von Spark mit den verschiedenen Programmiersprachen
    • Beschreiben und Ausführen einiger Spark-Beispiele
    • Übergabe von Funktionen an Spark
    • Erstellen und Ausführen einer Standalone-Anwendung von Spark
    • Übertragen von Anwendungen an den Cluster
  • Spark Streaming
    • Einführung von Spark Streaming
    • Architektur von Spark Streaming
    • Verarbeitung verteilter Protokolldateien in Echtzeit
    • Diskretisierte Ströme RDD
    • Anwendung von Transformationen und Aktionen auf Streaming-Daten
    • Integration mit Flume und Kafka
    • Integration mit Cassandra
    • Überwachung von Streaming-Aufträgen
  • Spark-SQL
    • Einführung in Apache Spark SQL
    • Der SQL-Kontext
    • Importieren und Speichern von Daten
    • Verarbeitung von Textdateien, JSON und Parquet-Dateien
    • DataFrames
    • Benutzerdefinierte Funktionen
    • Die Verwendung von Hive
    • Lokaler Hive-Metastore-Server
  • Spark MLLib
    • Einführung in das maschinelle Lernen
    • Arten des maschinellen Lernens
    • Einführung in Apache Spark MLLib-Algorithmen
    • Datentypen des maschinellen Lernens und die Arbeit mit MLLib
    • Regressions- und Klassifikationsalgorithmen
    • Entscheidungsbäume in der Tiefe
    • Klassifizierung mit SVM, Naive Bayes
    • Clustering mit K-Means
    • Aufbau des Spark-Servers

Werden Sie über neue Bewertungen benachrichtigt

Es wurden noch keine Bewertungen geschrieben.

Schreiben Sie eine Bewertung

Haben Sie Erfahrung mit diesem Kurs? Schreiben Sie jetzt eine Bewertung und helfen Sie Anderen dabei die richtige Weiterbildung zu wählen. Als Dankeschön spenden wir € 1,00 an Stiftung Edukans.

Es wurden noch keine FAQ hinterlegt. Falls Sie Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice. Wir helfen gerne weiter!

Bitte füllen Sie das Formular so vollständig wie möglich aus

(optional)
(optional)
(optional)
(optional)
(optional)
(optional)
(optional)

Haben Sie noch Fragen?

(optional)

Anmeldung für Newsletter

Damit Ihnen per E-Mail oder Telefon weitergeholfen werden kann, speichern wir Ihre Daten.
Mehr Informationen dazu finden Sie in unseren Datenschutzbestimmungen.