Preparing with Cloudera Data Engineering and Apache Spark – Englisch
Dieser praxisorientierte Schulungskurs vermittelt die wichtigsten Konzepte und Kenntnisse, die Sie als Entwickler benötigen, um Apache Spark zu verwenden, um leistungsstarke, parallele Anwendungen auf der Cloudera-Plattform zu entwickeln.
Praktische Übungen ermöglichen es Ihnen, das Schreiben von Spark-Anwendungen zu üben, die in die Kernkomponenten von Cloudera integriert werden können. Sie lernen, wie sie Spark SQL verwenden, um strukturierte Daten abzufragen, wie sie Hive-Funktionen verwenden, um Daten zu erfassen und zu denormalisieren, und wie sie mit "Big Data" arbeiten, die in einem verteilten Dateisystem gespeichert sind.
Nach der Teilnahme an diesem Kurs sind Sie darauf vorbereitet,…
Es wurden noch keine FAQ hinterlegt. Falls Sie Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice. Wir helfen gerne weiter!
Dieser praxisorientierte Schulungskurs vermittelt die wichtigsten Konzepte und Kenntnisse, die Sie als Entwickler benötigen, um Apache Spark zu verwenden, um leistungsstarke, parallele Anwendungen auf der Cloudera-Plattform zu entwickeln.
Praktische Übungen ermöglichen es Ihnen, das Schreiben von Spark-Anwendungen zu üben, die in die Kernkomponenten von Cloudera integriert werden können. Sie lernen, wie sie Spark SQL verwenden, um strukturierte Daten abzufragen, wie sie Hive-Funktionen verwenden, um Daten zu erfassen und zu denormalisieren, und wie sie mit "Big Data" arbeiten, die in einem verteilten Dateisystem gespeichert sind.
Nach der Teilnahme an diesem Kurs sind Sie darauf vorbereitet, sich realen Herausforderungen zu stellen und Anwendungen zu entwickeln, um schnellere Entscheidungen, bessere Entscheidungen und interaktive Analysen durchzuführen, die auf eine Vielzahl von Anwendungsfällen, Architekturen und Branchen angewendet werden.
Kursinhalt- HDFS Introduction
- YARN Introduction
- Working with RDDs
- Working with DataFrames
- Introduction to Apache Hive
- Working with Apache Hive
- Hive and Spark Integration
- Distributed Processing Challenges
- Spark Distributed Processing
- Spark Distributed Persistence
- Data Engineering Service
Dieser Kurs ist für Entwickler und Dateningenieure gedacht.
VoraussetzungenEs wird erwartet, dass Sie über grundlegende Linux-Kenntnisse und Grundkenntnisse der Programmiersprachen Python oder Scala verfügen. Grundkenntnisse in SQL sind hilfreich. Vorkenntnisse in Spark sind nicht erforderlich.
Hierzu empfehlen wir Ihnen auch unsere Trainings im Bereich Programmiersprachen und Softwareentwicklung sowie Linux.
KurszielSie lernen, Daten in einem Cloudera-Cluster zu verteilen, zu speichern und zu verarbeiten. Zudem schreiben, konfigurieren und stellen Sie Apache Spark-Anwendungen bereit. Mit Spark-Interpreter, Spark SQL, DataFrames und Hive-Tabellen analysieren Sie verteilte Daten und setzen Ihre Anwendungen im Data Engineering Service produktiv ein.
Es wurden noch keine FAQ hinterlegt. Falls Sie Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice. Wir helfen gerne weiter!
