Building Batch Data Analytics Solutions on AWS
In diesem Kurs lernen Sie, wie Sie Batch-Datenanalyselösungen mit Amazon EMR erstellen, einem Apache Spark- und Apache Hadoop-Managed-Service der Enterprise-Klasse. Sie erfahren, wie sich Amazon EMR in Open-Source-Projekte wie Hive, Hue und HBase sowie in AWS-Services wie AWS Glue und AWS Lake Formation integrieren lässt.
Der Kurs befasst sich mit Datenerfassung, Erfassung, Katalogisierung, Speicherung und Verarbeitung von Komponenten im Kontext von Spark und Hadoop. Sie lernen, EMR-Notebooks zu verwenden, um sowohl Analyse- als auch maschinelle Lernworkloads zu unterstützen. Sie lernen auch, Best Practices für Sicherheit, Leistung und Kostenmanagement auf den Betrieb von Amazon EMR anzuwend…
Es wurden noch keine FAQ hinterlegt. Falls Sie Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice. Wir helfen gerne weiter!
In diesem Kurs lernen Sie, wie Sie Batch-Datenanalyselösungen mit Amazon EMR erstellen, einem Apache Spark- und Apache Hadoop-Managed-Service der Enterprise-Klasse. Sie erfahren, wie sich Amazon EMR in Open-Source-Projekte wie Hive, Hue und HBase sowie in AWS-Services wie AWS Glue und AWS Lake Formation integrieren lässt.
Der Kurs befasst sich mit Datenerfassung, Erfassung, Katalogisierung, Speicherung und Verarbeitung von Komponenten im Kontext von Spark und Hadoop. Sie lernen, EMR-Notebooks zu verwenden, um sowohl Analyse- als auch maschinelle Lernworkloads zu unterstützen. Sie lernen auch, Best Practices für Sicherheit, Leistung und Kostenmanagement auf den Betrieb von Amazon EMR anzuwenden.
Dieser Kurs umfasst Präsentationen, interaktive Demos, Übungslabore, Diskussionen und Klassenübungen.
KursinhaltModule A: Overview of Data Analytics and the Data Pipeline
Module 1: Introduction to Amazon EMR
Module 2: Data Analytics Pipeline Using Amazon EMR: Ingestion and
Storage
Module 3: High-Performance Batch Data Analytics Using Apache Spark
on Amazon EMR
Module 4: Processing and Analyzing Batch Data with Amazon EMR and
Hive
Module 5: Serverless Data Processing
Module 6: Security and Monitoring of Amazon EMR Clusters
Module 7: Designing Batch Data Analytics Solutions
Module B: Developing Modern Data Architectures on AWS
Auf die Labs haben Sie nach dem Kurs noch weitere 4 Wochen Zugriff. So können Sie Übungen wiederholen oder individuell vertiefen.
ZielgruppeDieser Kurs richtet sich an:
• Data Platform Engineers
• Architects und Operators, die Datenanalyse-Pipelines erstellen
und verwalten
Personen mit mindestens einem Jahr Erfahrung in der Verwaltung von Open-Source-Datenframeworks wie Apache Spark oder Apache Hadoop werden von diesem Kurs profitieren.
VoraussetzungenWir empfehlen den AWS Hadoop Fundamentals-Kurs für diejenigen, die eine Auffrischung zu Apache Hadoop benötigen.
Wir empfehlen den vorherigen Kursbesuch von:
- AWS Technical Essentials oder Architecting on AWS
- Building Data Lakes on AWS oder Getting Started with AWS Glue
Es wurden noch keine FAQ hinterlegt. Falls Sie Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice. Wir helfen gerne weiter!
