Data Science met Python en Spark

Dauer
Trainer
Jeroen Janssens
Logo von Data Science Workshops B.V.
Bewertung: starstarstarstarstar 9,5 Bildungsangebote von Data Science Workshops B.V. haben eine durchschnittliche Bewertung von 9,5 (aus 50 Bewertungen)
Best provider of the NetherlandsGewinner der Preisverleihung "Bester Bildungsanbieter der Niederlande 2020": #2 BovnlWinnerType. overall trainer. Read here about these awards.

Tipp: Haben Sie Fragen? Für weitere Details einfach auf "Kostenlose Informationen" klicken.

9,3
Durchschnittliche Bewertung für Data Science met Python en Spark
Berechnet aus 7 Bewertungen Alle Bewertungen lesenchevron_right
Mateusz Wiącek
starstarstarstarstar
Mateusz Wiącek
Head of Training
10
Data Science with Python and Spark

"Jeroen delivered this as a 3-day training to Textkernel in May 2019. No doubt -- this is a 10 out of 10! He is very knowledgeable about the subject matter, has great interactive teaching style, great balance between explaining and practising, includes a lot of hand-on exercises and covers all from low-level to high-level APIs help to understand the logic behind it. Very clear, structured explanations. Highly recommended for beginners and advanced!" - 07.12.2020 14:58

"Jeroen delivered this as a 3-day training to Textkernel in May 2019. No doubt -- this is a 10 out of 10! He is very knowledgeable about the … Gesamte Bewertung lesen - 07.12.2020 14:58

Startdaten und Startorte

Es gibt keine bekannten Startdaten für dieses Produkt.

Beschreibung

Introductie

Apache Spark is een open source gedistribueerde engine voor het opvragen en verwerken van data. In deze tweedaagse hands-on workshop leer je hoe je Spark vanuit Python (PySpark) kunt gebruiken om grote hoeveelheden data te verwerken.

Na een overzicht van de Spark architectuur, beginnen we met het manipuleren van Resilient Distributed Datasets (RDD's) om vervolgens de overstap te maken naar Spark DataFrames. Het concept van lazy evaluation wordt in detail besproken en we demonstreren verschillende transformaties en acties die specifiek zijn voor RDD's en DataFrames. Je leert hoe DataFrames kunnen worden gemanipuleerd met behulp van SQL query's.

We laten je zien hoe je supervised m…

Gesamte Beschreibung lesen

Frequently asked questions

Es wurden noch keine Besucherfragen gestellt. Wenn Sie weitere Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice.

Noch nicht den perfekten Kurs gefunden? Verwandte Themen: Data Science Python, Apache Spark, Python, Data Science und Big Data.

Introductie

Apache Spark is een open source gedistribueerde engine voor het opvragen en verwerken van data. In deze tweedaagse hands-on workshop leer je hoe je Spark vanuit Python (PySpark) kunt gebruiken om grote hoeveelheden data te verwerken.

Na een overzicht van de Spark architectuur, beginnen we met het manipuleren van Resilient Distributed Datasets (RDD's) om vervolgens de overstap te maken naar Spark DataFrames. Het concept van lazy evaluation wordt in detail besproken en we demonstreren verschillende transformaties en acties die specifiek zijn voor RDD's en DataFrames. Je leert hoe DataFrames kunnen worden gemanipuleerd met behulp van SQL query's.

We laten je zien hoe je supervised machine learning algoritmen toepast, zoals lineaire regressie, logistische regressie, beslisbomen en random forests. Je leert ook over unsupervised machine learning algoritmen zoals PCA en K-means clustering.

Aan het einde van deze workshop heb je een goed begrip van het verwerken van data met PySpark en begrijp je hoe je Spark's machine learning-bibliotheek kunt gebruiken om verschillende machine learning-modellen te bouwen.

Leerdoelen

  • Leer over Apache Spark, de architectuur en zijn componenten
  • Werken met RDD's en lazy evaluation
  • Maak en interacteer met Spark DataFrames middels Spark SQL
  • Gebruik Spark SQL en DataFrames om gegevens te verwerken met behulp van traditionele SQL-query's
  • Pas verschillende supervised en unsupervised machine learning agoritmen toe
  • Leer meer over feature engineering, klassenonbalans, bias en variance, en kruisvalidatie voor het bouwen van een machine learning model

Deze workshop is voor jou omdat

  • Je werkt regelmatig met data en wilt de hoeveelheid verwerkte data kunnen opschalen
  • Je wilt de methoden begrijpen die specifiek zijn voor Spark voor het manipuleren van data
  • Je wilt leren hoe je machine learning algoritmen kunt toepassen op grote hoeveelheden data

Programma

Dag 1:

  • Inleiding tot Apache Spark
    • Spark installeren
    • Spark fundamentals
    • Spark architectuur
  • Gedistribueerde datasets (RDD's)
    • Gegevens in Spark krijgen
    • Acties
    • Transformaties
  • Spark DataFrames
    • Spark versnellen met DataFrames
    • DataFrames maken
    • Samenwerking met RDD's
    • Werken met de DataFrame API
    • SQL toepassen op Spark DataFrames

Dag 2:

  • ML- en MLLib-pakketten
    • API-overzicht
    • Transformatoren
    • Voorspellers
    • Pijpleidingen
  • Machine learning toepassen
    • Modelselectie
    • Kruisvalidatie
    • Afstemmen
    • Classificatie
    • Regressie
    • Aanbevelingssysteem
  • Volgende stappen

Voorkennis

Er wordt verwacht dat je bekend bent met de volgende Python-syntaxis en -concepten:

  • assignment, arithmetic, boolean expression, tuple unpacking
  • bool, int, float, list, tuple, dict, str, type casting
  • in operator, indexing, slicing
  • if, elif, else, for, while
  • range(), len(), zip()
  • def, (keyword) arguments, default values
  • import, import as, from import ...
  • lambda functions, list comprehension
  • JupyterLab of Jupyter Notebook

Enige ervaring met Pandas en SQL is handig, maar niet vereist.

Voorbereiding

Deelnemers wordt vriendelijk verzocht om voor aanvang van de workshop de volgende zaken te installeren:

  • Docker Desktop voor Windows of voor Mac of voor Ubuntu
  • De Docker image, door uit te voeren: docker pull jupyter/pyspark-notebook

Na aanmelding ontvangt je per e-mail meer gedetailleerde installatie-instructies.

Klanten

Ik heb eerder deze workshop verzorgd voor:

  • KPN ICT Consulting
  • ProRail
  • Textkernel

Recensies

"Our DataLab team enjoyed a three-day PySpark course from Jeroen. Jeroen's approach is personal and professional. I recommend Data Science Workshops to anyone in the field of data science."

--Laurens Koppenol, Lead Data Scientist, ProRail

9,3
Durchschnittliche Bewertung für Data Science met Python en Spark
Berechnet aus 7 Bewertungen
Mateusz Wiącek
starstarstarstarstar
Mateusz Wiącek
Head of Training
10
Data Science with Python and Spark

"Jeroen delivered this as a 3-day training to Textkernel in May 2019. No doubt -- this is a 10 out of 10! He is very knowledgeable about the subject matter, has great interactive teaching style, great balance between explaining and practising, includes a lot of hand-on exercises and covers all from low-level to high-level APIs help to understand the logic behind it. Very clear, structured explanations. Highly recommended for beginners and advanced!" - 07.12.2020 14:58

"Jeroen delivered this as a 3-day training to Textkernel in May 2019. No doubt -- this is a 10 out of 10! He is very knowledgeable about the … Gesamte Bewertung lesen - 07.12.2020 14:58

Davey Witter
starstarstarstarstar_border
Davey Witter
IT Consultant
8
Data Science with Python and Spark

"Zeer enthousiast bij het geven van de workshop. De workshop was gestructureerd opgebouwd. Van eenvoudige materie on een vloeiende overgang naar complexe materie op een simpele manier uitgelegd waardoor deze goed te volgen was.
De combinatie tussen praktijk voorbeelden en theoretische uitleg maakte de materie concreet waardoor de complexe materie goed te volgen was.
De kennis en workshop was up-to-date en maakte de workshop zeer interessant. " - 14.11.2020 08:34

"Zeer enthousiast bij het geven van de workshop. De workshop was gestructureerd opgebouwd. Van eenvoudige materie on een vloeiende overgang n… Gesamte Bewertung lesen - 14.11.2020 08:34

starstarstarstarstar_half
Kellner
9
Data Science met Python en Spark

"I really enjoyed Jeroen's workshop, he explained the Spark basics (RDDs, dataframes,transformers,estimators,etc.) very well and the class included a lot of hands-on exercises (including building ML models). The training was given in-house in our company's office on three separate days." - 06.11.2020 15:41

"I really enjoyed Jeroen's workshop, he explained the Spark basics (RDDs, dataframes,transformers,estimators,etc.) very well and the class in… Gesamte Bewertung lesen - 06.11.2020 15:41

Marissa Helmich
starstarstarstarstar
Marissa Helmich
Senior Data Scientist
10
Data Science met Python en Spark

"Ik heb de cursus Data Science with Python and Spark in 2019 gevolgd bij Jeroen Janssens. Jeroen weet complexe informatie op een begrijpelijke manier over te brengen en combineerd in zijn trainingen theorie met hands-on opdrachten. Op die manier kun je aan het eind van de dag echt nieuwe vaardigheden toepassen. Ook de andere cursussen van datascienceworkshops.com kan ik trouwens ten zeerste aanraden!" - 05.11.2020 10:22

"Ik heb de cursus Data Science with Python and Spark in 2019 gevolgd bij Jeroen Janssens. Jeroen weet complexe informatie op een begrijpelijk… Gesamte Bewertung lesen - 05.11.2020 10:22

starstarstarstarstar_border
Eike Dehling
Research Engineer
8
Data Science met Python en Spark

"Goede professionele training, veel handige dingen geleerd deze workshop. De workshop was wel echt gericht op beginners, mensen die spark nog niet kennen. Er waren veel praktische opdrachten, echt learning by doing. Jeroen heb ik als een prettige trainer ervaren, hij weet ieders aandacht te houden. Aanrader om deze training te volgen, je zal er zeker iets van leren." - 03.11.2020 16:39

"Goede professionele training, veel handige dingen geleerd deze workshop. De workshop was wel echt gericht op beginners, mensen die spark nog… Gesamte Bewertung lesen - 03.11.2020 16:39

starstarstarstarstar
Anne-Marie Dekkers
Data Scientist
10
Data Science met Python en Spark

"Even experienced data scientists need to keep working on their skills and knowledge. For the past half a year, Data Science Workshops has come to our office once a month, to teach us about a variety of topics, ranging from NoSQL to t-SNE. This is a great way to stay fresh and look beyond the tools and techniques that you’re already familiar with." - 31.10.2020 12:53

"Even experienced data scientists need to keep working on their skills and knowledge. For the past half a year, Data Science Workshops has co… Gesamte Bewertung lesen - 31.10.2020 12:53

starstarstarstarstar
Laurens Koppenol
Lead Data Scientist, ProRail
10
Data Science met Python en Spark

"Our DataLab team at ProRail enjoyed a three-day hands-on PySpark course from Jeroen. Jeroen’s approach is personal and professional. I recommend Data Science Workshops to anyone in the field of data science." - 21.07.2020 13:25

"Our DataLab team at ProRail enjoyed a three-day hands-on PySpark course from Jeroen. Jeroen’s approach is personal and professional. I recom… Gesamte Bewertung lesen - 21.07.2020 13:25

Jeroen Janssens - Principal Instructor
Jeroen Janssens
Principal Instructor
9,5

Es wurden noch keine Besucherfragen gestellt. Wenn Sie weitere Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice.

Bitte füllen Sie das Formular so vollständig wie möglich aus

Anrede
(optional)
(optional)
(optional)
(optional)
(optional)
(optional)

Haben Sie noch Fragen?

(optional)
Damit Ihnen per E-Mail oder Telefon weitergeholfen werden kann, speichern wir Ihre Daten.
Mehr Informationen dazu finden Sie in unseren Datenschutzbestimmungen.