Data Science und Natural Language Processing (NLP) mit Python
Mehr als 500 Teilnehmer/-innen empfehlen unsere Trainings:
https://www.provenexpert.com/dhl-data-science-seminare-gmbh/
Der Kurs Natural Language Processing (NLP) mit Python ist der dritte Teilkurs des Trainings Data Science Crash Course mit Python. Mit dem Lehrgang erhalten eine fundierte und modular aufgebaute Einführung in die Themen Data Science, Künstliche Intelligenz und Machine Learning (Maschinelles Lernen) sowohl für numerische Daten als auch für Textdaten.
Der Kurs Natural Language Processing (NLP) mit Python gibt einen Einblick, wie Sie symbolische Daten (wie Wörter) verarbeiten können und dadurch ein Verständnis von Text und Sätzen erhalten. Diese Fertigkeit können Sie dann anwenden, um z. B. einen eigenen Chatbot zu entwickeln oder andere symbolische oder ereignis-basierte Daten (wie z. B. Seite…

Es wurden noch keine FAQ hinterlegt. Falls Sie Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice. Wir helfen gerne weiter!
Mehr als 500 Teilnehmer/-innen empfehlen unsere Trainings:
https://www.provenexpert.com/dhl-data-science-seminare-gmbh/
Der Kurs Natural Language Processing (NLP) mit Python ist der dritte Teilkurs des Trainings Data Science Crash Course mit Python. Mit dem Lehrgang erhalten eine fundierte und modular aufgebaute Einführung in die Themen Data Science, Künstliche Intelligenz und Machine Learning (Maschinelles Lernen) sowohl für numerische Daten als auch für Textdaten.
Der Kurs Natural Language Processing (NLP) mit Python gibt einen Einblick, wie Sie symbolische Daten (wie Wörter) verarbeiten können und dadurch ein Verständnis von Text und Sätzen erhalten. Diese Fertigkeit können Sie dann anwenden, um z. B. einen eigenen Chatbot zu entwickeln oder andere symbolische oder ereignis-basierte Daten (wie z. B. Seitenaufrufe) zu modellieren und vorherzusagen.
Viele denken beim Thema Künstliche Intelligenz oft an Chatbots oder digitale Assistenten. Damit diese künstlichen Agenten oder Bots überhaupt mit uns interagieren können, benötigen sie ein gewisses Sprachverständnis. Hierfür wird die natürliche Sprachverarbeitung, oder Natural Language Processing (NLP) eingesetzt.
Ein weiteres wichtiges Thema ist die Datengewinnung. Durch sogenanntes Web Crawling können Sie Daten aus dem World Wide Web zusammensuchen und für Ihre Anwendung nutzbar machen. Dabei erfahren Sie zum einen, wie dies mittels Python und Regular Expressions funktioniert und zum anderen, was Sie dabei aus kommerzieller und ethischer Sicht zu beachten haben.
Dauer
- 5 Tage mit 40 Stunden Unterricht (täglich 8 Stunden, 9-17 Uhr)
- Aufteilung Theorie/Praxis: 40 % Theorie + 60 % Praxis mit Übungen
Inhalte
- Web Scraping und Crawling
- Kommerzielle und ethische Gesichtspunkte
- Scrapen einer Webseite: requests, robots.txt, html, regex
- Praxis-Übung: Scrapen einer Webseite
- Vorverarbeitung von Text
- Parsing: Tokenizer, Stopwords, Stemming, n-grams
- Praxis-Übung: Parsen von Data-Science-Texten
- Praxis-Beispiel I (Topic Clustering)
- Kurze Einführung in den Kontext und die Zielsetzung
- Praxis-Übung: Unüberwachtes Lernen/Unsupervised Learning (DBSCAN)
- Praxis-Beispiel II (Sentiment Analysis)
- Kurze Einführung in den Kontext, die Daten und die Zielsetzung
- Praxis-Übung: Überwachtes Lernen/Supervised Learning (Neuronale Netze)
- Praxis-Beispiel III (Sentence Completion)
- Kurze Einführung in den Kontext, die Daten und die Zielsetzung
- Praxis-Übung: Symbolische Zeitreihenvorhersage (Long-Short-Term-Memory/LSTM und Embedding)
Ziele
Am Ende des Seminars Natural Language Processing (NLP) mit Python werden Sie
- wissen, was Sie beachten müssen, wenn Sie Daten aus dem Internet ziehen (Web Scraping und Web Crawling) – und wie Sie Daten von einer Seite “scrapen” und vorverarbeiten können,
- wie Sie Texte mittels Tokenizer, Stopwords, Stemming und n-grams vor-verarbeiten bzw. parsen können und
- einen praktischen Einblick erhalten, wie Sie Topic Clustering, eine Sentiment Analyse und Satz-Vervollständigung mittels Unsupervised und Supervised Learning durchführen können.
Zielgruppe
- Beschäftigte aus operativen Bereichen, R&D und IT mit grundlegenden Programmierkenntnissen, welche die Potenziale von Data Science, Künstlicher Intelligenz und Maschinellem Lernen kennenlernen und hautnah erfahren möchten und
- Anwender, Studenten, Doktoranden und Forscher aus den mathematischen, statistischen, naturwissenschaftlichen, ingenieurwissenschaftlichen, informationstechnologischen, medizinischen, pharmazeutischen, betriebs-, wirtschafts-, markt- und sozialwissenschaftlichen Bereichen
Voraussetzungen
Für den Data Science Crash Course mit Python sind Grundverständnisse der Linearen Algebra (Vektoren, Matrizen) und ein Basiswissen in der Statistik (wie Korrelationen, Signifikanztests, lineare Regression) sehr empfehlenswert. Sie sollten Grundkenntnisse in einer Programmiersprache besitzen, am besten wäre eine Skriptsprache wie Python, R oder Matlab. Liegen keine Programmierkenntnisse vor, können Sie den dafür entwickelten Vorbereitungskurs Einführung in die Programmierung mit Python besuchen.
Hinweise zur Teilnahme
Teilnahme am Online-Seminar: Sie benötigen zur Teilnahme an unseren Online-Seminaren einen Computer mit Internetzugang (empfohlene Bandbreite 1-2 MBit/s). Sie erhalten nach der Anmeldung eine detaillierte Installationsanleitung für die erforderliche Statistik- und Videokonferenz-Software (die Teilnahme ist auch mit einem Browser möglich). Bei Bedarf können Sie einen Fernzugang zu einem Schulungscomputer mit der erforderlichen Software erhalten.
Teilnahme am Präsenz-Seminar: Bitte bringen Sie einen Laptop mit der erforderlichen Software mit (Sie erhalten im Vorfeld eine Installationsanleitung für die Python Anaconda Distribution).
Förderung
Bildungsurlaub, Weiterbildungsstipendium (kein Bildungsgutschein)
Es wurden noch keine FAQ hinterlegt. Falls Sie Fragen haben oder Unterstützung benötigen, kontaktieren Sie unseren Kundenservice. Wir helfen gerne weiter!
