Videokurse

Natural Language Processing mit Python

Ein Kurs zum Kennenlernen der Methoden der automatischen Textanalyse – mit über 60 praktischen Übungen zum Mitmachen. Der Data-Science-Experte Christian Winkler zeigt in seinem Videokurs alle Inhalte Schritt für Schritt. Der Kurs lädt zum direkten Mitmachen ein, und das Wissen lässt sich anhand von Übungsaufgaben und Quizzes überprüfen.

Mit Prof. Dr. Christian Winkler

Im Essential Pass enthalten

Flexible IT Weiterbildung on demand, schon als monatliches Abo erhältlich

Mehr Infos & Kauf

Sie haben bereits einen academy Pass?

Jetzt einloggen

Enterprise

Essential

Professional

Natural Language Processing mit Python

Online

11:03 h

245,⁰⁰ €*

Anzahl:

Überblick

In diesem Kurs lernst du, natürlichsprachige Textdokumente automatisch zu analysieren. Dazu nutzt du linguistische Analysen, Inhalts- und Metadatenstatistiken sowie die Vektorisierung von Dokumenten, um moderne Verfahren des maschinellen Lernens (ML) kennenzulernen. Du lernst die Unterschiede zwischen überwachten und unüberwachten Verfahren kennen. Mit semantischen Methoden wirst du Wortähnlichkeiten erkennen. Du nutzt die erst in den letzten Jahren erforschten Sprachmodelle und das Transfer Learning, um Fragen zu Texten automatisch zu beantworten und Texte generieren zu lassen.

Du selbst arbeitest interaktiv: An über 60 Jupyter-Notebooks kannst du alle Übungen direkt ausprobieren und nachvollziehen – in einer lokalen Installation oder im Google Colab. So hast du am Ende nicht nur jede Menge Know-how gesammelt, sondern weißt auch genau, wie du dein neues Wissen in der Praxis anwenden kannst.

Klicken zum Abspielen

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Externer InhaltZur Datenschutzerklärung

Alle Video-Lektionen im Überblick:

1. Grundlagen, Einführung und Einrichtung
- Herzlich willkommen zu diesem Kurs
- Intro
- Warum sollte ich Natural Language Processing lernen?
- Was ist Natural Language Processing?
- Aufbau des Kurses
- Python und Jupyter als Plattform nutzen
- Einfache Installation mit Anaconda
- Alternative: Google Colab
- Erste Schritt mit Jupyter/Colab
- Überblick über Basis-Tools: Pandas
- Überblick über Basis-Tools: Spacy, Textacy
- Überblick über Basis-Tools: Scikit-learn
- Überblick über Basis-Tools: Gensim und Tools für Spezialaufgaben
- Wissenstest
2. Akquirieren und Extrahieren der Daten
- Intro
- Daten finden
- Einzelne Dateien herunterladen
- Unterschiedliche Dateiformate
- Struktur von HTML-Inhalten
- Extraktion von HTML-Inhalten
- Persistieren von Inhalten
- Praxis: URLs generieren und herunterladen
- Praxis: Dateien herunterladen und extrahieren
- Wissenstest
3. Vorbereiten der Daten
- Intro
- Data Cleaning
- Erklärung Tokenisierung
- Tokenisierung mit regexp
- Tokenisierung mit nltk und spaCy
- Bestimmung von Landessprachen
- Linguistische Analyse (Part-of-speech)
- Bestimmung von Wortarten
- Dependency Tree
- Named Entity Recognition
- Wissenstest
4. Textstatistik
- Intro
- Einführung Textacy
- Beispiel: Synonyme
- Bestimmung von Textlängen
- Linguistische Analyse und Persistenz
- Worthäufigkeiten und Anzeige von Wordclouds
- Co-Occurrence und Keywords in Context (KWIC)
- Nutzung von Meta-Informationen
- Kombination von Text- und Metainformationen
- Komplexitätsmaße
- Wissenstest
5. Features und Vektorisierung
- Intro
- Vorbereitungen für das Machine Learning
- Erklärung Features
- Bag-of-Words-Vektorisierung
- Anzahl Features und Skalierung
- Bag-of-words vs. TF/IDF
- Ähnlichkeitsmaße
- Wissenstest
6. Topic-Modelle und Clustering
- Intro
- Erklärung Machine Learning-Algorithmen (unüberwacht)
- Erklärung Topic Models
- Berechnung NMF
- Berechnung LDA
- Visualisierung mit pyLDAvis
- Andere Verfahren, Unterschiede und Gemeinsamkeiten
- Coherence Scores
- Zeitevolution
- Clustering und Unterschied zu Topic Models
- Wissenstest
7. Klassifikation mit klassischem überwachtem Machine Learning
- Intro
- Erklärung überwachtes Lernen
- Trainingsdaten
- Klassifikation mit Support Vector Machine
- Andere Klassifikatoren
- Testdaten und Confusion Matrix
- Accuracy, Precision und Recall
- Cross-Validation und Hold-Out-Verfahren
- Hyperparameter und Grid-Search
- Wissenstest
8. Word Embeddings
- Intro
- Embeddings und Ähnlichkeitsmaß für Wörter
- Word Embeddings: word2vec
- Alternativen: fastText und gloVe
- Unterschiede der Verfahren anhand der Ergebnisse erklären
- Nutzung vortrainierter Modelle
- Semantische Transformation und doc2vec
- Wissenstest
9. Transfer Learning und Question Answering
- Intro
- Einführung Transfer-Learning-Modelle
- Berechnung von Embeddings und Klassifikation
- Klassifikationsproblem aus vorherigem Kapitel mit BERT
- Klassifikationsproblem aus vorherigem Kapitel mit BERT Teil 2
- Vergleich Qualität und Rechenzeit mit SVM
- Andere Sprachmodelle (dbmz)
- Question Answering mit Heise und Wikipedia
- Kaskadiertes Modell (Information Retrieval + Question Answering)
- Textgenerierung
- Wissenstest
- Fazit und Kursabschluss

So lernst du mit diesem Videokurs:

In den Videokursen der heise academy lernst du IT-Themen anschaulich und verständlich. Du siehst den Experten bei der praktischen Arbeit zu und lässt dir dabei alles genau erklären. Das Wissen ist in kompakte Lerneinheiten unterteilt, sodass du den Kurs Schritt für Schritt durcharbeiten oder gezielt zu Lektionen springen kannst, die dich interessieren. Die persönliche Lernumgebung der heise academy hält viele Funktionen für dich bereit, die dich beim Lernen unterstützen:

Flexibler Videoplayer mit vielen Steuerungsmöglichkeiten
Wissensquizzes zur Lernkontrolle
Lernhistorie und Lernfortschritt
Lesezeichen und Notizen
Volltextsuche in den Videos
Frage-den-Experten-Modul
Übungsmaterial zum Mitmachen
Responsive Web-App und Videostreaming für alle Endgeräte

Technische Voraussetzungen:

Für diesen Videokurs wird lediglich ein Browser (mit eingeschalteter JavaScript-Funktionalität) und eine Internetverbindung benötigt.

Prof. Dr. Christian Winkler

Gründer von datanizing und Professor für User Experience | datanizing GmbH

Prof. Dr. Christian Winkler ist Co-Gründer der datanizing GmbH und beschäftigt sich seit 20 Jahren mit künstlicher Intelligenz, speziell mit der automatisierten Analyse natürlich-sprachiger Texte (Natural Language Processing). Er forscht und publiziert zu diesem Thema und ist regelmäßig Sprecher auf Machine-Learning-Konferenzen. Als Professor an der TH Nürnberg konzentriert er sich bei seiner Forschung auf die Optimierung von User Experience mithilfe moderner Verfahren.

Zum Profil

Enterprise

Essential

Professional

Natural Language Processing mit Python

Online

11:03 h

245,⁰⁰ €*

Anzahl:

Du hast Fragen zu unseren academy Videokursen? Wir helfen dir gern weiter.

Füllen Sie ganz einfach und bequem das Kontaktformular aus und wir werden Ihnen Ihre Fragen schnellstmöglich beantworten.

heise academy Content-Team

content@heise-academy.de

+49 511 5352 599

Telefonisch erreichbar: Mo – Fr | 8.30 – 16 Uhr

Unsere Antworten auf die häufigsten Fragen

Im Essential Pass enthalten

Natural Language Processing mit Python

Alle Video-Lektionen im Überblick:

1. Grundlagen, Einführung und Einrichtung

2. Akquirieren und Extrahieren der Daten

3. Vorbereiten der Daten

4. Textstatistik

5. Features und Vektorisierung

6. Topic-Modelle und Clustering

7. Klassifikation mit klassischem überwachtem Machine Learning

8. Word Embeddings

9. Transfer Learning und Question Answering

So lernst du mit diesem Videokurs:

Technische Voraussetzungen:

Prof. Dr. Christian Winkler

Gründer von datanizing und Professor für User Experience | datanizing GmbH

Natural Language Processing mit Python

Du hast Fragen zu unseren academy Videokursen? Wir helfen dir gern weiter.

heise academy Content-Team

Kontaktformular