Zum Campus
Videokurs

Natural Language Processing mit Python (inkl. Jupyter Notebooks)

Lerne die Methoden der automatischen Textanalyse – mit über 60 praktischen Übungen

LERNZIELE

  • Du lernst, wie sich NLP von anderen Methoden abgrenzt.
  • Du verstehst, wie du Text akquirieren und extrahieren kannst.
  • Du erfährst, wie du Texte in Vektoren wandelst und ML-Methoden darauf anwendest.
  • Du kennst den Unterschied zwischen überwachtem und unüberwachtem Lernen.
  • Du arbeitest mit semantischen Ähnlichkeiten.
  • Du nutzt Transfer Learning und lässt Algorithmen Fragen zu Texten beantworten.

INHALT

In diesem Kurs lernst du, wie du natürlichsprachige Textdokumente automatisiert analysieren kannst. Dazu nutzt du die linguistische Analyse, Statistiken über Inhalte und Metadaten sowie die Vektorisierung von Dokumenten, um dir die modernen Verfahren des maschinellen Lernens (ML) zu erschließen. Du lernst die Unterschiede zwischen überwachten und unüberwachten Verfahren kennen. Mithilfe semantischer Methoden erschließt du dir Wortähnlichkeiten. Die erst in den letzten Jahren erforschten Sprachmodelle und Transfer Learning nutzt du, um Fragen zu Texten automatisch zu beantworten und Texte generieren zu lassen.

Du arbeitest selbst interaktiv mit: In über 60 Jupyter-Notebooks kannst du alle Übungen direkt ausprobieren und nachvollziehen – in einer lokalen Installation oder auf Google Colab. Du hast also am Ende nicht nur jede Menge Know-how gesammelt, sondern weißt auch genau, wie du dein neues Wissen praktisch einsetzen kannst.

ALLE LEKTIONEN IM ÜBERBLICK

Klassifikation mit klassischem überwachtem Machine Learning
  • Intro
  • Erklärung überwachtes Lernen
  • Trainingsdaten
  • Klassifikation mit Support Vector Machine
  • Andere Klassifikatoren
  • Testdaten und Confusion Matrix
  • Accuracy, Precision und Recall
  • Cross-Validation und Hold-Out-Verfahren
  • Hyperparameter und Grid-Search
  • Quiz: Klassifikation mit klassischem überwachtem Machine Learning
Word Embeddings
  • Intro
  • Embeddings und Ähnlichkeitsmaß für Wörter
  • Word Embeddings: word2vec
  • Alternativen: fastText und gloVe
  • Unterschiede der Verfahren anhand der Ergebnisse erklären
  • Nutzung vortrainierter Modelle
  • Semantische Transformation und doc2vec
  • Quiz: Word Embeddings
Transfer Learning und Question Answering
  • Intro
  • Einführung Transfer-Learning-Modelle
  • Berechnung von Embeddings und Klassifikation
  • Klassifikationsproblem aus vorherigem Kapitel mit BERT
  • Klassifikationsproblem aus vorherigem Kapitel mit BERT Teil 2
  • Vergleich Qualität und Rechenzeit mit SVM
  • Andere Sprachmodelle (dbmz)
  • Question Answering mit Heise und Wikipedia
  • Kaskadiertes Modell (Information Retrieval + Question Answering)
  • Textgenerierung
  • Quiz: Transfer Learning und Question Answering
  • Fazit und Kursabschluss
Vorbereiten der Daten
  • Intro
  • Data Cleaning
  • Erklärung Tokenisierung
  • Tokenisierung mit regexp
  • Tokenisierung mit nltk und spaCy
  • Bestimmung von Landessprachen
  • Linguistische Analyse (Part-of-speech)
  • Bestimmung von Wortarten
  • Dependency Tree
  • Named Entity Recognition
  • Quiz: Vorbereiten der Daten
Textstatistik
  • Intro
  • Einführung Textacy
  • Beispiel: Synonyme
  • Bestimmung von Textlängen
  • Linguistische Analyse und Persistenz
  • Worthäufigkeiten und Anzeige von Wordclouds
  • Co-Occurrence und Keywords in Context (KWIC)
  • Nutzung von Meta-Informationen
  • Kombination von Text- und Metainformationen
  • Komplexitätsmaße
  • Quiz: Textstatistik
Features und Vektorisierung
  • Intro
  • Vorbereitungen für das Machine Learning
  • Erklärung Features
  • Bag-of-Words-Vektorisierung
  • Anzahl Features und Skalierung
  • Bag-of-words vs. TF/IDF
  • Ähnlichkeitsmaße
  • Quiz: Features und Vektorisierung
Topic-Modelle und Clustering
  • Intro
  • Erklärung Machine Learning-Algorithmen (unüberwacht)
  • Erklärung Topic Models
  • Berechnung NMF
  • Berechnung LDA
  • Visualisierung mit pyLDAvis
  • Andere Verfahren, Unterschiede und Gemeinsamkeiten
  • Coherence Scores
  • Zeitevolution
  • Clustering und Unterschied zu Topic Models
  • Quiz: Topic Modelle und Clustering
Grundlagen, Einführung und Einrichtung
  • Herzlich Willkommen zu diesem Kurs
  • Intro
  • Warum sollte ich Natural Language Processing lernen?
  • Was ist Natural Language Processing?
  • Aufbau des Kurses
  • Python und Jupyter als Plattform nutzen
  • Einfache Installation mit Anaconda
  • Alternative: Google Colab
  • Erste Schritt mit Jupyter/Colab
  • Überblick über Basis-Tools: Pandas
  • Überblick über Basis-Tools: Spacy, Textacy
  • Überblick über Basis-Tools: Scikit-learn
  • Überblick über Basis-Tools: Gensim und Tools für Spezialaufgaben
  • Quiz: Grundlagen
Akquirieren und Extrahieren der Daten
  • Intro
  • Daten finden
  • Einzelne Dateien herunterladen
  • Unterschiedliche Dateiformate
  • Struktur von HTML-Inhalten
  • Extraktion von HTML-Inhalten
  • Persistieren von Inhalten
  • Praxis: URLs generieren und herunterladen
  • Praxis: Dateien herunterladen und extrahieren
  • Quiz: Akquirieren und Extrahieren der Daten

SO LERNST DU MIT DIESEM KURS

In den Videokursen der heise academy lernst du IT-Themen anschaulich und verständlich. Du siehst den Experten bei der praktischen Arbeit zu und lässt dir dabei alles genau erklären. Das Wissen ist in kompakte Lerneinheiten unterteilt, sodass du den Kurs Schritt für Schritt durcharbeiten oder gezielt zu Lektionen springen kannst, die dich interessieren. Die persönliche Lernumgebung der heise academy hält viele Funktionen für dich bereit, die dich beim Lernen unterstützen:

  • Flexibler Videoplayer mit vielen Steuerungsmöglichkeiten
  • Wissensquiz zur Lernkontrolle
  • Lernhistorie und Lernfortschritt
  • Lesezeichen und Notizen
  • Volltextsuche in den Videos
  • Übungsmaterial zum Mitmachen
  • Responsive Web-App und Videostreaming für alle Endgeräte

TECHNISCHE VORAUSSETZUNGEN

Für diesen Videokurs wird lediglich ein aktueller Browser (mit eingeschalteter JavaScript-Funktionalität) und eine Internetverbindung benötigt.

Natural Language Processing mit Python (inkl. Jupyter Notebooks)

Veröffentlicht am 13.12.2025
ab 49,00 €
im
ESSENTIAL PASS
oder 245,00 € im Einzelkauf
inkl. MwSt. | 205,88 € netto
Preise und Pakete vergleichen

Du hast Fragen zu unseren academy Videokursen? Wir helfen dir gerne weiter.

Fülle ganz einfach und bequem das Kontaktformular aus und wir werden deine Fragen schnellstmöglich beantworten.

Kontaktformular