Zum Campus
Videokurs

Statistik und Vektorisierung für NLP-Projekte

Lerne, wie du Texte in Vektoren wandelst und Machine-Learning-Methoden darauf anwendest

LERNZIELE

  • Du lernst, wie du Informationen statistisch bewertest
  • Du machst dich mit den Grundlagen des Machine Learning vertraut
  • Du lernst, Texte mit unterschiedlichen Methoden und Algorithmen zu analysieren
  • Du bist in der Lage, Texte per Ähnlichkeitsmaß miteinander zu vergleichen
  • Du kannst Trends erkennen und sie für die Zukunft vorhersagen

INHALT

Ein wesentlicher Bestandteil des Natural Language Processing ist die Statistik der Texte. In diesem Kurs wirst du die Länge der Texte analysieren, die Verteilung der Artikel über die Zeit und wie sich das Volumen in deinem Beispieldatensatzentwickelt. Anschließend wirst du Komplexitätsmaße kennenlernen. Damit kannst du messen, wie einfach Texte zu lesen sind.

Im Anschluss werden wir die Vorbereitungen für das Machine Learning treffen. Dafür benötigst du Vektoren. Texte liegen aber nicht in Vektorform vor, sondern bestehen aus Wörtern. Deswegen werden wir ein Feature-Modell entwickeln, mit dem wir aus den Wörtern im Text Vektoren generieren können. Dabei lernst du die Darstellungsformen Bag of Words und tf-idf (frequency–inverse document frequency) kennen und definierst damit ein Ähnlichkeitsmaß, mit dem wir beispielsweise herausfinden können, welche Autoren eventuell voneinander abgeschrieben haben.

Dieser Kurs gehört zu einer Reihe mit folgenden Titeln:

  • Python und Jupyter als Plattform für Natural Language Processing
  • Datenbeschaffung und -transformation für Natural Language Processing
  • Statistik und Vektorisierung für NLP-Projekte
  • Klassische Machine-Learning-Verfahren zur Textanalyse
  • Moderne Embedding-Methoden und Transfer Learning

ALLE LEKTIONEN IM ÜBERBLICK

Textstatistik
  • Intro
  • Einführung Textacy
  • Beispiel: Synonyme
  • Bestimmung von Textlängen
  • Linguistische Analyse und Persistenz
  • Worthäufigkeiten und Anzeige von Wordclouds
  • Co-Occurrence und Keywords in Context (KWIC)
  • Nutzung von Meta-Informationen
  • Kombination von Text- und Metainformationen
  • Komplexitätsmaße
  • Quiz: Textstatistik
Features und Vektorisierung
  • Intro
  • Vorbereitungen für das Machine Learning
  • Erklärung Features
  • Bag-of-Words-Vektorisierung
  • Anzahl Features und Skalierung
  • Bag-of-words vs. TF/IDF
  • Ähnlichkeitsmaße
  • Quiz: Features und Vektorisierung

SO LERNST DU MIT DIESEM KURS

In den Videokursen der heise academy lernst du IT-Themen anschaulich und verständlich. Du siehst den Experten bei der praktischen Arbeit zu und lässt dir dabei alles genau erklären. Das Wissen ist in kompakte Lerneinheiten unterteilt, sodass du den Kurs Schritt für Schritt durcharbeiten oder gezielt zu Lektionen springen kannst, die dich interessieren. Die persönliche Lernumgebung der heise academy hält viele Funktionen für dich bereit, die dich beim Lernen unterstützen:

  • Flexibler Videoplayer mit vielen Steuerungsmöglichkeiten
  • Wissensquiz zur Lernkontrolle
  • Lernhistorie und Lernfortschritt
  • Lesezeichen und Notizen
  • Volltextsuche in den Videos
  • Übungsmaterial zum Mitmachen
  • Responsive Web-App und Videostreaming für alle Endgeräte

TECHNISCHE VORAUSSETZUNGEN

Für diesen Videokurs wird lediglich ein aktueller Browser (mit eingeschalteter JavaScript-Funktionalität) und eine Internetverbindung benötigt.

DEIN EXPERTE

Prof. Dr. Christian Winkler
Gründer von datanizing und Professor für User Experience | datanizing GmbH

Prof. Dr. Christian Winkler ist Co-Gründer der datanizing GmbH und beschäftigt sich seit 20 Jahren mit künstlicher Intelligenz, speziell mit der automatisierten Analyse natürlich-sprachiger Texte (Natural Language Processing). Er forscht und publiziert zu diesem Thema und ist regelmäßig Sprecher auf Machine-Learning-Konferenzen. Als Professor an der TH Nürnberg konzentriert er sich bei seiner Forschung auf die Optimierung von User Experience mithilfe moderner Verfahren.

Statistik und Vektorisierung für NLP-Projekte

Veröffentlicht am 13.12.2025
ab 49,00 €
im
ESSENTIAL PASS
Preise und Pakete vergleichen

Du hast Fragen zu unseren academy Videokursen? Wir helfen dir gerne weiter.

Fülle ganz einfach und bequem das Kontaktformular aus und wir werden deine Fragen schnellstmöglich beantworten.

Kontaktformular