Sie suchen Ihre bereits erworbenen Lerninhalte? Dann geht es hier entlang: Zum academy Campus
Lernen Sie die Methoden der automatischen Textanalyse kennen - mit über 60 praktischen Übungen zum Mitmachen. Der Data-Science-Experte Christian Winkler zeigt in seinem Videokurs alle Inhalte Schritt für Schritt. Sie können direkt mitmachen und Ihr Wissen anhand von Übungsaufgaben und Quizzes überprüfen.
Flexible IT Weiterbildung on demand, schon als monatliches Abo erhältlich
In diesem Kurs lernen Sie, natürlichsprachige Textdokumente automatisch zu analysieren. Dazu nutzen Sie linguistische Analysen, Inhalts- und Metadatenstatistiken sowie die Vektorisierung von Dokumenten, um moderne Verfahren des maschinellen Lernens (ML) kennenzulernen. Sie lernen die Unterschiede zwischen überwachten und unüberwachten Verfahren kennen. Mit semantischen Methoden werden Sie Wortähnlichkeiten erkennen. Sie nutzen die erst in den letzten Jahren erforschten Sprachmodelle und das Transfer Learning, um Fragen zu Texten automatisch zu beantworten und Texte generieren zu lassen.
Sie selbst arbeiten interaktiv: An über 60 Jupyter-Notebooks können Sie alle Übungen direkt ausprobieren und nachvollziehen - in einer lokalen Installation oder im Google Colab. So haben Sie am Ende nicht nur jede Menge Know-how gesammelt, sondern wissen auch genau, wie Sie Ihr neues Wissen in der Praxis anwenden können.
Klicken zum Abspielen
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
Herzlich willkommen zu diesem Kurs
Intro
Warum sollte ich Natural Language Processing lernen?
Was ist Natural Language Processing?
Aufbau des Kurses
Python und Jupyter als Plattform nutzen
Einfache Installation mit Anaconda
Alternative: Google Colab
Erste Schritt mit Jupyter/Colab
Überblick über Basis-Tools: Pandas
Überblick über Basis-Tools: Spacy, Textacy
Überblick über Basis-Tools: Scikit-learn
Überblick über Basis-Tools: Gensim und Tools für Spezialaufgaben
Wissenstest
Intro
Daten finden
Einzelne Dateien herunterladen
Unterschiedliche Dateiformate
Struktur von HTML-Inhalten
Extraktion von HTML-Inhalten
Persistieren von Inhalten
Praxis: URLs generieren und herunterladen
Praxis: Dateien herunterladen und extrahieren
Wissenstest
Intro
Data Cleaning
Erklärung Tokenisierung
Tokenisierung mit regexp
Tokenisierung mit nltk und spaCy
Bestimmung von Landessprachen
Linguistische Analyse (Part-of-speech)
Bestimmung von Wortarten
Dependency Tree
Named Entity Recognition
Wissenstest
Intro
Einführung Textacy
Beispiel: Synonyme
Bestimmung von Textlängen
Linguistische Analyse und Persistenz
Worthäufigkeiten und Anzeige von Wordclouds
Co-Occurrence und Keywords in Context (KWIC)
Nutzung von Meta-Informationen
Kombination von Text- und Metainformationen
Komplexitätsmaße
Wissenstest
Intro
Vorbereitungen für das Machine Learning
Erklärung Features
Bag-of-Words-Vektorisierung
Anzahl Features und Skalierung
Bag-of-words vs. TF/IDF
Ähnlichkeitsmaße
Wissenstest
Intro
Erklärung Machine Learning-Algorithmen (unüberwacht)
Erklärung Topic Models
Berechnung NMF
Berechnung LDA
Visualisierung mit pyLDAvis
Andere Verfahren, Unterschiede und Gemeinsamkeiten
Coherence Scores
Zeitevolution
Clustering und Unterschied zu Topic Models
Wissenstest
Intro
Erklärung überwachtes Lernen
Trainingsdaten
Klassifikation mit Support Vector Machine
Andere Klassifikatoren
Testdaten und Confusion Matrix
Accuracy, Precision und Recall
Cross-Validation und Hold-Out-Verfahren
Hyperparameter und Grid-Search
Wissenstest
Intro
Embeddings und Ähnlichkeitsmaß für Wörter
Word Embeddings: word2vec
Alternativen: fastText und gloVe
Unterschiede der Verfahren anhand der Ergebnisse erklären
Nutzung vortrainierter Modelle
Semantische Transformation und doc2vec
Wissenstest
Intro
Einführung Transfer-Learning-Modelle
Berechnung von Embeddings und Klassifikation
Klassifikationsproblem aus vorherigem Kapitel mit BERT
Klassifikationsproblem aus vorherigem Kapitel mit BERT Teil 2
Vergleich Qualität und Rechenzeit mit SVM
Andere Sprachmodelle (dbmz)
Question Answering mit Heise und Wikipedia
Kaskadiertes Modell (Information Retrieval + Question Answering)
Textgenerierung
Wissenstest
Fazit und Kursabschluss
In den Videokursen der heise Academy lernen Sie IT-Themen anschaulich und verständlich. In den Videos schauen Sie Experten bei der praktischen Arbeit zu und lassen sich alles genau erklären. Das Wissen ist in viele kleine Lernschritte und Aufgaben unterteilt - Sie können den Kurs Lektion für Lektion durcharbeiten oder gezielt zu Themen springen, die Sie interessieren. Die persönliche Lernumgebung der heise Academy bietet Ihnen viele Funktionen, die Sie beim Lernen unterstützen:
Flexibler Videoplayer mit vielen Steuerungsmöglichkeiten
Wissensquizzes zur Lernkontrolle
Lernhistorie und Lernfortschritt
Lesezeichen und Notizen
Volltextsuche in den Videos
Frage-den-Experten-Modul
Übungsmaterial zum Mitmachen
Responsive Web-App und Videostreaming für alle Endgeräte
Für diesen Videokurs wird lediglich ein Browser (mit eingeschalteter JavaScript-Funktionalität) und eine Internetverbindung benötigt.
Prof. Dr. Christian Winkler ist Co-Gründer der datanizing GmbH und beschäftigt sich seit 20 Jahren mit künstlicher Intelligenz, speziell mit der automatisierten Analyse natürlich-sprachiger Texte (Natural Language Processing). Er forscht und publiziert zu diesem Thema und ist regelmäßig Sprecher auf Machine-Learning-Konferenzen. Als Professor an der TH Nürnberg konzentriert er sich bei seiner Forschung auf die Optimierung von User Experience mithilfe moderner Verfahren.
Füllen Sie ganz einfach und bequem das Kontaktformular aus und wir werden Ihnen Ihre Fragen schnellstmöglich beantworten.
Teamleiter Redaktion & Content-Produktion
Telefonisch erreichbar: Mo – Fr | 8.30 – 16 Uhr