Du suchst deine bereits erworbenen Lerninhalte? Dann geht es hier entlang: Zum academy Campus

heise academy Logo
Videokurse

PySpark – Teil 1: Spark-Grundlagen und Datenmanipulation

Dieser Kurs vermittelt grundlegende Kenntnisse in der Arbeit mit PySpark, dem Python-Interface für Apache Spark, das die leistungsstarke Verarbeitung großer Datenmengen ermöglicht. Der Data-Science-Experte Fabio Basler zeigt in seinem Videokurs alle Inhalte praxisnah und Schritt für Schritt. Das neu erworbene Wissen lässt sich durch direktes Mitmachen in Übungsaufgaben und Quizfragen überprüfen und festigen.

Im Essential Pass enthalten

Flexible IT Weiterbildung on demand, schon als monatliches Abo erhältlich

Mehr Infos & Kauf
Sie haben bereits einen academy Pass?
Enterprise
Essential
Professional

PySpark – Teil 1: Spark-Grundlagen und Datenmanipulation

Online
Stopwatch Icon1:23 h
95,00 *
Überblick

PySpark bietet eine Schnittstelle für die Nutzung von Apache Spark in Python. Es vereint die Performanz von Apache Spark mit der Flexibilität von Python und erleichtert damit die Abfrage, Verarbeitung und Auswertung großer Datenmengen.

In diesem Kurs erhältst du einen fundierten Einstieg in die Arbeit mit PySpark. Nach einer theoretischen Einführung in Big Data und die Architektur von Spark lernst du zentrale Konzepte wie SparkContext und SparkSession kennen. Anschließend arbeitest du mit den grundlegenden Datenstrukturen in PySpark, den Resilient Distributed Datasets (RDDs) sowie den Spark DataFrames, und setzt Spark SQL gezielt für effiziente Datenabfragen ein. Praktische Übungen helfen dir dabei, das Gelernte zu festigen und anzuwenden.

Dieser Kurs gehört zu einer Kursreihe:

Klicken zum Abspielen

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Alle Lektionen im Überblick:

  • Vorstellung und Infos zum Kurs

    • Herzlich willkommen zu diesem Kurs

  • Einführung und Vorbereitung

    • Kapitelüberblick

    • Theorie: Was ist Big Data?

    • Theorie: Herausforderungen bei der Arbeit mit großen Datenmengen

    • Theorie: Big Data Tools

    • Theorie: Einführung in Apache Spark und seine Architektur

    • Größe einer Excel-Tabelle in der Analyse

    • Installation der Entwicklungsumgebung mit Jupyter Labs

    • Einrichtung von PySpark mit Jupyter Labs

    • Quiz: Einführung und Vorbereitung

  • Grundlegende Konzepte und Datenstrukturen in PySpark

    • Kapitelüberblick

    • Theorie: SparkContext und SparkSession

    • SparkContext und SparkSession

    • Theorie: Grundlegende Datenstrukturen in PySpark

    • Spark-Cluster-Komponenten im Überblick

    • PySpark-Datenstrukturen: Resilient Distributed Datasets (RDDs)

    • PySpark-Datenstrukturen: Spark DataFrames

    • Spark SQL als SQL-Schnittstelle für die Interaktion mit DataFrames

    • Quiz: Grundlegende Konzepte und Datenstrukturen in PySpark

  • Abschluss

    • Fazit und Kursabschluss

So lernst du mit diesem Videokurs:

In den Videokursen der heise academy lernst du IT-Themen anschaulich und verständlich. Du siehst den Experten bei der praktischen Arbeit zu und lässt dir dabei alles genau erklären. Das Wissen ist in kompakte Lerneinheiten unterteilt, sodass du den Kurs Schritt für Schritt durcharbeiten oder gezielt zu Lektionen springen kannst, die dich interessieren. Die persönliche Lernumgebung der heise academy hält viele Funktionen für dich bereit, die dich beim Lernen unterstützen:

  • Flexibler Videoplayer mit vielen Steuerungsmöglichkeiten

  • Wissensquiz zur Lernkontrolle

  • Lernhistorie und Lernfortschritt

  • Lesezeichen und Notizen

  • Volltextsuche in den Videos

  • Frage-den-Experten-Modul

  • Übungsmaterial zum Mitmachen

  • Responsive Web-App und Videostreaming für alle Endgeräte

Technische Voraussetzungen:

Für diesen Videokurs werden lediglich ein Browser (mit eingeschalteter JavaScript-Funktionalität) und eine Internetverbindung benötigt.

Foto von Fabio Basler

Fabio Basler

Data Scientist und Statistik-Trainer | Selbstständig

Zum Profil
Enterprise
Essential
Professional

PySpark – Teil 1: Spark-Grundlagen und Datenmanipulation

Online
Stopwatch Icon1:23 h
95,00 *

Du hast Fragen zu unseren academy Videokursen? Wir helfen dir gern weiter.

Füllen Sie ganz einfach und bequem das Kontaktformular aus und wir werden Ihnen Ihre Fragen schnellstmöglich beantworten.

heise academy Content-Team

content@heise-academy.de

+49 511 5352 599

Telefonisch erreichbar: Mo – Fr | 8.30 – 16 Uhr

Unsere Antworten auf die häufigsten Fragen

Kontaktformular

Bei Betätigen des Absenden-Buttons verarbeiten wir die von Ihnen angegebenen personenbezogenen Daten ausschließlich für den Zweck Ihrer Anfrage. Weitere Informationen zum Datenschutz finden Sie in unserer Datenschutzerklärung.