In this course, you’ll explore three exploratory data analysis (EDA) practices: cleaning, joining, and validating. You'll discover the importance of these practices for data analysis, and you’ll use Python to clean, validate, and join data.



Bereinigen Sie Ihre Daten
Dieser Kurs ist Teil von Spezialisierung für Google Datenanalyse mit Python

Dozent: Google Career Certificates
TOP-LEHRKRAFT
Bei enthalten
Was Sie lernen werden
Explore the EDA practices of cleaning, validating and joining data
Kompetenzen, die Sie erwerben
- Kategorie: Datenwrangling
Wichtige Details

Zu Ihrem LinkedIn-Profil hinzufügen
September 2025
5 Aufgaben
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 5 Module
Missing or duplicate data can appear in datasets for numerous reasons. The impact of missing values can vary depending on how many are present. In this module, you will learn strategies to address missing data entries, determine when deduplication is needed, and use common Python functions for handling duplicates.
Das ist alles enthalten
4 Videos1 Lektüre1 Aufgabe3 Unbewertete Labore
Outliers are data points that stand out amongst others. A tactful approach to outliers recognizes the human stories and real-world effects they represent. In this module, you will learn the types of outliers, how to handle them, and visualize them.
Das ist alles enthalten
2 Videos2 Lektüren1 Aufgabe
Data models typically work better with numerical inputs. To facilitate this, categorical data is encoded into numeric digits for analysis. In this module, you will learn why this transformation is needed, what dummy variables are, and how to select the right encoding method.
Das ist alles enthalten
2 Videos2 Lektüren1 Aufgabe
Input validation focuses on thoroughly checking data for completeness and to eliminate errors. In this module, you will learn why validation minimizes errors, how to detect improper inputs, and why it's essential for joining datasets.
Das ist alles enthalten
2 Videos1 Aufgabe2 Unbewertete Labore1 Plug-in
Überprüfen Sie alles, was Sie gelernt haben, und nehmen Sie an der Abschlussprüfung teil.
Das ist alles enthalten
1 Lektüre1 Aufgabe
Erwerben Sie ein Karrierezertifikat.
Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.
Dozent

von
Mehr von Datenanalyse entdecken
Coursera Project Network
- Status: Kostenloser Testzeitraum
Johns Hopkins University
- Status: Kostenloser Testzeitraum
Corporate Finance Institute
- Status: Kostenloser Testzeitraum
Warum entscheiden sich Menschen für Coursera für ihre Karriere?





Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Unternehmen jeder Art und Größe haben Geschäftsprozesse, bei denen riesige Datenmengen anfallen. Jeden Moment werden alle Arten von Informationen von Computern, dem Internet, Telefonen, Texten, Streaming-Videos, Fotos, Sensoren und vielem mehr erzeugt. In der globalen digitalen Landschaft sind die Daten zunehmend unpräzise, chaotisch und unstrukturiert. Da die Geschwindigkeit und Vielfalt der Daten exponentiell zunimmt, haben Unternehmen Schwierigkeiten, damit Schritt zu halten.
Die Datenwissenschaft ist ein Teilbereich der Wissenschaft, der Rohdaten nutzt, um neue Wege der Modellierung und des Verständnisses von Unbekanntem zu schaffen. Um Erkenntnisse zu gewinnen, sind Unternehmen auf Datenexperten angewiesen, die Daten erfassen, organisieren und interpretieren, um sie für interne Projekte und Prozesse zu nutzen. Datenwissenschaftler stützen sich auf eine Kombination von wichtigen Fähigkeiten, darunter Statistik, wissenschaftliche Methoden, Datenanalyse und künstliche Intelligenz.
Ein Datenexperte ist ein Begriff, der jede Person beschreibt, die mit Daten arbeitet und/oder über Datenkenntnisse verfügt. Ein Datenexperte ist zumindest in der Lage, Daten zu erkunden, zu bereinigen, auszuwählen, zu analysieren und zu visualisieren. Sie können auch gut mit dem Schreiben von Code umgehen und sind mit den Techniken vertraut, die von Statistikern und Ingenieuren für maschinelles Lernen verwendet werden, einschließlich der Erstellung von Modellen, der Entwicklung algorithmischen Denkens und der Erstellung von Modellen für maschinelles Lernen.
Datenexperten sind für das Sammeln, Analysieren und Interpretieren großer Datenmengen in einer Vielzahl unterschiedlicher Organisationen verantwortlich. Die Rolle eines Datenexperten wird von Unternehmen zu Unternehmen unterschiedlich definiert. Im Allgemeinen verfügen Datenexperten über technische und strategische Fähigkeiten, die fortgeschrittene analytische Fähigkeiten wie Datenmanipulation, Versuchsplanung, prädiktive Modellierung und maschinelles Lernen erfordern. Sie führen eine Vielzahl von Aufgaben im Zusammenhang mit dem Sammeln, Strukturieren, Interpretieren, Überwachen und Berichten von Daten in zugänglichen Formaten aus, damit die Beteiligten die Daten verstehen und effektiv nutzen können. Letztlich hilft die Arbeit von Datenexperten Organisationen, fundierte, ethische Entscheidungen zu treffen.
Große Datenmengen - und die zur Verwaltung und Analyse dieser Daten erforderliche Technologie - werden immer leichter zugänglich. Aus diesem Grund gibt es immer mehr Karrieremöglichkeiten für Menschen, die mithilfe von Daten Geschichten erzählen können, wie z. B. leitende Fachkräfte für Datenanalyse und Data Scientists. Diese Fachleute sammeln, analysieren und interpretieren große Datenmengen in einer Vielzahl unterschiedlicher Organisationen. Ihre Aufgaben erfordern fortgeschrittene analytische Fähigkeiten wie Datenmanipulation, Versuchsplanung, Prognosemodellierung und maschinelles Lernen.
Weitere Fragen
Finanzielle Unterstützung verfügbar,