Dans ce cours, vous explorerez trois pratiques d'Analyse Exploratoire des Données (AED) : le nettoyage, la jointure et la validation. Vous découvrirez l'importance de ces pratiques pour l'analyse des données et vous utiliserez Python pour nettoyer, valider et joindre des données.



Nettoyage des données propres
Ce cours fait partie de Spécialisation Analyse des données de Google avec Python

Instructeur : Google Career Certificates
Enseignant de premier plan
Inclus avec
Ce que vous apprendrez
Explorer les pratiques de l'AED en matière de nettoyage, de validation et d'assemblage des données
Compétences que vous acquerrez
- Catégorie : Data wrangling
Détails à connaître

Ajouter à votre profil LinkedIn
septembre 2025
5 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 5 modules dans ce cours
Les données manquantes ou dupliquées peuvent apparaître dans les ensembles de données pour de nombreuses raisons. L'impact des valeurs manquantes peut varier en fonction de leur nombre. Dans ce module, vous apprendrez des stratégies pour traiter les entrées de données manquantes, déterminer quand la déduplication est nécessaire et utiliser des fonctions Python courantes pour traiter les doublons.
Inclus
4 vidéos1 lecture1 devoir3 laboratoires non notés
Les valeurs aberrantes sont des points de données qui se distinguent des autres. Une approche délicate des valeurs aberrantes permet de reconnaître les histoires humaines et les effets du monde réel qu'elles représentent. Dans ce module, vous apprendrez quels sont les types de valeurs aberrantes, comment les traiter et les visualiser.
Inclus
2 vidéos2 lectures1 devoir
Les modèles de données fonctionnent généralement mieux avec des données numériques. Pour ce faire, les données catégorielles sont encodées en chiffres numériques pour l'analyse. Dans ce module, vous apprendrez pourquoi cette transformation est nécessaire, ce que sont les variables fictives et comment sélectionner la bonne méthode d'encodage.
Inclus
2 vidéos2 lectures1 devoir
L'Assainissement des entrées consiste à vérifier l'exhaustivité des données et à éliminer les erreurs. Dans ce module, vous apprendrez pourquoi l'Assainissement des entrées minimise les erreurs, comment détecter les entrées incorrectes et pourquoi il est essentiel pour joindre des ensembles de données.
Inclus
2 vidéos1 devoir2 laboratoires non notés1 plugin
Passez en revue tout ce que vous avez appris et passez l'évaluation finale.
Inclus
1 lecture1 devoir
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeur

Offert par
En savoir plus sur Analyse des Données
Coursera Project Network
- Statut : Essai gratuit
Johns Hopkins University
- Statut : Essai gratuit
Corporate Finance Institute
- Statut : Essai gratuit
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?





Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Les organisations de tous types et de toutes tailles ont des processus commerciaux qui génèrent des volumes massifs de données. À chaque instant, toutes sortes d'informations sont créées par les ordinateurs, l'internet, les téléphones, les textes, la vidéo en continu, les photographies, les capteurs et bien d'autres choses encore. Dans le paysage numérique mondial, les données sont de plus en plus imprécises, chaotiques et non structurées. Alors que la vitesse et la variété des données augmentent de façon exponentielle, les organisations peinent à suivre le rythme.
La science des données fait partie d'un domaine d'étude qui utilise les données brutes pour créer de nouvelles façons de modéliser et de comprendre l'inconnu. Pour acquérir des connaissances, les entreprises s'appuient sur des professionnels des données pour acquérir, organiser et interpréter les données, ce qui permet d'éclairer les projets et les processus internes. Les data scientists s'appuient sur une combinaison de compétences essentielles, notamment les statistiques, les méthodes scientifiques, l'analyse des données et l'intelligence artificielle (IA).
Un professionnel des données est un terme utilisé pour décrire toute personne qui travaille avec des données et/ou qui possède des compétences en matière de données. Au minimum, un professionnel des données est capable d'explorer, de nettoyer, de sélectionner, d'analyser et de visualiser des données. Il peut également être à l'aise avec l'écriture de code et avoir une certaine familiarité avec les techniques utilisées par les statisticiens et les ingénieurs en apprentissage automatique, notamment la construction de modèles, le développement de la pensée algorithmique et la construction de modèles d'apprentissage automatique.
Les professionnels des données sont responsables de la collecte, de l'analyse et de l'interprétation de grandes quantités de données au sein d'une variété d'organisations différentes. Le rôle d'un professionnel des données est défini différemment selon les entreprises. D'une manière générale, les professionnels des données possèdent des capacités techniques et stratégiques qui nécessitent des compétences analytiques plus avancées, telles que la manipulation des données, la conception expérimentale, la modélisation prédictive et l'apprentissage automatique. Ils effectuent diverses tâches liées à la collecte, à la structuration, à l'interprétation, au suivi et à la communication des données dans des formats accessibles, ce qui permet aux parties prenantes de comprendre et d'utiliser les données de manière efficace. En fin de compte, le travail des professionnels des données aide les organisations à prendre des décisions éclairées et éthiques.
Les grands volumes de données - et la technologie nécessaire pour les gérer et les analyser - sont de plus en plus accessibles. Pour cette raison, les opportunités de carrière se sont multipliées pour les personnes capables de raconter des histoires à l'aide de données, comme les analystes de données seniors et les data scientists. Ces professionnels collectent, analysent et interprètent de grandes quantités de données au sein de différentes organisations. Leurs responsabilités nécessitent des compétences analytiques avancées telles que la manipulation des données, la conception expérimentale, la modélisation prédictive et l'apprentissage automatique.
Plus de questions
Aide financière disponible,