Spécialisation Fondations NoSQL, Big Data et Spark

Découvrez de nouvelles compétences avec 30 % de réduction sur les cours dispensés par des experts du secteur. Économisez maintenant.

Spécialisation Fondations NoSQL, Big Data et Spark

Un tremplin pour votre carrière dans le Big Data. Maîtrisez les fondamentaux de NoSQL, Big Data et Apache Spark avec des compétences pratiques prêtes à l'emploi dans l'apprentissage automatique et l'ingénierie des données.

Enseigné en Français (doublage IA)

Instructeurs : IBM Skills Network Team

12 992 déjà inscrits

Inclus avec Coursera Plus

Série de 3 cours

Approfondissez votre connaissance d’un sujet

4.4

(203 avis)

niveau Débutant

Expérience recommandée

1 mois à raison de 10 heures par semaine

Planning flexible

Obtenir une qualification professionnelle

Partagez votre expertise avec les employeurs

Série de 3 cours

Approfondissez votre connaissance d’un sujet

4.4

(203 avis)

niveau Débutant

Expérience recommandée

1 mois à raison de 10 heures par semaine

Planning flexible

Obtenir une qualification professionnelle

Partagez votre expertise avec les employeurs

Ce que vous apprendrez

Travailler avec des bases de données NoSQL pour insérer, mettre à jour, supprimer, interroger, indexer, agréger et partager/partitionner des données.
Développez une expérience pratique du NoSQL en travaillant avec MongoDB, Apache Cassandra et IBM Cloudant.
Développez des connaissances fondamentales sur le Big Data et acquérez une expérience pratique en laboratoire en utilisant Apache Hadoop, MapReduce, Apache Spark, Spark SQL et Kubernetes.
Effectuez des traitements d'extraction, de transformation et de chargement (ETL) ainsi que la formation et le déploiement de modèles d'apprentissage automatique avec Apache Spark.

Vue d'ensemble

Les ingénieurs Big Data et les professionnels ayant des compétences NoSQL sont très recherchés dans l'industrie de la gestion des données. Cette Specializations est conçue pour ceux qui cherchent à développer des compétences fondamentales pour travailler avec le Big Data, Apache Spark et les bases de données NoSQL. Trois cours riches en informations couvrent les bases de données NoSQL populaires telles que MongoDB et Apache Cassandra, l'écosystème Apache Hadoop largement utilisé pour les outils Big Data, ainsi que le moteur analytique Apache Spark pour le traitement des données à grande échelle.

Vous commencerez par une vue d'ensemble des différentes catégories de référentiels de données NoSQL (pas seulement SQL), puis vous travaillerez sur plusieurs d'entre eux, notamment IBM Cloudant, MonogoDB et Cassandra. Vous effectuerez diverses tâches de gestion de données, telles que la création et la réplication de bases de données, l'insertion, la mise à jour, la suppression, l'interrogation, l'indexation, l'agrégation et le partage de données. Ensuite, vous acquerrez des connaissances fondamentales sur les technologies Big Data telles que Hadoop, MapReduce, HDFS, Hive et HBase, suivies d'une connaissance plus approfondie d'Apache Spark, Spark Dataframes, Spark SQL, PySpark, l'interface utilisateur de l'application Spark, et la mise à l'échelle de Spark avec Kubernetes. Dans le dernier cours, vous apprendrez à travailler avec Spark Structured Streaming Spark ML - pour effectuer des tâches d'extraction, de transformation et de chargement (ETL) et d'apprentissage automatique.

Cette spécialisation convient aux débutants dans les domaines du NoSQL et du Big Data - que vous soyez ou que vous vous prépariez à devenir un ingénieur de données, un développeur de logiciels, un architecte informatique, un scientifique des données ou un responsable informatique.

Compétences que vous acquerrez

Outils que vous découvrirez

Ce qui est inclus

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Français (doublage IA)

36 exercices pratiques

Améliorez votre expertise en la matière

Acquérez des compétences recherchées auprès d’universités et d’experts du secteur
Maîtrisez un sujet ou un outil avec des projets pratiques
Développez une compréhension approfondie de concepts clés
Obtenez un certificat professionnel auprès de IBM

Spécialisation - série de 3 cours

L'accent dans cette spécialisation est mis sur l'apprentissage par la pratique. Ainsi, chaque cours comprend des laboratoires pratiques pour mettre en pratique et appliquer les compétences NoSQL et Big Data que vous apprenez pendant les cours magistraux.

Dans le premier cours, vous travaillerez avec plusieurs bases de données NoSQL - MongoDB, Apache Cassandra, et IBM Cloudant pour effectuer une variété de tâches : créer la base de données, ajouter des documents, interroger les données, utiliser l'API HTTP, effectuer des opérations de création, lecture, mise à jour et suppression (CRUD), limiter et trier les enregistrements, indexation, agrégation, réplication, utiliser l'interpréteur de commandes CQL, les opérations sur les espaces clés, et d'autres opérations sur les tables.

Dans le cours suivant, vous lancerez un cluster Hadoop à l'aide de Docker et exécuterez des tâches Map Reduce. Vous allez explorerez le travail avec Spark en utilisant les carnets Jupyter sur un noyau Python. Vous développerez vos compétences Spark en utilisant DataFrames, Spark SQL, et mettrez à l'échelle vos travaux en utilisant Kubernetes.

Dans le dernier cours, vous utiliserez Spark pour le traitement ETL et la formation et le déploiement de modèles d'apprentissage automatique à l'aide d'IBM Watson.

Introduction aux bases de données NoSQL

COURS 118 heures4.6 (357 évaluations)Voir le cours

Ce que vous apprendrez

Faites la différence entre les quatre catégories principales de référentiels NoSQL.
Décrivez les caractéristiques, les avantages, les limites et les applications des outils de traitement des Big Data les plus populaires.
Effectuer des tâches courantes à l'aide de MongoDB, notamment des opérations de création, de lecture, de mise à jour et de suppression (CRUD).
Exécutez des opérations sur les espaces clés, les tables et les opérations CRUD dans Cassandra.

Compétences que vous acquerrez

Catégorie : NoSQL

Catégorie : MongoDB

Catégorie : Apache Cassandra

Catégorie : Modélisation des données

Catégorie : Langage de requête

Catégorie : Informatique distribuée

Catégorie : Évolutivité

Catégorie : Gestion des bases de données

Catégorie : Manipulation de données

Catégorie : Architecture et administration des bases de données

Catégorie : IBM Cloud

Catégorie : Bases de données

Catégorie : JSON

Introduction au Big Data avec Spark et Hadoop

COURS 219 heures4.4 (454 évaluations)Voir le cours

Ce que vous apprendrez

Expliquer l'impact du big data, y compris les cas d'utilisation, les outils et les méthodes de traitement.
Décrire l'architecture, l'écosystème, les pratiques et les applications liées à l'utilisateur d'Apache Hadoop, y compris Hive, HDFS, HBase, Spark et MapReduce.
Appliquer les bases de la programmation Spark, y compris les bases de la programmation parallèle pour les DataFrames, les ensembles de données et Spark SQL.
Utilisez les RDD et les ensembles de données de Spark, optimisez Spark SQL à l'aide de Catalyst et Tungsten, et utilisez les options de l'environnement de développement et d'exécution de Spark.

Compétences que vous acquerrez

Catégorie : Apache Spark

Catégorie : Informatique distribuée

Catégorie : Big Data

Catégorie : Apache Hadoop

Catégorie : Apache Hive

Catégorie : Traitement des données

Catégorie : Évolutivité

Catégorie : Débogage

Catégorie : IBM Cloud

Catégorie : PySpark

Catégorie : Docker (Logiciel)

Catégorie : Optimisation des performances

Catégorie : Kubernetes

Catégorie : Transformation de données

Apprentissage automatique avec Apache Spark

COURS 315 heures4.5 (109 évaluations)Voir le cours

Ce que vous apprendrez

Décrivez la ML, expliquez son rôle dans l'ingénierie des données, résumez l'IA générative, discutez des utilisations de Spark et analysez les pipelines de ML et la persistance des modèles.
Évaluer les modèles ML, distinguer les modèles de régression, de classification et de regroupement, et comparer les pipelines d'ingénierie des données avec les pipelines ML.
Construisez les processus d'analyse des données à l'aide de Spark SQL et effectuez des régressions, des classifications et des regroupements à l'aide de SparkML.
Démonstration de la connexion aux clusters Spark, de la construction de pipelines de ML, de l'extraction et de la transformation des caractéristiques, et de la persistance des modèles.

Compétences que vous acquerrez

Catégorie : Apprentissage automatique

Catégorie : Apache Spark

Catégorie : Extraction, transformation, chargement (ETL)

Catégorie : Pipelines de données

Catégorie : Modélisation prédictive

Catégorie : Transformation de données

Catégorie : Apprentissage supervisé

Catégorie : Apprentissage non supervisé

Catégorie : Analyse de régression

Catégorie : PySpark

Catégorie : Traitement des données

Catégorie : Apprentissage automatique appliqué

Catégorie : Apache Hadoop

Catégorie : IA générative

Catégorie : Arbre de classification et de régression (CART)

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

IBM Skills Network Team

IBM

83 Cours1 481 318 apprenants

Muhammad Yahya

IBM

5 Cours89 393 apprenants

Offert par

IBM

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018

’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020

’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021

’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Découvrir les diplômes

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions

La spécialisation nécessite 36 à 42 heures d'efforts. En travaillant 6 à 8 heures par semaine, elle peut être achevée en 1 à 2 mois. En travaillant 3 à 4 heures par semaine, elle peut être achevée en 4 à 6 mois.

Connaissances informatiques de base, bases en systèmes informatiques, expérience professionnelle avec un ou plusieurs systèmes d'exploitation et langages de programmation tels que Python, compétences en matière de données, quelques connaissances en SQL et volonté d'auto-apprentissage en ligne. Aucune connaissance préalable du Big Data ou du NoSQL n'est requise.

Il est recommandé de suivre les cours dans l'ordre dans lequel ils apparaissent dans la Specializations. Le cours 2 est un pré-requis pour le cours 3.

Oui ! Pour commencer, cliquez sur la fiche du cours qui vous intéresse et inscrivez-vous. Vous pouvez vous inscrire et suivre le cours pour obtenir un certificat à partager. Lorsque vous vous inscrivez à un cours qui fait partie d'une Spécialisation, vous êtes automatiquement abonné à la Spécialisation complète. Rendez-vous sur votre tableau de bord pour suivre vos progrès.

Non, vous ne pouvez pas suivre ce cours gratuitement. Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la Spécialisation et vous recevez un certificat lorsque vous terminez les activités. Si vous souhaitez uniquement lire et visualiser le contenu du cours, vous pouvez suivre le cours sans frais en auditeur libre. Si vous n'avez pas les moyens de payer les frais d'inscription, vous pouvez demander une aide financière.