Les ingénieurs Big Data et les professionnels ayant des compétences NoSQL sont très recherchés dans l'industrie de la gestion des données. Cette Specializations est conçue pour ceux qui cherchent à développer des compétences fondamentales pour travailler avec le Big Data, Apache Spark et les bases de données NoSQL. Trois cours riches en informations couvrent les bases de données NoSQL populaires telles que MongoDB et Apache Cassandra, l'écosystème Apache Hadoop largement utilisé pour les outils Big Data, ainsi que le moteur analytique Apache Spark pour le traitement des données à grande échelle.
Vous commencerez par une vue d'ensemble des différentes catégories de référentiels de données NoSQL (pas seulement SQL), puis vous travaillerez sur plusieurs d'entre eux, notamment IBM Cloudant, MonogoDB et Cassandra. Vous effectuerez diverses tâches de gestion de données, telles que la création et la réplication de bases de données, l'insertion, la mise à jour, la suppression, l'interrogation, l'indexation, l'agrégation et le partage de données. Ensuite, vous acquerrez des connaissances fondamentales sur les technologies Big Data telles que Hadoop, MapReduce, HDFS, Hive et HBase, suivies d'une connaissance plus approfondie d'Apache Spark, Spark Dataframes, Spark SQL, PySpark, l'interface utilisateur de l'application Spark, et la mise à l'échelle de Spark avec Kubernetes. Dans le dernier cours, vous apprendrez à travailler avec Spark Structured Streaming Spark ML - pour effectuer des tâches d'extraction, de transformation et de chargement (ETL) et d'apprentissage automatique.
Cette spécialisation convient aux débutants dans les domaines du NoSQL et du Big Data - que vous soyez ou que vous vous prépariez à devenir un ingénieur de données, un développeur de logiciels, un architecte informatique, un scientifique des données ou un responsable informatique.