July 11, 2024
Compétences visées À la fin de ce cours, vous serez capable de: Pourquoi les bas es de données relationnelles ne sont pas toujours adaptées aux systèmes de données massives qui sont déployées dans les contextes big data. Pourquoi le lan gage Python est un langage très utilisé dans le domaine du traitement des masses de données. Ce cours vous initie à la programmation avec ce langage, particulièrement en utilisant la bibliothèque Numpy. Les fondamentaux de la Business Intelligence // Big Data, Hadoop, Spark, MongoDB and more. Quelles analyses statistiques nécessitent le traitement des données massives et la prédiction. Cette formation vous fournit les concepts élémentaires en statistiques tels que: les variables aléatoires, le calcul différentiel, les fonctions convexes, les problèmes d'optimisation, les modèles de régression. Ces bases sont appliquées sur un algorithme de classification le Perceptron. Description Le MOOC «Fondamentaux pour le big data» permet d'acquérir efficacement le niveau prérequis en informatique et en statistiques pour suivre des formations dans le domaine du big data et data science.

Big Data Les Fondamentaux Style

Evaluation et Certification Chaque partie se termine par un quiz validant les acquis des différentes sessions vidéos. La réussite de ces quiz avec 70% en global permet d'obtenir une attestation de suivi avec succès. Un quiz final faisant suite à un projet validera l'ensemble du MOOC. Vous pouvez passer vos quiz et travailler sur votre mini-projet quand vous le souhaitez. Néanmoins, il faudra patienter un peu pour obtenir votre attestation: il y aura 3 sessions d'évaluation dans l'année: le 16 mars, le 20 juillet et le 22 novembre 2018. Plan de cours Cette formation est précédée d'un quiz de validation de niveau. Elle est constituée de 7 parties et organisée en 6 semaines, chaque partie se termine par un quiz validant les acquis des différentes sessions vidéos. Big data les fondamentaux. Un quiz final faisant suite à un projet validera l'ensemble du MOOC. Introduction: Les enjeux du Big Data et de ce MOOC Python Partie 1 / Algèbre Partie 1 Limites des bases de données relationnelles / Python Partie 2/ Algèbre Partie 2 Probabilités Partie 1/ Analyse Partie 1 Probabilités Partie 2/ Analyse Partie 2 Le classifieur Perceptron

Le data lake et les formats de stockage (HDFS, in memory…), quelle solution choisir? Les outils pour le stockage et la manipulation des données: Le cloud ou on premise? Les bases de données NoSQL MongoDB Cassandra Redis Les bases de données basées sur des graphes: neo4j Hadoop et son environnement Hive, Pig, MapReduce Ranger pour la sécurité Kafka pour le traitement des flux de données Spark pour le traitement de données et le data analytics Les autres solutions pour les données sur le cloud: Snowflake Redshift...

Une Jolie Fleur Chords