Objectifs pédagogiques de la formation

Cette formation Data Science, les fondamentaux vous permettra de :
  • Savoir reconnaitre une problématique business qui profiterait de l’apport de la data science
  • Mettre en place une gouvernance projet dédié
  • Choisir les bons outils en fonction de la problématique
  •  

    Programme de la formation

    Data science et data mining
    • Introduction au data mining
    • Différence entre data science, data mining, machine learning
    • Les principales méthodes en data science :
    • Le machine learning : réseau de neurone, boosting et bagging, gradient boosting, random forest
    • Le data mining : régression, k-meeans, techniques d’association Introduction au deep learnin
    Principe du big data
    • L’architecture distribuée
    • Principes d’un cluster Hadoop : Le map reduce et Yarn Le HDFS Les daemon
    Les étapes d’un projet de data science
    Overview des principaux outils de la data science
    • Les distributions Hadoop
    • Les solutions open source : les solutions Apache (hive, pig), Python, R Les solutions payantes : SAS, IBM (Modeler, DSX), Dataiku, Datameer, les PaaS (AWS, Microsoft Azure, Bluemix) …
    •  

      Profil du formateur

      Formateur consultant expert en DATA SCIENCE

       

      Modalités d’évaluation

      Auto-évaluation des acquis par le stagiaire via un questionnaire en ligne Attestation de fin de stage remise au stagiaire

       

      Méthode pédagogique

      1 poste et 1 support par stagiaire 8 à 10 stagiaires par salle Remise d’une documentation pédagogique papier ou numérique pendant le stage La formation est constituée d’apports théoriques, d’exercices pratiques, de réflexions et de retours d’expérience