Analyser un nombre trop important de données est quasiment impossible pour un être humain. Trouver des relations entre ces données encore plus. Le Data Mining apporte des solutions pour l'extraction de connaissances à partir de données brutes afin de trouver des relations émergentes entre elles et donc améliorer votre système d’information. Cette formation vous apprendra ce qu’est le Data Mining, ses applications, ses apports pour l'entreprise ainsi que sur les méthodes et outils les plus utilisés.

  • Tarif sur demande.
  • Prochaine session : à la demande.
  • Formation accessible aux personnes en situation de handicap.
  • 70% de pratique et 30% de théorie en moyenne.
  • Nombreuses activités pratiques pour une évaluation constante.
  • Supports, exercices et corrections à disposition en ligne pendant et après la formation.
  • Délai d'accès minimum : 1 semaine.
  • Formation 100% distanciel (téléprésence).
  • Evaluation par le formateur à travers les activités pratiques.
  • Public Développeurs, Chef de projet, Data analyste
  • Prérequis connaître au moins un langage de programmation

Lors de cette formation, les participants suivent 3 jours de formation.

  • Système d'Information Décisionnel
      Les enjeux du SID : besoins, domaines d'application.Architecture type d'un SID, état de l'art.Elaboration des informations décisionnelles.Conception d'un SID : étapes, optimisation, organisation des données, dictionnaires.
  • Data Mining
      Définition et finalité du Data Mining (DM).Quel lien entre le DM et les statistiques, quelle dépendance entre le DM et l'informatique ?Différence entre DM et OLAP ?Les attentes des entreprises, les réponses du DM.
  • Techniques du Data Mining
      Les différentes familles du DM.Les méthodes prédictives et les méthodes descriptives.Analyse factorielle, typologique. La classification…Les arbres de décisions, les réseaux de neurones.Classification des techniques de DM.
  • Clustering
      Définition et méthodologie.Les critères pour structurer les données à classer.Evaluation et validation des classes obtenues.Les différentes sous-familles du Clustering.
  • Applications
      Le scoring : définition, finalité, méthodologie.Le géomarketing : définition, finalité, méthodologie.Qualité des données et administration des données.Processus de collecte et d'exploration.Création d'agrégats et de nouvelles données.Transformation des données.
  • Gérer un projet Data Mining
      Définition du problème métier à résoudre et des objectifs à atteindre.Inventorier, décrire et classer les données.Concevoir et alimenter la base Data Mining.Explorer, segmenter des entités analysées.Etablir et appliquer les modèles d'analyse.Itérer, déployer auprès des utilisateurs.Maintenir le modèle et le logiciel associé.Principaux outils du marché : SAS, R, IBM SPSS…Quels critères de choix pour ce type d'outils ?