L’intelligence artificielle est aujourd'hui une part plus qu'importante de l'informatique. Néanmoins, sa présentation dans les grands media relève souvent du fantasme, très éloignée de ce que sont réellement les domaines du Machine Learning ou du Deep Learning. L’objet de cette formation est d’apporter à des ingénieurs ayant déjà une maîtrise des outils informatiques une introduction au Deep Learning ainsi qu’à ses différents domaines de spécialisation et donc aux principales architectures de réseau existant aujourd’hui.

  • Tarif sur demande.
  • Prochaine session : à la demande.
  • Formation accessible aux personnes en situation de handicap.
  • 70% de pratique et 30% de théorie en moyenne.
  • Nombreuses activités pratiques pour une évaluation constante.
  • Supports, exercices et corrections à disposition en ligne pendant et après la formation.
  • Délai d'accès minimum : 1 semaine.
  • Formation 100% distanciel (téléprésence).
  • Evaluation par le formateur à travers les activités pratiques.
  • Public Développeurs, architectes, analystes
  • Prérequis Développement, python

Lors de cette formation, les participants suivent 3 jours de formation.

  • Introduction IA, Machine Learning & Deep Learning
      Historique, concepts fondamentaux et applications usuelles de l’intelligence artificielle loin des fantasmes portés par ce domaineIntelligence collective : agréger une connaissance partagée par de nombreux agents virtuelsAlgorithmes génétiques : faire évoluer une population d’agents virtuels par sélectionMachine Learning usuel : définition.Types de tâches : supervised learning, unsupervised learning, reinforcement learningTypes d’actions : classification, régression, clustering, estimation de densité, réduction de dimensionalitéExemples d’algorithmes Machine Learning : Régression linéaire, Naive Bayes, Random TreeMachine learning VS Deep Learning : problèmes sur lesquels le Machine Learning reste aujourd’hui l’état de l’art (Random Forests & XGBoosts)
  • Concepts fondamentaux d’un réseau de neurones
      Rappel de bases mathématiques.Définition d’un réseau de neurones : architecture classique, fonctions d’activation et de pondération des activations précédentes, profondeur d’un réseauDéfinition de l’apprentissage d’un réseau de neurones : fonctions de coût, back-propagation, stochastic gradient descent, maximum likelihood.Modélisation d’un réseau de neurones : modélisation des données d’entrée et de sortie selon le type de problème (régression, classification...). Curse of dimensionality. Distinction entre donnée multi-features et signal. Choix d’une fonction de coût Approximer une fonction par un réseau de neurones : présentation et exemplesApproximer une distribution par un réseau de neurones : présentation et exemplesData Augmentation : comment équilibrer un datasetGénéralisation des résultats d’un réseau de neurones.Initialisations et régularisations d’un réseau de neurones : L1/L2 régularization, Batch Normalization...Optimisations et algorithmes de convergence.
  • Outils usuels ML / DL
      Une simple présentation avec avantages, inconvénients, position dans l’écosystème et utilisation est prévue.Outils de gestion de donnée : Apache Spark, Apache HadoopOutils Machine Learning usuel : Numpy, Scipy, Sci-kitFrameworks DL haut niveau : PyTorch, Keras, LasagneFrameworks DL bas niveau : Theano, Torch, Caffe, Tensorflow
  • Convolutional Neural Networks (CNN).
      Présentation des CNNs : principes fondamentaux et applicationsFonctionnement fondamental d’un CNN : couche convolutionnelle, utilisation d’un kernel, padding & stride, génération de feature maps, couches de type ‘pooling’. Extensions 1D, 2D et 3D.Présentation des différentes architectures CNN ayant porté l’état de l’art en classification d’images : LeNet, VGG Networks, Network in Network, Inception, Resnet. Présentation des innovations apportées par chaque architecture et leurs applications pUtilisation d’un modèle d’attention.Application à un cas de figure de classification usuel (texte ou image)CNNs pour la génération : super-résolution, segmentation pixel à pixel. Présentation des principales stratégies d’augmentation des feature maps pour la génération d’une image.
  • Recurrent Neural Networks (RNN).
      Présentation des RNNs : principes fondamentaux et applications.Fonctionnement fondamental du RNN : hidden activation, back propagation through time, unfolded version.Evolutions vers les GRU (Gated Recurrent Units) et LSTM (Long Short Term Memory). Présentation des différents états et des évolutions apportées par ces architecturesProblèmes de convergence et vanising gradientTypes d’architectures classiques : Prédiction d’une série temporelle, classification...Architecture de type RNN Encoder Decoder. Utilisation d’un modèle d’attention.Applications NLP : word/character encoding, traduction.Applications Vidéo : prédiction de la prochaine image générée d’une séquence vidéo.
  • Modèles générationnels : Variational AutoEncoder (VAE) et Generative Adversarial Networks (GAN).
      Présentation des modèles générationnels, lien avec les CNNs Auto-encoder : réduction de dimensionalité et génération limitéeVariational Auto-encoder : modèle générationnel et approximation de la distribution d’une donnée. Définition et utilisation de l’espace latent. Reparameterization trick. Applications et limites observéesGenerative Adversarial Networks : principes fondamentaux. Architecture à deux réseaux (générateur et discriminateur) avec apprentissage alterné, fonctions de coût disponibles.Convergence d’un GAN et difficultés rencontrées.Convergence améliorée : Wasserstein GAN, BeGAN. Earth Moving Distance.Applications de génération d’images ou de photographies, génération de texte, super-résolution.
  • Deep Reinforcement Learning.
      Présentation du reinforcement learning : contrôle d’un agent dans un environnement défini par un état et des actions possiblesUtilisation d’un réseau de neurones pour approximer la fonction d’étatDeep Q Learning : experience replay, et application au contrôle d’un jeu vidéo.Optimisations de la politique d’apprentissage. On-policy && off-policy. Actor critic architecture. A3C.Applications : contrôle d’un jeu vidéo simple ou d’un système numérique.