Programme Court Natural Language Processing NLP

Direction pédagogique : Salim NAHLE

Format

Présentiel

Durée

4 Jour(s)

Session

Toute l'année

Coût

2100 €

Présentation

Ce cours décrit les outils et techniques nécessaires pour l’exploration, le traitement et l’analyse des données textuelles. Il montre comment appliquer des techniques d’apprentissage automatique (machine learning) et d’analyse de données sur du texte pour le transformer en données compréhensibles par machine, et appliquer des opérations telles que l’analyse des sentiments, la détection de spam, la traduction automatique, etc. Ce cours se concentre sur l’application de techniques d’apprentissage profond (Deep Learning), sans aller profondément dans la théorie mathématique mais plutôt en utilisant des modèles pré-implémentés pour les tâches du NLP (Natural Language Processing)

Objectifs

  • Comprendre les différentes applications de l’analyse de texte et le rôle du NLP.
  • Apprendre à collecter et à traiter des données textuelles brutes et à les transformer en informations interprétables par la machine.
  • Apprendre le concept du word embedding et les différentes transformations du texte dans l’espace vectoriel.
  • Appliquer la régression logistique et la méthode Bayésienne pour analyser des sentiments, résumer de texte et traduire des mots.
  • Utilisez des réseaux de neurones récurrents (RNN) et des LSTM pour l’analyse des sentiments, la génération de texte et la reconnaissance d’entités nommées.

Moyens techniques

En fonction du format, distanciel via l’outil Teams, en présentiel, salle de formation équipée de postes de travail informatiques disposant de tous les logiciels nécessaires au déroulement de la formation, salle moderne climatisée, accès à l’environnement numérique Efrei.

Pédagogie & ressources

La formation s’articule autour d’exposés, d’ateliers pratiques et de partages de retours d’expérience.

Programme

Introduction au NLP
Plus de détails
  • C’est quoi le NLP
  • Applications du NLP
  • Défis du NLP
Term frequency inverse document frequency (TFIDF)
Plus de détails
  • bag-of-words
  • vectorization
  • term frequencies
  • vector space in NLP
  • document similarity
  • calculation
  • Zipf’s law
  • inverse document frequency
Convolutional Neural Networks (CNN)
Plus de détails
  • introduction
  • filters
  • padding
  • convolution in NLP
Prétraitement de texte
Plus de détails
  • Collecte de données  (web scraping, social media, open data sources)
  • tokenization
  • stopwords
  • stemming
  • lemmatization
Word Embeddings
Plus de détails
  • word vectors
  • vector-oriented reasoning
  • Word2Vec
  • other word embedding libraries (GloVe, FastText)
  • visualization
  • document similarities with Word2Vec
Recurrent Neural Networks (RNN)
Plus de détails
  • CNN vs RNN
  • recurrence in neural networks
  • applications of RNN
Extraction d’information
Plus de détails
  • Part-of-speech (POS) tagging
  • Named-entity recognition (NER)
Neural Networks
Plus de détails
  • introduction
  • the perceptron
  • back propagation
Long Short-Term Memory (LSTM)
Plus de détails
  • introduction
  • LSTM structure
  • LSTM applications
Introduction au NLP
Plus de détails
  • C’est quoi le NLP
  • Applications du NLP
  • Défis du NLP
Prétraitement de texte
Plus de détails
  • Collecte de données  (web scraping, social media, open data sources)
  • tokenization
  • stopwords
  • stemming
  • lemmatization
Extraction d’information
Plus de détails
  • Part-of-speech (POS) tagging
  • Named-entity recognition (NER)
Term frequency inverse document frequency (TFIDF)
Plus de détails
  • bag-of-words
  • vectorization
  • term frequencies
  • vector space in NLP
  • document similarity
  • calculation
  • Zipf’s law
  • inverse document frequency
Word Embeddings
Plus de détails
  • word vectors
  • vector-oriented reasoning
  • Word2Vec
  • other word embedding libraries (GloVe, FastText)
  • visualization
  • document similarities with Word2Vec
Neural Networks
Plus de détails
  • introduction
  • the perceptron
  • back propagation
Convolutional Neural Networks (CNN)
Plus de détails
  • introduction
  • filters
  • padding
  • convolution in NLP
Recurrent Neural Networks (RNN)
Plus de détails
  • CNN vs RNN
  • recurrence in neural networks
  • applications of RNN
Long Short-Term Memory (LSTM)
Plus de détails
  • introduction
  • LSTM structure
  • LSTM applications

Informations pratiques

  • Prérequis
    • Connaissance basique du Python
    • Connaissance basique du machine learning et reseaux de neurones
  • Profil du participant

    Ingénieurs ou chef de projet data/IA ayant une premiere experience en machine learning et en Python

  • Modalités d'évaluation
    • Évaluation des acquis tout au long de la session par des travaux pratiques.
    • Questionnaire de validation des compétences acquises en fin de formation
    • Projet à réaliser en groupe et à restituer en fin de formation.

    Sanction de la formation :

    • Une attestation de fin de formation résumant les objectifs visés par la formation est remise au participant à l’issue de la formation.

Intra-entreprise

Vous souhaitez adapter cette formation aux besoins spécifiques de votre organisation et pour vos collaborateurs ?

Nous pouvons décliner ce programme au format intra-entreprise pour vos équipes.

Rejoindre Efrei Executive Education

Cette formation vous intéresse ?