Outils pour utilisateurs

Outils du site


enseignement:ml

Les modèles de langages

Cette page est une archive : je ne dispense plus ce cours

Cet enseignement présente les principales méthodes utilisées pour évaluer, estimer et intégrer des modèles de langage dans un cadre stochastique. Les notions abordées sont successivement :

  1. l’évaluation des modèles de langage (Perplexité, Taux d’erreur mot)
  2. les classes d’équivalence d’historiques (L’approche n-gramme, le modèle cache, les modèles exponentiels) ainsi que des alternatives (Modèle par arbres de décision, grammaires probabilistes hors-contexte et grammaires probabilistes lexicalisées)
  3. l’estimation des modèles de langage (Les distributions de probabilités, les différents types d’estimation: maximum de vraisemblance, maximum a posteriori, Good-Turing, …)
  4. les méthodes de lissage (l’interpolation et le repli, les principales méthodes : Jelinek-Mercer, Katz, Witten-Bell, Kneser-Ney)
  5. l’intégration dans un système de dialogue oral (facteur d’échelle, facteurs de pénalité, stockage et accès rapide)
  6. autres exemples d’application (la correction orthographique et grammaticale, la traduction automatique : méthode par analogie)
enseignement/ml.txt · Dernière modification: 2021/12/08 10:52 de janiszek

Outils de la page