Le Traitement Automatique du Langage Naturel (TALN) ou en anglais Natural Language Processing (NLP) est un des domaines de recherche les plus actifs en ce moment. Bon nombre d’applications font appel à cette technologie pour comprendre ou générer de l’information, mais qu’est-ce que le NLP ?
Quelles sont les grandes étapes de traitement du langage naturel ? Qu’est-ce que la tokenisation, la lemmatisation, le stemming, le POS-tagging ou l’embedding ? On entend parler ces derniers temps de « Transformers », mais de quoi s’agit-il exactement ? On attend beaucoup de la mesure du sentiment ou de la tonalité des verbatim, mais à quoi cela fait-il référence ?
A l’heure où beaucoup d’organisations s’interrogent sur l’apport du NLP dans leurs activités, Carole Lailler & Jean-Luc Marini tenteront d’apporter un regard nouveau sur cette technologie si indispensable au fonctionnement de nos bots.
Texte intégral de l’échange disponible ici.
Podcast: Play in new window | Download