Pour une heure de réunion, la rédaction d’un compte rendu prendra deux heures au minimum. Un ratio défavorable pour des métiers où le temps perdu à des tâches à faible valeur ajoutée est une perte sèche. En partant de ce constat, le Lab IA d’Axys a pensé qu’il y avait sans doute un moyen d’optimiser la rédaction de ces documents à l’aide d’outils motorisés par des IA la rédaction de ces documents. Dont acte, après plusieurs mois de développement, le Lab IA a créé le Smart Report.
Plus qu’une simple transcription de la réunion, le Smart Report comprend :
- La transcription intégrale des enregistrements
- Une identification des locuteurs
- Le relevé de décisions et le plan d’action (identifiés par des tags)
La roadmap produit prévoit également :
- Une méthode extractive des actions au fil de l’eau
- L’identification de l’état d’esprit des participants à la réunion
Compte rendu automatisé : les technologies à l’œuvre
Pour atteindre ce résultat, le Lab iA a utilisé de nombreuses technologies liées à la reconnaissance automatique de la parole. Pour l’indispensable outil de transcription automatique, le Lab iA s’est appuyé sur trois bases de connaissances traditionnelles : un modèle de langage destiné à modéliser la langue et sa grammaire, un modèle acoustique et un dictionnaire de phonétisation pour non seulement différencier les sons inhérents à la langue cible (phonèmes) des différents bruits mais aussi traiter les éventuels accents des locuteurs et leur inventivité de prononciation.
C’est bien l’alliance de ces moteurs et bases de connaissances qui permettent de surmonter toutes les difficultés liées à la transcription avec, en particulier, les nombreux pièges de la langue française : liaisons, difficultés de prononciation, mais aussi homophones hétérographes (les poules du couvent couvent) entre autres spécificités. Pour atteindre un optimal, les premières transcriptions doivent s’appuyer sur un système pondéré construit en fonction d’un corpus spécifique à votre entreprise. Chaque entreprise possède un langage spécifique, un corpus sémantique métier spécifique ou expressions internes, qui doit être appris par l’IA.
Bien sûr le tout s’appuie sur du machine learning pour probabiliser l’existence des différentes suites de mots.
Relevé de décisions : une cartographie lexicale
La première phase de transcription opérée, le Smart Report réalise une extraction de l’information pour générer un plan d’actions et relevé de décisions. Pour ce faire, une première technique consiste à utiliser des tags permettant d’identifier les informations à extraire : « en synthèse de notre réunion, les actions sont les suivantes… ».
Le Smart Report repère ensuite :
- les actions ou décisions,
- les entités nommées. Ces éléments regroupent des dates, des noms propres et autres expressions ancrées dans le monde permettent aux locuteurs de répondre aux canoniques questions : qui, où, quand voire quoi !
Chaque information est ensuite réallouée à son locuteur pour rendre à César ce qui lui appartient.
La 2ème technique, en cours de développement, s’affranchit de l’utilisation de tags. Elle consiste à identifier des verbes d’actions ou de décisions, étudier les relations entre les mots, leur distance lexicale, sémantique, la structure grammaticale. Les données sont ensuite cartographiées pour en extraire les informations saillantes d’un point de vue sémantique.
Un résumé sinon rien
Pour les lecteurs pressés, un résumé se doit d’être fourni. Les approches techniques sont à la fois extractives et abstractives. L’objectif est en utilisant l’algorithme de type BERT de réaliser une véritable analyse sémantique pour générer un texte qui traduit le sens original du propos initial. Pour rédiger ce résumé, une ligne directrice sémantique est créée sur laquelle sont ajoutées les informations pertinentes.Cette fonctionnalité fait l’objet de recherches, en partenariat avec Telecom Paris.
Pourquoi c’est mieux que la concurrence
Google, Nuance, Siri, la transcription de la parole est un domaine difficile sur lequel les géants planchent en permanence.
Mais ces opérateurs ont le défaut de leurs qualités. En travaillant sur de nombreuses langues, leur approche est parcellaire et présente des lacunes dans le traitement final. Sans compter la difficulté à traiter les aléas liés à la spontanéité des locuteurs, les « euh » et autres hésitations et maladresses langagières.
En dédiant des intelligences artificielles à une seule langue, donc un set de données plus réduit, nous allons beaucoup plus loin dans le traitement de tous les pièges tendus par la langue française. C’est un peu le débat de la quantité vs la qualité.
Autre point, le Lab iA prévoit d’implémenter rapidement une transcription de l’état d’esprit des locuteurs. Ces éléments complémentaires permettront de contextualiser l’état émotionnel des personnes grâce à une analyse des sentiments. Une fonction utile dans certains contextes professionnels, en particulier lors des interactions avec des consommateurs.
L’expérience client : la voie royale pour l’utilisation de la transcription automatisée
Tous les centres d’appels de relation client ont en effet un objectif commun : augmenter leur performance. Chacun est convaincu qu’en améliorant leur script, cette performance sera meilleure. En pratique, chaque centre d’appel évalue ses téléconseillers pour vérifier le suivi du script. Reste que sur plusieurs milliers d’appels, cette évaluation est parcellaire car soumise à de faibles échantillons d’écoute. Résultat, les mesures correctives sur les scripts ne seront pas efficaces faute d’une représentativité réelle de l’échantillon. Sans compter que les conseillers peuvent être mal jugés faute d’une étude pertinente.
Avec l’usage du Smart Report, les centres d’appels seront à même d’analyser tous les appels automatiquement. En pouvant exploiter le texte intégral, outre le script, il sera possible d’analyser les centres d’intérêt du client, évaluer le traitement de la problématique, l’évolution de la discussion et des interactions avec une prise en compte du contexte.
Cette approche permettra de débusquer les irritants des clients en se fondant sur l’évolution de son humeur, positive ou négative au fil de l’eau ou l’inverse. Cette approche peut aussi être appliquée aux bots de tous ordres qui seront ainsi à même de traiter le passage de la conversation à un opérateur.
Bref la parole est d’or, mais quand les mots ne suffisent pas à dire les choses, le Smart Report prend le relais.
y aurait-il une projection possible d’adapter le smart report pour mettre en forme , à partir d’un dossier scientifique où sont avancés divers arguments , expériences scientifiques et avis personnel pour avancer une théorie ou une hypothèse générale .
La personne avançant ce projet s’enregistrerait en lisant tous ces « brouillons ».
On pourrait même l’imaginer pour un romancier ayant un style d’expression reconnaissable par l’I.A.il s’enregistrerait et la mise en forme par écrit en fonction de son style de pensée serait réalisée. S’il n’est pas satisfait du résultat , il pourrait l’exprimer et l’I.A s’adapterait à sa demande.
Un code de confidentialité pourrait sécuriser le travail personnel.
Ce n’est pas l’esprit du Smart Report, mais qu’il est toujours possible d’étudier la faisabilité de ce type de projet.
La 1ère étape du Smart Report est de faire une transcription intégrale de ce qui est raconté. La 2ème étape, le RIDA, génère un résumé reprenant les actions à mener par interlocuteurs, les dates etc. Il ne reprend pas les apartés ou les plaisanteries, il s’agit là d’un compte rendu intelligent s’appuyant sur des briques de NLP/NLU.