Table of content

Transcription temps réel conversationnel

Objectifs du service

Les appels entre clients et conseillers des marques, mais également les conversations multi-locuteurs en interne ou avec des clients ou prestataires sont des sources importantes de données :

d'opportunité ou de transformation commerciales
de mesure de satisfaction
de prévention de menaces
mais également d'auto-évaluation ou d'amélioration du discours.

En exploitant en temps réel ces données, les marques peuvent prendre les actions métiers les plus pertinentes sur le moment. L'accès à ces données et leur croisement avec d'autres sources d'informations (CRM, base de connaissance...) nécessite une transcription de qualité en langage naturel adaptée au contexte, et sa mise à disposition ainsi que son analyse en temps réel.

Réponse Allo-Media

Pour transcrire et analyser en direct des conversations, Allo-Media propose son service Stream transcription for humans. Il permet la transcription dans une même conversation de 1 ou plusieurs locuteurs.

A cette fin, une API permet à toute marque de retranscrire ses conversations, de récupérer leur transcription et leur analyse. Pour ce faire, Allo-Media utilise une brique technique propriétaire de reconnaissance vocale en langage naturel spontané, assurant une transcription adaptée aux contraintes techniques spécifiques à l’environnement téléphonique : qualité sonore dégradée, prise de parole spontanée, coupures de paroles, accents régionaux, nationaux et internationaux divers, etc…

Afin d’accélérer davantage l’exploitabilité de ces données, Allo-Media propose également l’ajout d’éléments d’enrichissement de la transcription, pour à la fois proposer une interprétation de l’intention énoncée (“lundi prochain” = telle date), et favoriser le recoupement de ces données avec des outils tiers comme un CRM par exemple, ou encore assurer un caviardage de ces dernières pour protéger les données personnelles. Ainsi, Allo-Media met à disposition de la reconnaissance d'entités nommées :

Noms, prénoms, et leur épellation
Informations bancaires (IBAN, CB)
Dates, quantités, adresse...

Détails et précisions

Vue d’ensemble de la chaine de traitement

Protocoles d’entrée de la donnée

Pour permettre une transcription des conversations, Allo-Media offre une API pour envoyer l'audio et recevoir la transcription et les éléments d'enrichissement :

une API WebSocket qui reçoit un flux audio en temps réel, et retourne la transcription et l'enrichissement au fur et à mesure. La documentation de cette API est disponible sur notre portail. Nous mettons à disposition des SDK (Python ou JavaScript) afin de faciliter l'intégration de l'API.
- Pour toute demande d'accès, merci de formuler votre demande à : support@allo-media.fr
- Les modalités de connexion seront précisées en retour de cette demande d'accès.

Traitements effectués

Dès lors que des segments d'audios sont transmis par la marque aux APIs Allo-Media, un processus de traitement automatisé s'enclenche.

Selon les options de traitement choisies, les segments d'audios transmis par la marque font l'objet :

d'une transcription (obligatoire), dans la langue choisie et définie au sein de la configuration du traitement (détail au sein de la documentation technique)
d'un enrichissement en matière d'interprétation et de normalisation du résultat de la transcription (optionnel), voir le détail des possibilités décrit au sein de la documentation technique

Protocoles de sortie de la donnée

Dès que les traitements effectués par l'infrastructure Allo-Media sont terminés, la transcription est fournie en instantané, comme décrit dans la documentation technique.

Spécificités réglementaires

Allo-Media agissant en qualité de prestataire, il est nécessaire d'établir avec la marque, seule responsable de traitements des données, un paramétrage adapté à chacun des traitements effectués. Ainsi, sont paramétrables les éléments suivants, agissant sur la disponibilité de la demande au sein des serveurs Allo-Media :

la durée de rétention des transcriptions. Par défaut, la transcription des différents locuteurs n'est pas stockée. En option, un stockage peut être défini de manière temporaire, afin d'évaluer des besoins d'amélioration de la transcription, notamment pour une meilleure adaptation au contexte et au jargon.