Stage Université du Mans, Le Mans, France

Company:  Isca Speech
Location: Le Mans
Closing Date: 01/08/2024
Salary: £40 - £60 Per Annum
Type: Temporary
Job Requirements / Description
Stage Université du Mans, Le Mans, FranceStage Université du Mans, Le Mans, France Evaluation des systèmes de synthèse de la parole dans un environnement bruyant   Sujet L’´evaluation perceptive est capitale dans de nombreux domaines li´es au technologie de la parole dont la synth`ese de la parole. Elle permet d’´evaluer la qualit´e de la synth`ese de mani`ere subjective en demandant `a un jury(5) de noter la qualit´e d’un stimuli de parole synth´etis´ee(1, 2). De r´ecent travaux ont permis de d´evelopper un mod`ele d’intelligence artificielle(3, 4) qui permet de pr´edire l’´evaluation subjective d’un segment de parole synth´etis´ee, ainsi permettant de s’affranchir d’un test par jury. Le probl`eme majeur de cette ´evaluation est l’interpr´etation du mot “qualit´e”. Certains peuvent baser leur jugement sur les caract´eristiques intrins`eques de la parole (tel que le timbre, le d´ebit de parole, la ponctuation, etc) alors que d’autres peuvent baser leur jugement sur les caract´eristiques li´es au signal audio (comme la pr´esence ou non de distorsion). Ainsi, l’´evaluation subjective de la parole peut ˆetre biais´ee par l’interpr´etation de la consigne par les auditeurs. Par cons´equent, le mod`ele d’intelligence artificielle mentionn´e ci-dessus peut ˆetre ainsi bas´e sur des mesures biais´ees. Le projet a pour but de r´ealiser un travail exploratoire pour ´evaluer la qualit´e de la synth`ese de la parole d’une mani`ere plus robuste que celle ayant ´et´e propos´e jusqu’ici. Pour ceci, nous partons de l’hypoth`ese que la qualit´e de la synth`ese de la parole peut ˆetre estim´ee par le biais de sa d´etection dans un environnement r´eel. En d’autre termes, un signal synth´etis´e parfaitement pour reproduire un signal de parole humaine ne devrait pas ˆetre d´etect´e dans un environnement de la vie quotidienne. Bas´e sur cette hypoth`ese, nous proposons donc de monter une exp´erience de perception de la parole en milieu bruyant. Il existe des m´ethodes de reproduction de milieu sonore qui permettent de simuler un environnement existant au casque. L’avantage de ces m´ethodes c’est qu’il est ´egalement possible de jouer un enregistrement d’un milieu r´eel au casque tout en ajoutant des signaux comme s’il avait ´et´e pr´esent dans la sc`ene sonore enregistr´ee. Ceci implique d’une part une campagne de mesure acoustique dans des environnement bruyant de la vie quotidienne (transport, open space, cantine, etc). Ensuite, une g´en´eration de parole synth´etis´ee sera n´ecessaire tout en prenant en compte le contexte des enregistrements. Il sera ´egalement pertinent de faire varier les param`etres de la parole synth´etis´ee tout en gardant la mˆeme s´emantique. Les enregistrements de la vie quotidienne seront ensuite mix´es aux signaux de parole synth´etis´ee pour ´evaluer la d´etection de cette derni`ere. Nous utiliserons le pourcentage de fois que la parole synth´etis´ee sera d´etect´ee comme indicateur de qualit´e. Ces pourcentages de d´etection seront ensuite compar´es au pr´ediction du mod`ele d’intelligence artificielle mentionn´e ci-dessus. Ainsi, nous pourrons conclure (1) si les m´ethodes sont ´equivalentes ou compl´ementaires et (2) quel(s) param`etre(s) de la parole synth´etis´ee engendre une d´etection de cette derni`ere en milieu bruyant. Informations compl´ementaires: • Encadrement: Le stage sera co-encadr´e par Aghilas Sini, maˆitre de conf´erence au Laboratoire d’Informatique de l’Universit´e du Mans ([email protected]) et Thibault Vicente, maˆitre de conf´erence au Laboratoire d’Acoustique de l’Universit´e du Mans ([email protected]) • Niveau requis: Stage de M2 recherche • P´eriode envisag´ee: 6 mois (F´evrier `a Juillet 2024) • Lieu: Le Mans Universit´e • mots-cl´es: parole synth´etis´ee, synth`ese sonore binaurale, test par jury (2) J. Chevelu, D. Lolive, S. Le Maguer, and D. Guennec. Se concentrer sur les diff´erences: une m´ethode d’´evaluation subjective efficace pour la comparaison de syst`emes de synth`ese (focus on differences: a subjective evaluation method to efficiently compare tts systems*). In Actes de la conf´erence conjointe JEP-TALN-RECITAL 2016. volume 1: JEP, pages 137–145, 2016. #J-18808-Ljbffr
Apply Now
Share this job
Isca Speech
  • Similar Jobs

  • Stage Université du Mans, Le Mans, France

    Le Mans
    View Job
  • Urgentiste -Le Mans

    Le Mans
    View Job
  • Cardiologue Médical - Le Mans

    Le Mans
    View Job
  • Tech Lead - Java - Le Mans

    Le Mans
    View Job
  • VITALAIRE - Pharmacien sites - Le Mans

    Le Mans
    View Job
An unhandled exception has occurred. See browser dev tools for details. Reload 🗙