Sylvain Daudé DEA ATIAM Modèle statistique de la voix à structure optimisée pour la caractérisation des phénomènes dynamiques Stage réalisé au LIA sous.

  • Published on
    04-Apr-2015

  • View
    102

  • Download
    0

Transcript

Page 1 Sylvain Daud DEA ATIAM Modle statistique de la voix structure optimise pour la caractrisation des phnomnes dynamiques Stage ralis au LIA sous la direction de MM. Bonastre et Linars Page 2 Contexte Traitement automatique de la parole Modlisation statistique de la parole MMG en R.A.L. MMC en R.A.P Dynamique de la parole dure, squentialit, synchronie variations spectrales importance dans le signal de parole Page 3 Problmatique Apprentissage du modle MMG : peu d'information dynamique MMC : de l'information dynamique dans les transitions, mais peu prise en compte lors de l'apprentissage modles de dure infructueux Objectif : prendre en compte les infos dynamiques dans le modle Page 4 Mthode : des donnes au modle Caractres statistiques + infos dynamiques Analyse Modle Correspondance Donnes + dinfos Interprtation ? Page 5 Construction du modle MMG MMC... Diminution du nombre dtats Page 6 Info dynamique dans les MMC ? transitions : squentialit, dure regroupement dtats : synchronie : vraie distribution dun caractre acoustique Vrais. t Etat 1 t Etat 2 Etat 1+2 vraie distribution Page 7 Stratgies de regroupement Similarit des entres-sorties : squentialit, synchronie des chemins parallles Eloignement des entres-sorties : bifurcations, asynchronie des chemins parallles Information mutuelle : synchronie Transitions mutuelles : linaire, squentialit Page 8 Les rsultats 12812711710797877767574737271771 Nombre d'tats du modle -0,5 -0,4 -0,3 -0,2 -0,1 0 0,1 0,2 0,3 0,4 Ecart p/r au hasard (logV) Transitions mutuelles Proximit de profils Eloignement de profils Information mutuelle Page 9 Conclusion Meilleurs modles : squentialit ou synchronie portes par le modle restimation des transitions Gain en complexit Meilleure modlisation de linformation dynamique Page 10 Perspectives Amliorations Concilier synchronie et squentialit Modles de dure Estimation de la qualit Application musicale Page 11 Des questions ? (1) D EA Meilleur chemin Trame1 2Trames3, 4, 5 Trames6, 7 Trame8 9 Vraisemblances trame/tat Vraisemblance du MMC Information mutuelle : ),( )()( ),( log),(),( ba ji ij bpap bap bapjiI Page 12 Des questions ? (2) t Vrais. Etat 1 t Vrais. Etat 2 Etat 1+2 vraie distribution

Recommended

View more >