1 / 27

Reconnaissance et synth se de la parole

Olivier Bo

gretel
Télécharger la présentation

Reconnaissance et synth se de la parole

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


    1. Reconnaissance et synthèse de la parole Quels sont les enjeux ? Quels sont les usages ?

    2. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 2 Une activité humaine

    3. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 3 Les acteurs

    4. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 4 Des services par la voix Avantage médium de communication proche de l’homme, interface simple Inconvénients le canal acoustique peut être encombré phénomène complexe Ingrédients de réussite expérience...

    5. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 5 Des interactions complexes

    6. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 6 Dualité acoustique/linguistique

    7. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 7 L’alphabet des phonèmes

    8. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 8 La parole aspects fonctionnels

    9. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 9 La parole hypothèses simplificatrices Deux informations indispensables matière acoustique = pâte sonore matière prosodique = musique Matière acoustique contenu du message + locuteur Matière prosodique composante linguistique forte mais aussi influence du locuteur

    10. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 10 Hypothèse source/filtre

    11. Reconnaissance de parole

    12. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 12 Reconnaissance de parole Objectif transcription linguistique (mots, phrases) et compréhension d’une parole spontanée énoncée par n’importe quel locuteur Compromis selon les fonctions applicatives visées

    13. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 13 Quels compromis ?

    14. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 14 Où sont les difficultés ? Segmentales le phonème est une abstraction…et n’est jamais prononcé par un locuteur physiologie, état, coarticulation,… Linguistiques Nous ne parlons pas comme nous écrivons ! syntaxe relâchée compréhension ?

    15. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 15 Méthodologie

    16. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 16 Modèles de Markov Cachés [HMM]

    17. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 17 Modélisation linguistique

    18. Synthèse de la parole

    19. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 19 Introduction Objectif d’une machine parlante faire prononcer par une machine un message qui pourrait n’avoir jamais été prononcé auparavant par un être humain Synthèse de la parole à partir du texte Importance d’un tel concept les télécommunications : lecture de courriers électroniques, lecture de lignes d’annuaires téléphoniques les systèmes embarqués (voiture, avion, téléphone l’aide aux handicapés

    20. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 20 Synoptique des traitements Les traitements linguistiques le pré-traitement du texte la transcription orthographique/phonétique l’analyse grammaticale et syntaxique l’analyse prosodique Les traitements acoustiques les méthodes de fabrication du signal de parole la modification des paramètres prosodiques

    21. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 21 Prétraitement du texte En MCMLXXXIX, l ’ORTF a vendu la 2è édit. de 1830 pour 978,45F T.T.C. à M. D*** à 12:15 MCMLXXXIX: nombre romain l ’: apostrophe ORTF: acronyme par lettre 2è: nombre arabe ordinal édit.: abréviation 1830: nombre cardinal 978,45: virgule F T.T.C: abréviations M. : abréviation D***: astérisque 12:15: format heure

    22. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 22 Transcription orthographique phonétique Relation non biunivoque entre les deux ensembles A un graphème peut correspondre plusieurs phonèmes le graphème [X] est prononcé: /k/./s/ dans axe /s/ dans six /z/ dans dixième /g/./z/ dans exact A un phonème peut correspondre plusieurs graphèmes le phonème /è/ se trouve dans: peine, fête, monnaie, tramway

    23. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 23 Calcul de la prosodie Alphabet prosodique élémentaire formes mélodiques: montée, descente,…(F1,F2,…) Indices de coupures: coupures +/- importantes (C1,C2,…) Calcul d’une séquence d ’étiquettes prosodiques à partir de l ’arbre syntaxique et des étiquettes grammaticales 1 étiquette par mot ou groupe de mots, groupes intonatifs Calcul des valeurs de F0 et des durées de phonèmes fonction des étiquettes prosodiques, groupe intonatif, syllabes, phonèmes…et contextes

    24. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 24 Génération à partir du texte Synthèse par mots ou par phonèmes ? Synthèse par mots préenregistrés horloge parlante, annonce des quais de gare Synthèse par phonèmes préenregistrés:

    25. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 25 Génération à partir du texte Synthèse par concaténation d’unités acoustiques « diphone » : segment de parole de la zone stable d’un phonème à la zone stable du phonème suivant. On stocke les transitions entre phonèmes Synthèse par règles on modélise les transitions entre phonèmes, pouvoir explicatif plus important

    26. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 26 Synthèse par juxtaposition d’unités acoustiques

    27. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 27 Synthèse par règles

    28. Olivier Boëffard, IRISA/ENSSAT, projet Cordial 28 Quel avenir scientifique et technologique ?

More Related