1 / 45

Les « Vocoder »

Les « Vocoder ». Juillet 2001. Comment la parole est produite ?. Les organes. Cavité nasale. Voile du palais. Cavité buccale. Langue. Épiglotte et cordes vocales. Trachée. La production de la parole. Coopération de plusieurs organes: Les poumons produisent une pression d’air.

Télécharger la présentation

Les « Vocoder »

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Les « Vocoder » Juillet 2001

  2. Comment la parole est produite ? • Les organes Cavité nasale Voile du palais Cavité buccale Langue Épiglotte et cordes vocales Trachée

  3. La production de la parole • Coopération de plusieurs organes: • Les poumons produisent une pression d’air. • Cet air circule au travers de l’épiglotte. • Les cordes vocales vibrent et interrompent ainsi le débit d’air provoquant une variation de pression quasi-périodique.

  4. La production de la parole - 2 • Coopération de plusieurs organes: • Pour certains sons dits voisés, vos cordes vocales vibrent (ouverture et fermeture). La vitesse à laquelle les cordes vocales vibrent détermine le ton de votre voix. • Les femmes et les jeunes enfants ont tendance à avoir une grande hauteur (vibration rapide) tandis que les mâles adultes ont tendance à avoir une faible hauteur (de vibration lente). • Pour certains sons fricatifs (ou non voisés), les cordes vocales ne vibrent pas mais restent constamment ouvertes.

  5. La production de la parole - 3 • Coopération de plusieurs organes: • La forme de votre conduit vocal détermine le son que vous faites. • Tandis que vous parlez, votre appareil vocal change de forme pour produire un son différent. • Les modifications du conduit vocal sont relativement lentes (sur l'échelle de 10 ms à 100 ms). • La quantité d'air provenant de vos poumons détermine le volume de votre voix.

  6. La production de la parole - 4 • Impulsions de pression: • Impulsions de tonalité (pitch impulses). • Fréquence du signal de pression: • Fréquence de tonalité ou fondamentale. • Fréquence constante = son monotone.

  7. La production de la parole - 5 • En pratique, la tonalité varie constamment.

  8. La production de la parole - 6 • L’impulsion de tonalité déplace l’air dans la cavité buccale (bouche). • Pour certains sons, la cavité nasale est mise à contribution. • La résonance de ces cavités entraîne la création d’une onde de son qui est le signal de la parole. • Comme la langue et le palais permettent de modifier les cavités, cela nous permet de prononcer plusieurs sons.

  9. La production de la parole - 7 • Fréquence de résonance des cavités: • Fréquence du formant. • Que désigne formant ? • Une des composantes qui permettent de distinguer un son complexe d'un autre, et par exemple un son vocal d'un autre son vocal; les formants sont les fréquences (ou les bandes de fréquence) les plus intenses; on les obtient en faisant l'analyse du son. Réf.: Grand Dictionnaire Terminologique

  10. Exemple de position des organes • Production de « M » et de « T ».

  11. Modèle de la parole humaine • Schéma bloc:

  12. Modèle électronique de la parole humaine • Schéma bloc:

  13. Diagramme d’un système complet (LPC)

  14. LPC Vocoder (Voice Coder)

  15. Diagramme d’un « vocoder » à prédiction linéaire

  16. Vocoder à prédiction linéaire • Paramètres d’un Vocoder: • Articulations : H(z) – Filtre LPC; • Air : u(n) • Vibrations des cordes vocales : V (voisé) • Période de vibration des cordes vocales : T • Consonnes fricatives et plosives : UV (non voisé) • Volume d’air expulsé : G - Gain

  17. Vocoder à prédiction linéaire • Filtre LPC: • Signal de la parole s(n):

  18. On peut transmettre • Vecteur du modèle LPC: • Ce vecteur change à tous les 20 msec. • Si l’échantillonnage est de 8 kH, cela représente 160 échantillons du signal s(n).

  19. Taux de compression • On transmet ce vecteur de 13 valeurs: • Au lieu de ce vecteur de 160 valeurs: • Donc 12.3 X moins de données…

  20. Taux de compression • 160 valeurs de 8 bits à tout les 20 msec donne une cadence de 1280 bits/20 ms ou encore de 64 kbits/sec. • Les paramètres a sont ramenés sur un total de 34 bits. Le gain G est sur 7 bits et le code U/UV,T est sur 7 bits. Donc 48 bits transmit à tous les 20 msec, ce qui donne une cadence de 2.4 kbits/sec. • Compression de 26.67 x…

  21. Sensibilité du vecteur S • Aucune différence perçue: • Si le son est une voyelle ou une consonne non fricative ou non-plosive: • Phase sans importance. • Si le son est une consonne fricative ou plosive: • Séquence de bruit blanc utilisé,

  22. Analyse de la voie(LPC analysis) • Pour un vecteur S donné, déduire le vecteur A. • Soit S: • Sachant que : • On calcule alors l’innovation u(n)

  23. Minimisation de l’énergie contenue dans u(n) • Il faut trouver les ai. On va trouver les coefficients qui vont minimiser l’énergie contenue dans l’innovation u(n). • Calcul de l’énergie contenue dans l’innovation:

  24. Minimisation de l’énergie contenue dans u(n) • L’énergie sera minimale si:

  25. 10 équations à 10 inconnues • Cette dernière opération donne 10 équations à résoudre:

  26. Signification de R(k) • Fonction d’autocorrélation du signal s(n):

  27. L’inversion de la grosse matrice • L’inversion de la matrice 10 X 10 peut être longue à faire(sauf dans MATLAB). • L’algorithme récursif de Levinson-Durbin est plus rapide.

  28. L’algorithme récursif de Levinson-Durbin • Les équations à traiter pour i allant de 1 à 10 inclusivement: i=i+1

  29. Exemple: • Soit R(0)=2.4470x108, R(1)=2.2466x108 et R(2) = 1.7823x108: • Itération #1:

  30. Exemple: • Itération #2: • … et ainsi de suite …

  31. L’algorithme récursif de Levinson-Durbin • Une fois cette série de calculs faits on pose: • Reste à calculer les trois autres paramètres V/UV, G et T.

  32. Calcul du gain G • Équation proposée par Levinson-Durbin: • Variante:

  33. Trouver V/UV, et T • Résoudre cette équation: • Et faire l’autocorrélation de u(n):

  34. Décision basée sur l’autocorrélation • Spectre de l’autocorrélation: Son non voisé Son voisé

  35. Structure en échelle • La structure en échelle du filtre IIR peut s’appliquer: • Utilisation directe des coefficients kicalculés lors de l’algorithme précédent.

  36. Indice de qualification de la qualité de la parole

  37. Plage des amplitudes sonores • Oreille humaine – échelle logarithmique

  38. Plage des amplitudes sonores • La plage dynamique de l’oreille (inaudible à intolérable) est d’environ 20 bits. • De 1 à 106. • En pratique, stocké sur 16 bits, dont 12 sont significatifs. • Qualité téléphonique : • 8 kHz et 12 bits.

  39. Fenêtrage - rectangulaire • Exemple: • Fonction sinusoïdale échantillonnée. • Fenêtre rectangulaire.

  40. Spectre sinus + fenêtre rectangulaire

  41. Spectre sinus + fenêtre rectangulaire

  42. Fenêtrage - Hamming • Exemple: • Fonction sinusoïdale échantillonnée. • Fenêtre de Hamming.

  43. Spectre sinus + fenêtre de Hamming

  44. Spectre sinus + fenêtre de Hamming

  45. Compaison

More Related