1 / 18

Dpto. Señales, Sistemas y Radiocomunicaciones

Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez ftp.gaps.ssr.upm.es/pub/TDV/DOC/ Tema1b.ppt. Dpto. Señales, Sistemas y Radiocomunicaciones. Fonética Acústica: Técnicas de Análisis. Transformación o Filtrado (Tracto Vocal). Excitación Periódica. Segmento Sonoro.

dustin
Télécharger la présentation

Dpto. Señales, Sistemas y Radiocomunicaciones

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Tratamiento Digital de VozProf. Luis A. Hernández Gómezftp.gaps.ssr.upm.es/pub/TDV/DOC/Tema1b.ppt Dpto. Señales, Sistemas y Radiocomunicaciones

  2. Fonética Acústica: Técnicas de Análisis Transformación o Filtrado (Tracto Vocal) Excitación Periódica Segmento Sonoro

  3. Fonética Acústica: Técnicas de Análisis Propiedades acústicas de “segmentos sonoros”: Los sonidos tienen las siguientes propiedades acústicas, que se relacionan con las propiedades físicas: TONO (F. Fundamental) INTENSIDAD Propiedades acústicas: TIMBRE DURACIÓN www.auburn.edu/forlang/Spanish/FLSP0301mats/slides/fonesp-21.ppt

  4. Fonética Acústica: Técnicas de Análisis Tono (altura), Frecuencia Fundamental, Pitch: • Frecuencia Fundamental (F0): frecuencia de vibración de las cuerdasvocales. • En la voz humana, el tono depende del grosor y la elasticidad de las cuerdas vocales. • Rango de variación entre 50 Hz y 400 Hz (mujeres: 220 Hz varones: 120 Hz. • Variación para un mismo locutor en habla “normal”: 1 octava. • Pitch: relacionado con la percepciónde F0 (Ejemplo voz y ancho de banda telefónico)

  5. Fonética Acústica: Técnicas de Análisis Intensidad: • Amplitud o energía de los sonidos (vocales mayor energía “en general”: considerar casos como relajación al final de las locuciones) Duración: • Duración del sonido. • Lenguas como el alemán, el italiano, el latín y algunas variedades del inglés (Received Pronunciation) distinguen entre sonidos largos y breves (p. ej., kin vs. keen). • En español las vocales tónicas son un poco más largas que las vocales átonas, pero esta diferencia no es importante. • En el inglés de EE. UU., las vocales tónicas son considerablemente más largas que las vocales átonas (p. ej., California).

  6. Fonética Acústica: Técnicas de Análisis Timbre: • El timbre está formado por el fundamental y los armónicos. El timbre depende del tamaño, la forma y la composición de las cavidades supraglóticas. • Timbre: relación con respuesta en frecuencia del tracto vocal : permite distinguir los diferentes sonidos (Reconocimiento de Habla)

  7. Segmentos sonoros:(@ J. Ortega EUITT) Vibración de las cuerdas vocales:frecuencia fundamental y armónicos 3-4 Formantes (resonancias del tracto) bien definidos:diferenciación entre sonidos Estructura fina (armónicos) y formantes Estructura periódica, alta energía 0 0.5 -10 0.4 0.3 -20 0.2 0.1 -30 0 Amplitud(dB) -40 -0.1 -0.2 -50 -0.3 -0.4 -60 -0.5 -70 0 1 2 3 4 5 6 7 8 0 5 10 15 20 25 30 35 40 45 Frecuencia(KHz) Tiempo(ms) Fonética Acústica: Técnicas de Análisis

  8. 0 -10 -20 -30 Relación envolvente/frecuencia fundamental Mismo sonido(Misma envolvente espectral) Distinta frecuencia fundamental(Espaciamiento de armónicos) (@ J. Ortega EUITT) Amplitud(dB) -40 -50 Frecuencia fundamental: 196 Hz. Frecuencia fundamental: 122 Hz. -60 0 -70 0 1 2 3 4 5 6 7 8 -10 Frecuencia(KHz) -20 -30 Amplitud(dB) -40 -50 -60 -70 0 1 2 3 4 5 6 7 8 Frecuencia(KHz) Fonética Acústica: Técnicas de Análisis

  9. Fonética Acústica: Técnicas de Análisis Sonido [i]: primer formante 250 Hz - segundo 2000 Hz (aprox.) Sonido [u] : primer formante 250 Hz - segundo 600 Hz (aprox.)

  10. SP 301 Introducción a laFonética y FonologíaEspañolas www.auburn.edu/forlang/Spanish/FLSP0301mats/slides/fonesp-02.ppt Capítulo 2

  11. Clasificación de las vocales (1) a) Localización anterior-posterior • Vocales anteriores:El dorso de la lengua se levanta hacia el paladar duro. • Vocales centrales:El dorso de la lengua se levanta hacia un punto intermedio entre el paladar duro y el velo del paladar. • Vocales posteriores:El dorso de la lengua se levanta hacia el velo del paladar.

  12. Clasificación de las vocales (2) b) Altura: • Vocales altas:El dorso de la lengua se levanta a una altura máxima. • Vocales medias:El dorso de la lengua se levanta a una altura media. • Vocales bajas:El dorso de la lengua se levanta a una altura mínima.

  13. Clasificación de las vocales (3) Triángulo vocálico:Si unimos los puntos más altos que alcanza la lengua en la articulación de las vocales obtenemos una figura llamada“triángulo vocálico” Descripción de las vocales:[i] vocal anterior alta[e] vocal anterior media[a] vocal central baja[o] vocal posterior media[u] vocal posterior alta Redondeamiento: • Las vocales posteriores sonredondeadas(se pronuncian con los labios redondeados). • Las vocales anteriores sonlabializadas(se pronuncian con los labios estirados).

  14. Alta (Cerrada) Baja (Abierta) Posterior Anterior Fonética Acústica: Técnicas de Análisis Carta de Formantes (aproximada)

  15. Fonética Acústica: Técnicas de Análisis Segmento fricativo /s/ Transformación o Filtrado (Tracto Vocal) Excitación Ruidosa Segmento fricativo

  16. 0 0.5 -10 0.4 0.3 -20 0.2 0.1 -30 Amplitud(dB) 0 -40 -0.1 -0.2 -50 -0.3 -0.4 Estructura aleatoria de alta frecuencia Aspecto ruidoso, baja energía -60 -0.5 -70 0 0 5 1 10 2 15 3 20 25 4 30 5 35 6 40 7 45 8 Frecuencia(KHz) Tiempo(ms) Fonética Acústica: Técnicas de Análisis Sonidos sordos: • Constricción tracto sin vibración cuerdas vocales • Formantes (1-2) de alta frecuencia (@ J. Ortega EUITT)

  17. Fonética Acústica: Técnicas de Análisis Modelo simplificado de Producción de Voz (VOCODER) T ; 1/T = Frecuencia Fundamental Filtro IIR (Todo Polos) Tracto Vocal Excitación Sonora Voz Excitación Ruidosa ENERGÍA

  18. Fonética Acústica: Técnicas de Análisis Modelo DINÁMICO • ENERGÍA:garantiza que la energía de la señal sintetizada = energía de la voz original • DURACIÓN:pone de manifiesto el carácter dinámico del modelo. Ritmo, pausas, … • FRECUENCIA FUNDAMENTAL: entonación y acentuación. • INFORMACIÓN PROSÓDICA • (PROSODIA)

More Related