1 / 38

ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO

ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO. Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González Baixauli . Índice. Objetivos Software educativo Síntesis de voz Interfaces animadas Desarrollo de la aplicación Conclusiones.

osma
Télécharger la présentation

ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González Baixauli

  2. Índice • Objetivos • Software educativo • Síntesis de voz • Interfaces animadas • Desarrollo de la aplicación • Conclusiones

  3. Objetivos • Comprender el proceso de síntesis de voz desde un punto de vista teórico y los sintetizadores disponibles. • Estudio en profundidad de las interfaces animadas, centrándonos en Microsoft Agent. • Realización de una aplicación que sirva como introducción al mundo del PC para niños de educación primaria.

  4. Índice • Objetivos • Software educativo • Síntesis de voz • Interfaces animadas • Desarrollo de la aplicación • Conclusiones

  5. Software educativo • Diferentes enfoques dependiendo del alumno al que vaya dirigido • Educación infantil: estimulación sensorial y conocimiento del entorno • Educación primaria: basado en el desarrollo de capacidades como memoria, concentración, razonamiento lógico • Educación especial: Proyecto Fressa

  6. Proyecto Fressa

  7. Índice • Objetivos • Software educativo • Síntesis de voz • Interfaces animadas • Desarrollo de la aplicación • Conclusiones

  8. Síntesis de voz • Visión teórica • Alternativas disponibles

  9. Visión teórica • Front-end • Toma como entrada un texto y produce una representación lingüística fonética • Normalizacion de texto o preprocesado • Texto a fonema • Back-end • Toma como entrada la representación lingüística y produce una forma de onda sintetizada

  10. Síntesis de voz • Visión teórica • Alternativas disponibles

  11. Alternativas disponibles • Festival • Flite • FreeTTS • MBROLA

  12. Festival • El proyecto de Festival comenzó en 1994 en el centro de tecnologías del habla de la universidad de Edimburgo. • Festival esta diseñado para permitir añadir nuevos módulos, fácil y eficientemente, sin que el desarrollador tenga que recorrer camino ya andado

  13. Flite • Flite fue diseñado como una alternativa a Festival que mejorara cuestiones claves para su uso en dispositivos móviles. • Mejor portabilidad, tamaño y velocidad, al estar escrito completamente en C(no en C++ o Scheme)

  14. FreeTTS • Supera los problemas de Flite de dependencia con las plataformas y sus compiladores. • Reescrito totalmente en Java, mantiene la arquitectura de Flite.

  15. MBROLA • El proyecto MBROLA tiene un sintetizador de voz basado en la concatenación de difonos. • Una de las bases de datos de difonos disponibles en español fue desarrollada por profesores de la UVA.

  16. Índice • Objetivos • Software educativo • Síntesis de voz • Interfaces animadas • Desarrollo de la aplicación • Conclusiones

  17. Interfaces de Usuario con personajes animados • Los agentes animados con interfaces conversacionales proporcionan un paradigma intuitivo de interacción ya que el usuario no necesita adquirir nuevos conocimientos. • Los usuarios encuentran estos sistemas más amigables y cooperativos.

  18. Características de Microsoft Agent • Está disponible en la red para descargarlo gratuitamente y puede ser empleado por los desarrolladores en sus aplicaciones sin coste de derechos de autor.

  19. Características de Microsoft Agent • La interfaz de programación de aplicación (API) de Microsoft Agent proporciona servicios de programación entre los que destacan: la habilidad de cargar un personaje, ejecutar una animación, hablar usando un sintetizador de voz y aceptar entrada de voz del usuario.

  20. Índice • Objetivos • Software educativo • Síntesis de voz • Interfaces animadas • Desarrollo de la aplicación • Conclusiones

  21. Desarrollo de la aplicación • Análisis del sistema. Definición del problema • Diseño • Implementación • Pruebas

  22. Resultados de las entrevistas • Los entrevistados fueron estudiantes de la facultad de Magisterio y monitores de ocio y tiempo libre. • Necesidad de una aplicación amena e intuitiva.

  23. Diagrama general de casos de uso

  24. Diagrama inicial de clases

  25. Jugar cuento

  26. Jugar imágenes

  27. Desarrollo de la aplicación • Análisis del sistema. Definición del problema • Diseño • Implementación • Pruebas

  28. Diagrama de clases final

  29. Jugar ingles

  30. Demostración de gestos

  31. Desarrollo de la aplicación • Análisis del sistema. Definición del problema • Diseño • Implementación • Pruebas

  32. Implementación • Entorno de desarrollo: Microsoft Visual Studio.Net • Lenguaje de programación:C# • Paquete de servicios:Microsoft Agent 2.0

  33. Microsoft Agent 2.0 • Character.Show(null); • Character.MoveTo(50,50,null); • Character.Speak("Hola buenas tardes",null ); • Character.Hide(5);

  34. Desarrollo de la aplicación • Análisis del sistema. Definición del problema • Diseño • Implementación • Pruebas

  35. Pruebas

  36. Índice • Objetivos • Software educativo • Síntesis de voz • Interfaces animadas • Desarrollo de la aplicación • Conclusiones

  37. Dificultades encontradas • Las opciones disponibles en síntesis de voz no son tantas. • Si encima añades idioma español,bajo Windows y libre las dificultades son mayores. • La portabilidad de sistemas desarrollados en Linux a Windows no es trivial.

  38. Posibles mejoras • Reconocimiento del habla • Desarrollo en aplicaciones web • Introducción de nuevo elementos.

More Related