390 likes | 618 Vues
ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO. Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González Baixauli . Índice. Objetivos Software educativo Síntesis de voz Interfaces animadas Desarrollo de la aplicación Conclusiones.
E N D
ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández Domínguez Tutores: Miguel Ángel Laguna Serrano Bruno González Baixauli
Índice • Objetivos • Software educativo • Síntesis de voz • Interfaces animadas • Desarrollo de la aplicación • Conclusiones
Objetivos • Comprender el proceso de síntesis de voz desde un punto de vista teórico y los sintetizadores disponibles. • Estudio en profundidad de las interfaces animadas, centrándonos en Microsoft Agent. • Realización de una aplicación que sirva como introducción al mundo del PC para niños de educación primaria.
Índice • Objetivos • Software educativo • Síntesis de voz • Interfaces animadas • Desarrollo de la aplicación • Conclusiones
Software educativo • Diferentes enfoques dependiendo del alumno al que vaya dirigido • Educación infantil: estimulación sensorial y conocimiento del entorno • Educación primaria: basado en el desarrollo de capacidades como memoria, concentración, razonamiento lógico • Educación especial: Proyecto Fressa
Índice • Objetivos • Software educativo • Síntesis de voz • Interfaces animadas • Desarrollo de la aplicación • Conclusiones
Síntesis de voz • Visión teórica • Alternativas disponibles
Visión teórica • Front-end • Toma como entrada un texto y produce una representación lingüística fonética • Normalizacion de texto o preprocesado • Texto a fonema • Back-end • Toma como entrada la representación lingüística y produce una forma de onda sintetizada
Síntesis de voz • Visión teórica • Alternativas disponibles
Alternativas disponibles • Festival • Flite • FreeTTS • MBROLA
Festival • El proyecto de Festival comenzó en 1994 en el centro de tecnologías del habla de la universidad de Edimburgo. • Festival esta diseñado para permitir añadir nuevos módulos, fácil y eficientemente, sin que el desarrollador tenga que recorrer camino ya andado
Flite • Flite fue diseñado como una alternativa a Festival que mejorara cuestiones claves para su uso en dispositivos móviles. • Mejor portabilidad, tamaño y velocidad, al estar escrito completamente en C(no en C++ o Scheme)
FreeTTS • Supera los problemas de Flite de dependencia con las plataformas y sus compiladores. • Reescrito totalmente en Java, mantiene la arquitectura de Flite.
MBROLA • El proyecto MBROLA tiene un sintetizador de voz basado en la concatenación de difonos. • Una de las bases de datos de difonos disponibles en español fue desarrollada por profesores de la UVA.
Índice • Objetivos • Software educativo • Síntesis de voz • Interfaces animadas • Desarrollo de la aplicación • Conclusiones
Interfaces de Usuario con personajes animados • Los agentes animados con interfaces conversacionales proporcionan un paradigma intuitivo de interacción ya que el usuario no necesita adquirir nuevos conocimientos. • Los usuarios encuentran estos sistemas más amigables y cooperativos.
Características de Microsoft Agent • Está disponible en la red para descargarlo gratuitamente y puede ser empleado por los desarrolladores en sus aplicaciones sin coste de derechos de autor.
Características de Microsoft Agent • La interfaz de programación de aplicación (API) de Microsoft Agent proporciona servicios de programación entre los que destacan: la habilidad de cargar un personaje, ejecutar una animación, hablar usando un sintetizador de voz y aceptar entrada de voz del usuario.
Índice • Objetivos • Software educativo • Síntesis de voz • Interfaces animadas • Desarrollo de la aplicación • Conclusiones
Desarrollo de la aplicación • Análisis del sistema. Definición del problema • Diseño • Implementación • Pruebas
Resultados de las entrevistas • Los entrevistados fueron estudiantes de la facultad de Magisterio y monitores de ocio y tiempo libre. • Necesidad de una aplicación amena e intuitiva.
Desarrollo de la aplicación • Análisis del sistema. Definición del problema • Diseño • Implementación • Pruebas
Desarrollo de la aplicación • Análisis del sistema. Definición del problema • Diseño • Implementación • Pruebas
Implementación • Entorno de desarrollo: Microsoft Visual Studio.Net • Lenguaje de programación:C# • Paquete de servicios:Microsoft Agent 2.0
Microsoft Agent 2.0 • Character.Show(null); • Character.MoveTo(50,50,null); • Character.Speak("Hola buenas tardes",null ); • Character.Hide(5);
Desarrollo de la aplicación • Análisis del sistema. Definición del problema • Diseño • Implementación • Pruebas
Índice • Objetivos • Software educativo • Síntesis de voz • Interfaces animadas • Desarrollo de la aplicación • Conclusiones
Dificultades encontradas • Las opciones disponibles en síntesis de voz no son tantas. • Si encima añades idioma español,bajo Windows y libre las dificultades son mayores. • La portabilidad de sistemas desarrollados en Linux a Windows no es trivial.
Posibles mejoras • Reconocimiento del habla • Desarrollo en aplicaciones web • Introducción de nuevo elementos.