80 likes | 173 Vues
Review of progress on codification, encoding, and compression of speech in SYMPATEX project. Presentation at Ministry and RNRT Conference. Discussion on voice modeling and real-time demonstration.
E N D
Projet RNRT SYMPATEX 16ème réunion d’avancement E.N.S.T. Paris, 46, rue Barrault Paris 13 ème 10 décembre 2002 • 10 décembre 2002
Avancement SYMPATEX • Accueil et introduction (15h00) • Bilan des action en cours • Traitement des fichiers d ’évaluation • Codage de la prosodie • Compression livres lus • Autres sujets • Présentation Ministère 10/12/2002 • Colloque RNRT Lille 27/01/2003, contributions poster • Conclusions • Agenda
Avancement SYMPATEX (49) Structure de codage indépendant du locuteur (53) Démonstrateur temps-réel (librairies et interface) (55) Codage de la prosodie (56) Compression de livres lus (57,58) Optimisation de l’espace mémoire • Bilan des actions en cours
Avancement SYMPATEX • Choix des neufs locuteurs Bref (4F, 5H) • j5f, j6f, j8f, jbf • j7m, jdm, jym, k1m, k6m • Définition du corpus d ’apprentissage pour chaque locuteur • Génération des modèles HMM en cours • Diffusion utilitaire sv56 (ITU STL2000) • normalisation en énergie des signaux (-26 dB overload) • Evaluation mode mono locuteur
Avancement SYMPATEX Codage de la prosodie • Alternative au codage du pitch • modèle : • F0_est(n) = g(n) * F0_syn(n) • g(n) = (a * n) + b • quantification de la moyenne de F0_est(n) sur un segment (5 bits/6 bits) • quantification non uniforme de a, (b est estimé au décodeur) • Modification du critère de sélection des segments • pré-sélection des segments de référence par critère de proximité sur le F0 moyen • 1er critère • ré-échantillonnage des spectres à F0 = 100 Hz • calcul d ’un spectre moyen du segment à coder, et du segment de référence • mesure d ’inter-corrélation normalisée sur les spectres • 2ème critère • calcul du profil énergétique sur le segment à coder, et du segment de référence (normalisé) • mesure d ’inter-correlation normalisée des profils énergétiques • 3ème critère : idem 2ème critère appliqué au pitch
Avancement SYMPATEX Estimation du débit • Codage de la classe identifiée (64) 6 bits • Codage du segment (16 parmi N) 4 bits • Codage du pitch moyen 6 bits (5) • Codage du paramètre a (pitch) 6 bits (5) • Codage du gain correcteur 6 bits (5) • Codage longueur (3 à 18 trames) 4 bits • TOTAL 32 bits/segment (29) • 50 ms/segment = 20 segments/sec = 640 bits/sec (580) • 60 ms/segment = 16,7 segments/sec = 533 bits/sec (483)
Avancement SYMPATEX Présentation du projet SYMPATEX • Colloque RNRT à Lille • Lundi 27 janvier 2003 - 16h30/18h30 • Poster (à envoyer avant le 20 décembre 2002) • Contributions ?
Avancement SYMPATEX • Bilan de la réunion • - Liste des actions décidées et en cours • Date et lieu de la prochaine réunion d’avancement • Conclusion