270 likes | 407 Vues
Comment optimiser l’aide à la rédaction ?. S. Verlinde KU Leuven - ILT. Aide à la rédaction ?. 1 objectif – 2 composantes aide lors de la production du texte > p redictive writing aid aide lors de la révision du texte > c orrective writing aid ( Ziyuan 2012)
E N D
Commentoptimiserl’aide à la rédaction? S. VerlindeKU Leuven - ILT
Aide à la rédaction? 1 objectif – 2 composantes • aide lors de la production du texte > predictivewritingaid • aide lors de la révision du texte > correctivewritingaid (Ziyuan 2012) 3 langues – 1 site • utilisabilité/ergonomie: efficacité, efficience et satisfaction
Analyse: suites de caractères … bien … Mais aussi: avions, entreprises, …
Analyse: motifs … Ver + Nom … Ver + Det + Nom Ver + Det + Adj + Nom Ver + Adv + Det + Nom Ver + Adv + Det + Adj + Nom Ver + Adv + Det + Adv + Adj + Nom … Nom + Ver
Analyse: parseur? Selon un article cequ'estpubliéeil y a quelquessemaines, 66pour cent des étudiantstravaillecommeJobiste pendant l'été. http://alpage.inria.fr/parserdemo http://beta.visl.sdu.dk/visl/fr/parsing/automatic/trees.php http://www.latl.unige.ch/
Analyse: analyse syntaxique de surface? Ou analyse syntaxiquesuperficielleshallowparsing identification des constituantsd’unephrase (groupesnominaux, verbe) sans structure internefonctions dans la phrase
Enrichissement: ressources • Ressources TAL: Lefff, Dela • Résultatsd’analyses de corpus: Google n-gram
Enrichissement: ressources • Ressources lexicographiques ex. verbes support
Enrichissement: ressources • enseignement
Comments’yprendre? • Ressources TAL/lexicographiques: listes de formes (768385) • Donnéesdiverses: listesd’entitésnommées, de sigles, … • Listesd’erreursfréquentes (enseignement) • Règlesd’orthographe ex. régulier: peer > peren + sap > perensap paardenbloem, depuisle 15.10.2005, auparavant: paardebloemunique: maan > *manen + schijn > maneschijn • ‘Règles’ de composition de mots (analyse de corpus) ex. apparaat + nom > 2: apparaatsnoer, apparaatskosten nom + apparaat > +370 mots composés defensie + nom > +110 mots composés nom + defensie > 1: milieudefensie aanbieding + nom > 0 • Préfixes et suffixes + leur longueur • Néologismes: ‘mesttsunami’ Performances? Cf. Word
Comments’yprendre? • Détectiond’erreurs • Correction des erreurs
Démarche inventaireverbes support (collocatifs - 233) + noms (bases - 673) T. FontenelleDafles Analyse de corpus 673 bases * 233 collocatifs:fréquence + mesured’association structureprédicative des 673 basesidentification de la fonction lexicale Analyse linguistique Programmation PHP Intégration des données
La touche finale… Informationscontextuelles Google n-gram Programmation PHP appariement bases + collocatifsinformationscontextuelles Programmation PHP Interface utilisateur
Référencesbibliographiques • Ferraro, G. - Nazar, R. - Wanner, L. (2011). Collocations: A Challenge in Computer-Assisted Language Learning.http://olst.ling.umontreal.ca/pdf/proceedingsMTT2011.pdf • Heift, T. – Schulze, M. (2007). Errors and intelligence in computer-assisted language learning. Parsers and pedagogues. New York: Routledge. • Leacock, C. - Chodorow, M. - Gamon, M. - Tetreault, J. (2010). Automated grammatical error detection for language learners. San Rafael : Morgan & Claypool. • Verlinde, S. – Peeters, G. (2012). Data access revisited: The Interactive Language Toolbox. In S. Granger – M. Paquot (éds). Electronic Lexicography. Oxford: Oxford University Press. • Wanner, L. – Alonso Ramos, M. – e.a. (2011). Annotation of collocations in a learner corpus for building a learning environment. http://www.dicesp.com/app/webroot/files/file/LCR2011_proceedings_wanner_leo_1_.pdf