1 / 32

TEHNOLOGIZAREA LIMBII ROM NE: RESURSE LINGVISTICE, APLICATII, INSTRUMENTAR E.Boian, C.Ciubotaru, S.Cojocaru, A.Cole

chelsea
Télécharger la présentation

TEHNOLOGIZAREA LIMBII ROM NE: RESURSE LINGVISTICE, APLICATII, INSTRUMENTAR E.Boian, C.Ciubotaru, S.Cojocaru, A.Cole

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


    1. 1

    2. 2

    3. 3

    4. 4 Informatie morfologica Flexionare automata: Statica Dinamica

    5. 5 Metoda statica: gramatici de flexionare A.LOMBARD, C. GDEI: Dictionnaire morphologique de la langue roumaine, Bucuresti, 1981. accelera V201 accelerat N1 accelerat A2 accelerator M1 accelerator N11 accelerator A66 accent N1 accentua V214 accept N1 accepta V3 acces N1 ....................................................

    6. 6 Gramatica de flexionare Vom numi gramatica de flexionare obiectul G={R,T, ?}, unde R este multimea de reguli, iar T - multimea (ordonata) a seturilor de afixe, ? - simbol ce nu se contine nici n unul din cuvintele limabjului dat.Regulile gramaticale au urmatoarea forma: [ [/]* [# ] [ N1] a1 b1 a2 ... an-1 bn-1 an ? a'1b1a'2 a'n-1 bn-1 a'n N2 ] unde ai, a'i sunt cuvinte arbitatre, iar bi sunt cuvinte nevide sau sunt substituite de simbolul special . Nj sunt numerele ce indica setul de afixe din multimea T.

    7. 7 Interpretarea regulii: partea stnga Fie w cuvntul lema din care vor fi formate cuvintele flexionate. Fiecare semn / indica "retezarea" ultimei litere din cuvntul w. Cuvntul v obtinut n rezultatul taierii consecutive a literelor de la sfrsit este considerat radacina (daca N1 n partea stnga exista); N1 - indicele respectiv n multimea afixe T. n toate cazurile cuvntul v va avea forma: f0 a1 f1 a2 f2 ... an-1 fn-1 an fn, unde fi este un cuvnt arbitrar (posibl vid), ce nu contine cuvntul interzis bi (pentru i=1,2, ... ,n-1) .

    8. 8 Interpretarea regulii: partea dreapta n rezultatul substitutiei paralele se obtine radacina a doua: f0 a'1 f1 a'2 ... a'n fn Se ataseaza setul de afixe N2

    9. 9 Exemplu Grupul M1 1 Grupul M2 2 u ? i 3 Grupul M3 2 t ? t 3 Grupul M4 2 tt ? t 3 Grupul M5 2 d ? z 3 Grupul M6 2 s ? s 3 Rezultant M3 Grupul M3 Regula: 2 t?t 3 N2 {-, ul,ului, ule} N3 {i, ii, ilor}

    10. 10 Gramatica pentru limba romna Gramatica de flexionare pentru limba romna 866 de reguli gramaticale 320 seturi de afixe (subparadigme) Au fost aplicate la obtinerea unui vocabular morfologic de circa 30000 cuvinte-lema.

    11. 11 Metoda dinamica Exista un algoritm de flexionare automata? Exemple: abate verb, substantiv; masa - mase,mese.

    12. 12 Identificarea grupului de flexionare CG={M,F,N,A,V,P} - multimea categoriilor garmaticale ce denota, respectiv, substantive masculine, feminine, neutre, adjective, verbe, pronume. c ? CG , GF- gramatica de flexionare. Lc - lista perechilor (a,), unde a sunt cuvinte de categoria c, iar este numarul grupului de flexionare respectiv. Doua grupuri de flexionare 1 si 2 le vom numi echivalente daca lor le corespunde unul si acelasi set de reguli gramaticale din gramatica GF. Pentru simplificarea expunerii vom exclude din examinare multimea cuvintelor iregulare.

    13. 13 N = max |a| - lungimea maximala a cuvintelor a Lc. Aj={a1j, a2j, ..., akj}- multimea afixelor de lungimea j ale cuvintelor a (j = N). n - lungimea afixului curent. Vom pune n corespondenta fiecarui grup de flexionare o multime S, initial vida. Grupurilor echivalente le va corespunede aceeasi multime.

    14. 14 1. n:=1 2. i: =1 3. Selectam toate cuvintele , care au afixul ain ? An. Stabilim grupul lor de flexionare . 4. Daca toate grupurile de flexionare sunt egale sau echivalente includem afixul ai n multimea S. Urmam pasul 6. Excludem din Lc cuvintele cu afixul ain. 5. Daca cuvintele selectate au grupuri diferite (neechivalente) efectuam urmatoarele verificari: - afixul ain=a' si exista perechile (a ', 1) si (a ', 2) ? Lc. n acest caz cuvntul a' se include n categoria celor partial regulare; -afixul ain=a' si exista perechile (a ', 1) si (a ', 2) unde a''= a'. n acest caz cuvntul a' se include n categoria celor partial regulare. 6. Incrementam i cu o unitate (i = k) si repetam procedeul urmnd pasul 3. Daca i > k incrementam n cu o unitate si urmam pasul 2. Procesul se va sfrsi cnd n > N. 7. Formam reuniunea multimilor, carora le corespunde aceeasi regula gramaticala.

    15. 15 Exemplu de aplicare: substantive masculine af ?{it, ot, pt, ct, lt, ut, et, rt, st, ft, t, ent, ant, int, ont, unt, snt, nat, tat, lat, bat, mat, zat, gat, pat, jat, rat, cat, sat, vat, eat, oat, tat, fat, dat, sat, niat, liat, ciat, uiat, tiat, miat, giat, diat, ariat, triat, priat} ? M3, af ?{tt} ? M4, af ?{d} ? M5, af ?{os, es, as, us, is, s, ns, ps, rs, cs} ? M6 ......................................................................

    16. 16 af ?{b} U{ic,ec,rac,mac,bac,c, uc, dac, oc ,nc, lac, zac, vac, rc, lc, geac, tac, lac, nac, pac, sac, jac, sac, cac} U {fag, arag, arag, bag, mag, ng, og, ug, ig, eg, rg, lg} U {f} U { h} U {j} U {ul, ol, al, ll, sial, cial, til, cil, mil, fil, ril, bil, vil, dil, xil, zil, nil, hil, upil, ral, tal, fal, sal, ibal, nal, lal, mal, pal, gal, dal, ual, val, sal, ghel, fel, udel} U {mn, en, in, on, n, rn, un, vn, gan, can, zan, ban, nan, san, ran, tan, lan, van, han, pan, dan, tan, uan, fan, aolean, oman, aman, rman, iman, esman, osman, hman, bman, sman, atman, lman, dman, rman, badian, radian} U {tap, up, ip, op, rp, mp, ep, cap, sap, rap, lap, nap} U {ur, or, ir, r, rr, ier, ger, mer, per, ler, her, fer, ber, xer, ner, ter, der, zer, jer, ter, ier, ser, rer, ver, ser, gar, safar, tar, har, car, var, bar, car, dar, far, ear, gar, har, iar, jar, mar, par, rar, sar, tar, oar, tar, sar, var, zar, tuar, iuar, ouar, guar, zuar, onar, inar, unar, snar, enar, tnar, arnar, rnar, nar, gnar, mnar, znar, olar, elar, ilar, glar, ular, blar, slar, plar, balar, tanar, lanar, omanar, canar, iermanar} U {v} U{ez, onz, lz, baz, az, z, ruz, auz, moz, guz, tz, muz, suz, luz, iz, mz, anz, laz, uoz, tuz} U {s} U {et, ut, nt, it,cat} ?M1.

    17. 17 Substantive partial regulare {osc} ? M17, M18; {iac} ? M13, M39; {drag} ? M14, M15; {gaci} ? M73, M98; {opil, cal, bel, ocel} ? M1, M12;

    18. 18

    19. 19

    20. 20

    21. 21

    22. 22

    23. 23

    24. 24

    25. 25

    26. 26

    27. 27

    28. 28

    29. 29

    30. 30

    31. 31

    32. 32

More Related