1 / 31

Semantica și pragmatica limbajului natural

Semantica și pragmatica limbajului natural. Daniela Gîfu. Cursul nr. 1. De la lingvistică teoretică la lingvistică computațională. Distincții conceptuale: limbaj, act lingvistic, limbă - I.

palani
Télécharger la présentation

Semantica și pragmatica limbajului natural

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Semanticași pragmatica limbajului natural Daniela Gîfu

  2. Cursul nr. 1 De la lingvistică teoretică la lingvistică computațională

  3. Distincții conceptuale: limbaj, act lingvistic, limbă - I Lingvistica - ştiinţă a limbajului, glotologie sau glosologie (fr. linguistique sau science dulangage, ital. linguisticasauglottologia, germ. Sprachwissenschaft, engl. linguistics). şi, maipuţinpropriu,filologie, filologie comparată, gramatică comparată. Lingvistica - ştiinţa care studiază limbajul uman articulat, în general şi în formele sale specifice de realizare(actelingvistice)şiîn sistemele de izoglose care, tradiţionalsauconvenţional, se numesclimbi. Lingvistica – “studiulștiințific al limbii” (Lyons, 1995). Lingvistica – “studiulștiințific al limbajuluiomenesc” (Martinet, 1970). Lingvistica – studiază “toate manifestările limbajului uman” (Saussure, 1998). Obs 1: lingvisticalingviştilor, adicălingvisticaîn calitate de ştiinţă, nu trebuieconfundată cu cunoaştereapractică a limbilor.

  4. Cofuzii conceptuale I. lingvistşilingvistică II. lingvistică și filologie filologie– o ramură a lingvisticii (gramaticacomparată) – Anglia - comparativephilology- pentru a indicagramaticacomparatăşi, uneori, chiarpentru a desemnalingvisticaîn totalitateaei. Corect ar filinguistics. – Italia – lingvisticae glottologia(din gr. glotta, „limbă"), după numeledisciplineiLingvistică generală. Corect ar filinguistica. filologie–lingvisticispeciale (ex: filologiaromanzaşifilologiagermanicapentrudisciplinele de lingvisticăromanică, respectivgermanică). • în sens strict: filologie – critica textelor; • în sens amplu: filologie - ştiinţatuturorinformaţiilor care se deduc din texte. Obs 2: filologiase ocupă, în general, de fapte de istorie, mai ales veche, în special socialăşiculturală (literară), în timpcelingvisticastudiazăfapte de limbăsau, mai curând, de limbaj.

  5. Ce este lingvistica generală? Humboldt și Saussure Humboldt - Valorificareaactuluilingvistic ca aspect fundamental al limbajului. • limbajul ca energeia- creare continuă deacte lingvistice individuale, ca ceva dinamic; - limbajul ca ergon - „produs" sau „lucru făcut", ca sistemrealizat istoriceşte ("limbă"). Saussure – două aspecte esențiale ale limbajului: - parole(vorbire, act lingvistic) - activitatea de vorbire -aparţine individului. - langue(limbă) - norma, sistemul lingvistic care se realizează în vorbire -aparţine societăţii. II. Lingvisticagenerală- lingvisticăteoretică/ teorie a limbajului, caracterulpreponderentteoreticşimetodologic al acesteiştiinţe vs. Lingvisticăempirică -studiul particular al anumitorlimbi. III. Lingvisticagenerală- cuprindelingvisticateoretică+ ansamblul de ştiinţelingvistice „generale“ (fonetica, semantica, gramaticagenerală, stilistica etc.).

  6. Limbaj. Semn. Simbol Limbaj - orice sistem de semne care serveşte la intercomunicare. Limbaj - orice tip de comunicare între fiinţe capabile să se exprime (oameni sau animale). Limbaj- obiectul propriu al lingvisticii. OBS 1: lingviştii nu acceptă limbajul animal ca obiect al cercetării lingvistice, pentru că nurecunosc în el caracteristicile esenţiale ale limbajului uman. Sistemele de semne simbolice- limbajul articulat, toate sistemele de semnalizare (cu fanioane, cu semnale luminoase etc.) şi orice alt sistemcare exprimă sau comunică ceva în mod simbolic şi convenţional. Ex: arta, semnalele rutiere. OBS 2: multe din aceste limbaje sunt „traductibile" în limbajul articulat.

  7. Trăsături generale ale limbajului – Hocket, 1958 • Utilizarea aparatului audio-fonator; • Caracterul direcțional al emiterii și receptării mesajului; • Dispariția rapidă a emisiei sonore; • Caracterul interșanjabil al poziției emițătorului și a receptorului (“caracterul dialogal”); • Retroactictivitatea; • Specializarea; • Semanticitatea; • Arbitrarietatea; • Caracterul direct; • Caracterul substitutiv; • Caracterul deschis; • Caracterul cultural; • Dubla articulare; • Capacitatea de stimulare a comunicării; • Reflexivitatea; • Posibilitatea învățării oricărui sistem de comunicare (ex. poliglosia).

  8. Semn și simbol Semn- un „instrument" careserveşte la redareauneiidei, a unui concept sau a unui sentiment, cu care semnulînsuşi nu coincide: Semne - faptele înseşi aleunui „context", în măsura în care prezenţa unuia dintre ele reclamăsau implică posibilitatea ori necesitatea de a apărea şi alt(e) fapt(e) aparţinind aceluiaşi „context". SEMNELE LIMBAJULUI UMAN AU ÎNTOTDEAUNA VALOARE SIMBOLICĂ. „Context"- oriceansamblu de fapte care se află de obicei într-o relaţie necesară sau, cel puţin, obişnuită (psihologii,behavioriştii). Semnul lingvistic- simptom caexpresie a vorbitorului; - semnalîn relaţie cu receptorul; - simbol în raport cu semnificatul său „real”.

  9. Actul lingvistic Nu există limbi, ci numai acte lingvistice de expresie și comunicare (Coșeriu). În limbaj ExistăNu există identitate între intuiţie şi expresie între expresie şi comunicare/receptare între expresia lui A şiintuiţialui B. Actul lingvistic - act eminamente individual, determinatsocial prin însăşi finalitatea sa:„a spune cuiva ceva despre ceva". Actullingvistic- poatecelmai important concept al lingvisticiimoderne; unica realitate concretă a limbajului.

  10. Limba – noțiune abstractă - Limba- ansamblul actelor lingvistice practic identice ale unei comunităţi de indivizi. - Limba- ansamblu de acte lingvistice comune virtuale: înconştiinţa noastră limba - sistem, model. Clz: D.p.d.v. lingvistic, limita dintre „limbi" esteconvenţională, aşa cum este şi limita dintre dialecte. - Limba - sistem de izoglosestabilit convenţional, care însumează ceea ce este comun expresiilor unei comunităţi sau chiarşi unui singur individ în epoci diferite. Ex: limba spaniolă - sistemul de izoglose caracteristic spaniolilor şi tuturorindivizilor care aparţin comunităţii lingvistice spaniole. Accepții particulare: (a) limbi speciale, (b)limbi artificiale (a) - vorbirile caracteristice unor grupuri sociale sau profesionale, precumşi limbajele tehnice (ex. argouri). (b)- sistemele lingvistice construite ca posibile instrumente de înţelegere internaţională, deasupra limbilor naţionale (ex. esperanto).

  11. Domeniul Lingvisticii Computaționale și al Prelucrării Limbajului Natural Lingvistica computaţională (LC) [computational linguistics] – zonateoretică Prelucrarea limbajului natural[natural language processing] – zona aplicativă Studiul limbajului uman din două perspective: • unul teoretic - adăugarea metodelor de investigare a limbajului, utilizate de lingvistica clasică, aparatul teoretic şi experimental al informaticii. • unul experimental - realizarea dezideratului ca omul să poatăcomunica cu maşina în limbaj natural, modul cel mai natural pentru el. • tehnologia limbajului natural, natural language technology (NLT) • tehnologia limbajului uman, human language technology (HLT)

  12. Studierea limbajului uman ca mijloc de comunicare om-maşină maşină-maşină om-om. Scop: TRANSFORMAREA IMENSEI ACUMULĂRI DE CUNOŞTINŢE UMANE ÎNTR-O ZONĂ DE EXPLORARE AUTOMATĂ. Instrumentele de lucru: teoretice, empirice şi aplicative. Un domeniu pentru lingvişti şi informaticieni, dar mai ales pentru lingvişti-informaticieni. - Teoriile lingvistice dobândesc o exprimare formală. - Formalismul computaţional oferă posibilităţi mai expresive de descriere a intuiţiilor lingvistice. Buna coabitare lingviști – informaticieni FORMALIZĂRILE DIN LINGVISTICĂ AU FOST PRELUATE DE INFORMATICIENI PENTRU A PLASA PE ELE ANSAMBLUL LIMBAJELOR FORMALE. Domeniul LC & PLN

  13. anii ‘60 – Warren Waver – memorandum / traducerea automată posibilă; anii ‘70 – sistemulSystran (și azi în Comisia Europeană). azi două metode: simbolice (pt. lingviști) și statistice (pt. informaticieni). cercetarea americană / sovietică / vest-europeană: Cercetări lexicografice asistate de calculator (ex: e-DTLR). Modele de “traducere directă”. Analiza sintactică. Dezambiguizarea sensurilor și alegerea lexicală. Analize statistice asupra limbajelor naturale. Propuneri de reprezentări interlinguale. Gramatici de dependență (de la Chomsky la Sag&Pollard) . Lingvistică matematică (Solomon Marcus). Lingvistica computațională – istoric și problematici

  14. Ivan A. Sag • Carl J. Pollard Noam Chomsky • a transformat fundamental domeniul psihologiei, prin ideile sale despre originea limbajului. • contribuțiile în domeniul lingvisticii,axate pe teoria gramaticii, semantică și procesarea limbajului. • inventatorul așa-numitei Head grammar și ordinii superioare a gramaticii. • 1 și 2 - co-inventoria Head-driven phrase structure grammar (HPSG). • Unitatea de bază - semnul. Subunități – cuvântul și fraza. • cunoscut pentru "teoria gramaticii generative" şi pentru revoluţionarea întregului sistemul lingvistic modern prin celebrele sale modele generative.

  15. e-DTLR (Iași, București, Cluj) include un parser al intrărilor dinDLR. Etape: copierea şi scanarea paginilor dicţionarului;transpunerea prin OCR-izare a lor într-un format (html) care săpermită identificarea zonelor cu particularităţi tipografice; corectarea greşelilor de OCR-izare, operaţie manuală şi de rutină;extragera câmpurilor (din html în xml); reconversia grafică a intrărilor pentru generarea unui format care, tipărit, să arate identic cu cel original;corectarea finală;actualizarea dicționarului. WordNet (Universitatea Princeton, George Miller.) organizeazăsubstantivele, verbele, adjectiveleşiadverbelelimbiienglezeînseriisinonimice, numitesynseturi, fiecarereprezentândmodalităţi de realizarelexicalăînlimbaengleză a conceptuluiceabstractizeazăînţelesulcomun al seriei (Fellbaum, 1998). Synseturile- legate prinrelaţii de naturăsemantică(hipernimieşihiponimie) (http://www.cogsci.princeton.edu/~/). Cercetări lexicografice

  16. Limbajul vorbit Limbajul scris Limbajul în corelaţie cu alte modalităţi de expresie (multimodalitate) Temă seminar: exerciții RACAI (http://www.racai.ro/webservices/) Instrumente UAIC - (nlptools.info.uaic.ro) Tehnologia limbajului natural

  17. Interpretarea vocii reprezentarea semnalelor vocale recunoaşterea vorbirii analiza prozodiei recunoaşterea vorbitorului Sinteza vocală Tehnologiile limbajului vorbit

  18. Tehnologii primare - I Analiza imaginii documentelor Recunoaşterea caracterelor de tipar Recunoaşterea caracterelor de mână Optical Character Recognition (OCR) Tehnologiile limbajului scris Analiza şi înţelegerea limbajului - II • prelucrări sub-sintactice • unităţile lexicale • graniţele de frază • granițele de propoziții • partea de vorbire şi marca morfologică • lema • numele de entităţi • grupurile (nominale, verbale, prepoziţionale etc.) şi atracţiile lexicale (colocaţii) Analiza şi înţelegerea limbajului - III • prelucrări sintactice • formalisme gramaticale • parsarea  structura sintactică a frazei

  19. Ambiguitate inerentă a limbajului natural. Înțelesuri • în sens logico-lingvistic - o pluralitate de semnificații care nu se subsumează unui act obişnuit de semnificație decât lăsând loc unui echivoc. • echivocitate - când aceluiaşi nume îi corespund înțelesuri diferite. La nivelul frazei, ambiguitatea poate porni de la folosirea unui termen neclar sau de la o ambiguitate structurală. Ex: libertate, dreptate, bun.(ambiguitate lexicală). Eemeren şi Grootendorst - analiza sofismelor utilizării limbajului, determină patru factori principali care conduc la ambiguitate lingvistică: • implicitul funcției comunicative. • necunoaşterea termenilor şi expresiilor. • ambiguitatea referențială. • vaguitatea (obscuritatea). Ambiguitate- când unui cuvânt, enunț sau discurs ise pot ataşa două sau mai multe înțelesuri (parțial) contrare sau când acestea desemnează mai mult decât simpla semnificație directă, literală, întrucât, sensul depinde de competența lingvistică a locutorului.

  20. Ambiguitatea limbajului natural. Lexicală Omonimiaşiambiguitatea pot fiîntâlnite la nivelurilefonetic, lexical, morfologic, sintacticşistilistic (Gh. N. Dragomirescu, 1975). Lexicală – acelașicuvânt diverse înțelesuri. Jocurile de cuvinte. Omonimele- cuvinte cu formăidenticăşiacelaşicorpfonetic, dar cu înţeles total diferit: Ex: Barcapluteştepelac.Eu am o rochienouă.Am dat cu lacpeunghii. El a luat nota nouăla  istorie.  Tipuri: (a) lexicale; (b)lexico-gramaticale; (c) morfologice.  (a) totale - omonimele  care au formeflexionareidentice: leu / leu---------lei / lei   Mai am  doar un leuînbuzunar. Mai am doardoileiînbuzunar.  De la circ a scăpat un leu.  Am  văzutmulţilei la Zoo.  parţiale- omonimele nu au  formeflexionareidentice:Masa: mese (de bucătărie) / mase (de oameni)Bandă:bande (de răufăcători) / benzi (magnetice) 

  21. Ambiguitatea limbajului natural. Lexicală • (b) - cuvinte cu formă identică, dar care sunt părţi de vorbire diferite: Ex:   Noi:- adjectiv:- pronume:Am  caiete noi.Noi plecăm imediat.  • Ex: Nouă:- adjectiv: - numeral:Am o rochie nouă.  Am obţinut nota nouă la istorie,  • Ex: Poartă:- substantiv: - verb:Am o poartă mare.El poartă o vestă  verde. • Obs: A nu se confunda, deși în anumite contexte e posibil. Ex: masă - omonimcu sensul de mulţime: În fața Parlamentului era o masă de oameni. • cuvintele polisemantice (au sensuri apropiate, fiind derivate din sensul primar: ex. masă - obiect de mobilier; masă - mâncare, ospăţ.  • cu omonimele (nu au legătură de sens între ele: ex. - bancă - din parc; bancă -  unde se depun banii. 

  22. Ambiguitatea sintactică. Niveluri Omonimia sintactică - noi valenţe ştiinţifice odată cu apariţia gramaticii generativ-transformaţionale prin lucrările lingvistului Noam Chomsky (Aspects of the Theory of Syntax, Syntactic Structures etc.) & competența lingvistică. Omonimiasintactică- existenţaunorstructurisintacticecuorganizare şi componenţă identice, dar cu posibilităţi diferite de interpretaresemantică. Ambiguitatea sintactică (omonimia sintactică,amfibolie) - o consecinţă a omonimieisintactice; apare atunci când ordinea cuvintelor permite două sau mai multe interpretări (arboridiferiți de analiză). Situaţii cu exemplificări: ● construcţiile cu pronumereflexiv; ● construcţiile cu predicativsuplimentargerunzial; ● construcţiile cu genitivul (genitivulsubiectivvsgenitivulobiectiv); ● construcţiile cu forme cazuale de genitiv şi dativ (omonimia morfologică G/D) ş.a.

  23. Ambiguitatea sintactică - I I. Ambiguitatea gerunziului L-am auzit plângând– posibile interpretări semantico-sintactice: (a) Am auzit (eu) că (el) plângea < L-am auzit că plângea (gerunziul este echivalentul unei propoziţii subordonate, predicativă suplimentară); (b) L-am auzit când plângea (gerunziul este echivalentul unei propoziţii subordonate, circumstanţială temporală). II. Genitivul subiectiv (Gs.) vs. genitivul obiectiv (Go.) Gs arată cine face acţiunea, corespunzând astfelsubiectului din structura de adâncime şi actualizând rolul de AGENT: Ex: sosirea profesorului < Profesorula sosit/sosește (sosirea este un substantiv de origine verbală). Go determină nume de acţiune sau de agent şi actualizează rolul de PACIENT: Ex: realizatorul/ realizarea emisiunii < Cineva a realizat emisiunea.

  24. Ambiguitatea sintactică – II • Ambiguitatea participiului - Participiul are o istorie derivativă diferită, în funcţie de calitatea verbului debază. • (a) Dacă verbul este tranzitiv, transformarea participială este precedată derelativizare, urmată de suprimarea relativului, iar, în plus, intervine şi pasivizarea: • → pasivizare: *tractoare^care^românii realizează tractoare la Braşov; • → relativizare: tractoare^care^sunt realizate de români la Braşov; • → transformare participială: *tractoare^care realizate de români la Braşov...; • → suprimarea relativului: tractoare realizate de români la Braşov. • (b) Dacă verbul este intranzitiv, transformarea participială este precedată derelativizare, urmată de suprimarea relativului: • → *elevii^care^eleviirămân repetenţi din cauza absenţelor; • → *elevii^care rămân din cauza absenţelor; • → *elevii care rămaşi repetenți din cauza absenţelor; • → elevii rămaşi repetenţi din cauza absenţelor.

  25. Ambiguitatea sintactică – II’ • Ambiguitatea participiului • (c) Mai rar, participii „active” ale unor verbe tranzitive: om băut „care a băut”; se aplică transformările de la (b), • cărora li se adaugă transformarea de suprimare a complementului direct: • → suprimarea complementului direct: omul^care^omul a băut ceva; • → omul^care^omul a băut ceva; • → relativizarea: omul^care a băut; • → transformarea participială: *omul^carebăut; • → suprimarea relativului: omul băut. • Obs: există posibilitatea interpretării participiului îndouă feluri – pasiv (a) şi activ (c). • Ex: sintagma drum ocolitpermite două interpretări:drum care ocoleşte (activă) şi drum care este ocolit de cineva (pasivă).

  26. Ambiguitatea sintactică – III • Atribut pronominal datival – complement indirect datival • Triada (GALR; 2005) • atribut pronominal datival – complement indirect datival –complement posesiv • - Complementul posesiv - un component al grupului verbal, exprimă “obiectul posedat” ,,obiectul posedat” (în sens larg) • Ex. Ion îşi iubeştepărinţii. • - Complementul indirect – pronumele (reflexiv) în cazul dativ,dacă apare în propoziţiealături de un substantiv/de forma accentuată a pronumelui cu rol de complementindirect. • Ex. Şi-a luat pălărie (sieşi). • - invers, dativul posesiveste atribut pronominal datival când posibilitatea de a apărea împreună cusubstantivul sau cu pronumele accentuat este exclusă. • Ex. Mi-am spălat haina(mea) vs. Mi-am spălat o haină (mie).

  27. Ambiguitatea sintactică – IV • Atribut substantival genitival – complement indirect datival • Omonimia cazuală genitiv-dativ - două interpretări ale raporturilor sintactice. • Ex. I-am dat cartea acestei eleve. • Subst. eleve esteambiguu, primind două interpretări: • ca genitiv, dacă se consideră că este determinantal substantivului cartea, eleve - poziţia sintactică de atribut substantivalgenitival • ca dativ, dacă se consideră că este determinant al verbului am dat,eleve -poziţia sintactică de complement indirect datival. • Obs1. dubla interpretare - articularea hotărâtă a substantivului cartea. Dacă substantivul cartea ar fi articulatnehotărât (I-am dat o carte acestei eleve), singura soluţie rămânând interpretarea de dativ, complement indirect. • Obs 2. determinantul acesteicondiţionează coocurenţa celorlaltedouă lexeme: cartea şi eleve (ilustreazărelaţia decomplementaritate dintre omonimia şi ambiguitatea morfologică şi sintactică + caracterul potenţial al omonimiei şi al ambiguităţii sintactice).Dezambiguizarea: prin schimbarea topicii termenuluisubordonat: • Ex: I-am dat cartea acestei eleve → I-am dat acestei eleve cartea/o carte.

  28. Ambiguitatea limbajului natural. Niveluri. Referențială –apare atunci când un cuvânt (pronume etc.) este folosit astfel încât poate fi considerat ca referindu-se la entități anterioare. Ex 3: Maria a fost la Elena după o carte, care-i trebuia pentru tema de casă primită la cursul de Limba și literatura română. Ea i-a dat-o pentru o perioadă de timp, dar a rugat-o să nu întârzie. La rândul ei avea nevoie de ea pentru a finaliza temă de casă. Pragmatică– referire la loc, timp. Practic, pragmatica are sarcina să descrie cu ajutorul unor pricncipii nonligvistice (cotextuale), procesele de inferență necesare pentru a accede la sensul comunicat de enunț. Ex 4: A. Cât e ceasul? B. Tocmai a trecut poștașul.

  29. Bibliografie - curs și semiar 1 1. K. Biihler, Teorialimbajului,Sprachtheorie, Jena, 1934; tr. span., Madrid, 1950. 2. Eugenio Coseriu, Introducere în lingvistică, trad. de Elena ArdeleanuşiEugenia Bojoga, Ed. Echinox, Cluj-Napoca, 1999. 3. Gabriela Pană Dindelegan, Sintaxa grupului verbal, ediţia a II-a, Braşov,Ed.Aula, 1999. 4. Frans van Eemerem, Rob Grootendorst, La Nouvelle dialectique, Edition Kime2, Paris, 1996. 5. GALR, Gramaticalimbiiromâne, Bucureşti, Ed.Academiei Române, 2005 6.Louis Hjelmslev, Essais linguistiques, Les Éditions de Minuit, Paris, 1971. 7. Ch.F. Hockett, A course in modern linguistics, McMillan, New York, 1958. 8. Wilhelm von Humboldt, Über die Sprache. Reden vor der Akademie, Herausgegeben, kommentiert und mit einem Nachwort versehen von Jürgen Trabant, Tübingen/Basel 1994.

  30. Bibliografie - curs și semiar 1 9. John Lyons, Introducere în lingvistica teoretică, trad. de Alexandra Cornileascu și Ioana Ștefănescu, Ed. Științifică, București, 1995. 10. André Martinet, Elemente de lingvistică generală, trad. de Paul Miclău, Ed. Științifică, București, 1970. 11. Eugen Munteanu, Introducere în lingvistică, Polirom, 2005. 12. Valentin Roman,Fenomenalizări ale omonimiei șiambiguităţiisintactice(I) în Dacoramania, Cluj-Napoca, 2012. 13. Ferdinand de Saussure, Curs de lingvistică generală, trad. de Irina Izverna Tarabac, Polirom, Iași, 1998. 14. Ferdinand de Saussure, Scrieri de lingvistică generală, trad. de Luminița Botoșineanu, Polirom, Iași. 2004.

  31. Vă mulţumesc!

More Related