480 likes | 935 Vues
Tekstyn ų lingvistika ir tekstynų naudojimas klasėje. Andrius Utka. Inovatyvios gimtosios lietuvių kalbos mokytojų kvalifikacijos tobulinimo programos įgyvendinimas. Pranešimo planas. 1 dalis . Tekstynai ir tekstynų lingvistika 2 dalis. Dabartinės lietuvių kalbos tekstynas
E N D
Tekstynų lingvistika ir tekstynų naudojimas klasėje Andrius Utka Inovatyvios gimtosios lietuvių kalbos mokytojų kvalifikacijos tobulinimo programos įgyvendinimas
Pranešimo planas 1 dalis. Tekstynai ir tekstynų lingvistika 2 dalis. Dabartinės lietuvių kalbos tekstynas 3 dalis. Tekstynų naudojimas klasėje 4 dalis. Praktinės užduotys
I dalis Tekstynai ir tekstynų lingvistika
Kas yra tekstynas? • Tekstynas (angl. corpus) – tekstų rinkinys (paprastai elektroninis), kuriamas įvairių kalbos reiškinių tyrimų tikslams. • Sudarytas iš autentiškų tekstų taip, kad kuo geriau atspindėtų kalbą ar jos atmainą. • Tekstynas lingvistui yra tarsi cheminės medžiagos mėginys chemikui. • Lingvistas tirdamas šį kalbos mėginį gali daryti empiriniais duomenimis paremtas išvadas.
Reprezentatyvumas • Savybė, tai tekstyno savybė, kai nedidelė dalis atspindi visumos įvairovę. RAŠYTINĖ KALBA Tekstynas
Kas nėra tekstynas • Neskaitmeninis • Ne tekstų (ar jų dalių) rinkinys, pvz. patarlių, citatų, etc. • Neatspindintis kalbos ar jos atmainos (kalbos klaidų pavyzdžiai) rinkinys • Bet kaip, be jokios sistemos sudarytas • Visiškai ar dalinai neapdorojamas programinėmis priemonėmis
Mažesnės apimties Skaitomas visas horizontaliai Turi struktūrą, yra rišlus Skaitomas turinio atž. tiesiogiai Parole pavyzdys Didesnės apimties Skaitomas konkondanso eilutėmis vertikaliai Turi dirbtinę sandarą Tiriamas formos atžvilgiu su spec. priemonėmis Langue pavyzdys Tekstas ir tekstynas
Literatūra • R. Marcinkevičienė. 2000. “Tekstynų lingvistka: teorija ir praktika”. Darbai ir dienos 24. • R. Marcinkevičienė. 1997. “Tekstynų lingvistika ir lietuvių k. tekstynas”. Lituanistica 1(29). • A. Utka. 2000.“Kalbinė programinė įranga ir jos galimybės” • J. Sinclair. 1991. Corpus, concordance, collocation. Oxford: OUP. • T. McEnery and A. Wilson. 1996. Corpus linguistics. Edinburgh: UP.
II dalis Dabartinės lietuvių kalbos tekstynas (DLKT)
Faktai Dabartinės lietuvių kalbos tekstynas yra didžiausias lietuvių rašytinės kalbos tekstynas Lietuvoje. Jis yra sukauptas VDU Kompiuterinės lingvistikos centre. Dabartinis jo dydis yra 140 mln. žodžių. http://tekstynas.vdu.lt (http://donelaitis.vdu.lt)
Dabartinės lietuvių kalbos tekstynas Elektroninių tekstų rinkinys skirtas įvairialypei kalbos analizei; Tęstinis; Bendrasis.
Konkordansas • tai sąrašas eilučių, kuriose rastas tiriamas žodis ar žodžių junginys, paimtas iš teksto ar tekstyno. • Konkordanso eilutėje tiriamasis žodis parodomas kontekste.
III dalis Tekstynų lingvistikos naudojimas klasėje
Tekstynų revoliucija ir kalbų mokymas (1) • Anglų lingvistai sutartinai teigia, kad “tekstynų lingvistika iš esmės pakeitė kalbotyrą ir joje taikomus tyrimo metodus”, kitaip sakant sukėlė kalbotyroje revoliuciją; • Nors tekstynų lingvistika kalbų mokymui atveria daug naujų perspektyvų, klasėje ar auditorijose šiam tikslui ji naudojama palyginti retai.
Tekstynų revoliucija ir kalbų mokymas (2) • Galima teigti, kad egzistuoja tam tikra priešprieša: iš vienos pusės tekstynų lingvistų entuziazmas iš kitos pusės mokytojų nenoras keisti tradicinius metodus. • Todėl svarbu yra, kad kuo daugiau mokytojų sužinotų apie tekstynus ir jų teikiamą naudą kalbų mokymui.
Kodėl mokytojai turėtų naudoti tekstynus? • Tekstynų lingvistika visai kitaip tiria kalbą, nei tradiciniai metodai; • Pastebėta, kad reali vartosena dažnai skiriasi nuo tos, kuri deklaruojama preskriptyvinėse gramatikose. Tuo tarpu, tekstynai leidžia nagrinėti tikrai vartojamą kalbą; • Tekstynai gali būti aktyviai naudojami kuriant mokymosi medžiagą ir net sudarant mokymosi programos pagrindą.
Panaudojimo sritys • Tekstynų naudojimas kalbos mokymo procese (pvz., mokymo žodynų kūrimas); • Tekstynų naudojimas kalbos pamokose (mokymas paremtas duomenimis); • Specialių mokymo tekstynų naudojimas.
TL įtaka kalbų mokymui • Pirmas ir reikšmingiausias pavyzdys randamas leksikografijoje. • J. Sinclair iniciatyva 80-aisiais sukurtas pirmasis žodynas 20 mln. žodžių tekstyno pagrindu – • Collins COBUILD English Language Dictionary (1987) • Naujesnės šio žodyno versijos jau rėmėsi didesniu tekstynu (the Bank of English)
Collins COBUILD žodyno privalumai • Duodama žodžio vartojimo dažnumo informacija; • Žodis apibrėžiamas pilnu sakiniu: • 1. When a dog wags its tail, it repeatedly waves its tail from side to side. [CCED], plg.: • 2. wag = to shake up and down or move from side to side [Oxford Wordpower] • Pavyzdžiai yra tipiški tam žodžiui ir autentiški. • Straipsniuose dažnai nurodomi tipiški tam žodžiui junginiai.
TL įtaka kalbų mokymui (2) 1990-aisiais pasirodė keletas anglų kalbos tekstynais paremtų gramatikų: • Longman Grammar of Spoken and Written English (Biber et al. 1999) • An Empirical Grammar of the English Verb System (Mindt 2000) • Chemnitz Internet Grammar of English (http://www.tu-chemnitz.de/phil/InternetGrammar/, cf. Schmied 1999)
TL naudojimas klasėje Duomenimis grįstas mokymas • Johns and King (1991) aprašė konkordavimo programomis paremtą mokymosi metodą, kurį jie pavadino: duomenimis grįstu mokymu (data-driven learning, DDL)
Duomenimis grįstas mokymas yra: • paremtas konkordansų naudojimu tam, kad mokiniai geriau įsisisavintų tipiškus kalbos junginius ir modelius; • konkordansais paremtų užduočių ir veiklų kūrimas ir naudojimas klasėje.
Duomenimis grįstas mokymas (2) “Kiekvienas besimokantysis naudodamasis duomenimis tampa kalbos tyrėju, arba kitaip sakant Šerloku Holmsu (Johns 2002: 108)”
1. užduoties pavyzdys: 1. Kokia kalbos dalis slepiasi po žvaigdutėmis? Koks žodis? telius su gėrimais - tas *********** ritualas. - Kas jums ke astiškas, tačiau keistai *********** judesys, tvirtai paspaud ja A. Božonienė. Įsiminė *********** vaizdelis iš mokinių par žovė... "Tai buvo ilgas, ***********, ideališkas pagal nuošir buvo emociškai paveikus, *********** spektaklis - tai baleto ė į Lietuvą buvo veikiau *********** gestas nei kraujo šauksm ingiausias ir labiausiai ***********, matyt, priklauso Audibe galioja. Iš jo lieka tik *********** pasakojimas apie darbini tylos" - kondensuotas ir *********** romanas, paverčiantis pu šen ir ten ir vis labiau *********** sukraunama, kai per kėbu rdiuren, bet jo ilgas ir *********** pasakojimas nepadarė jai Hendersonui labiausiai *********** jų romano momentas buvo, čią ant krėslo. „O, koks *********** reginys! - sušuko ponas s. Reginys - didingas ir ***********, tarsi vaikystėje regėtu nimą visam veikalui, yra *********** dialogas tarp Žmogaus ir imui. Dabar V. Ginzburgą *********** klausimas yra psichologi
1.Užduoties pavyzdys: 1. Kokia kalbos dalis slepiasi po žvaigždutėmis? Koks žodis? telius su gėrimais - tas jaudinantis ritualas. - Kas jums ke astiškas, tačiau keistai jaudinantis judesys, tvirtai paspaud ja A. Božonienė. Įsiminė jaudinantis vaizdelis iš mokinių par žovė... "Tai buvo ilgas, jaudinantis, ideališkas pagal nuošir buvo emociškai paveikus, jaudinantis spektaklis - tai baleto ė į Lietuvą buvo veikiau jaudinantis gestas nei kraujo šauksm ingiausias ir labiausiai jaudinantis, matyt, priklauso Audibe galioja. Iš jo lieka tik jaudinantis pasakojimas apie darbini tylos" - kondensuotas ir jaudinantis romanas, paverčiantis pu šen ir ten ir vis labiau jaudinantis sukraunama, kai per kėbu rdiuren, bet jo ilgas ir jaudinantis pasakojimas nepadarė jai Hendersonui labiausiai jaudinantis jų romano momentas buvo, čią ant krėslo. „O, koks jaudinantis reginys! - sušuko ponas s. Reginys - didingas ir jaudinantis, tarsi vaikystėje regėtu nimą visam veikalui, yra jaudinantis dialogas tarp Žmogaus ir imui. Dabar V. Ginzburgą jaudinantis klausimas yra psichologi
2 užduoties pavyzdys gražus, geras, patrauklus, nuostabus, aukštas, sėkmingas • Pasirinkite tris būdvardžius ir paanalizuokite jų konkordansus. • Kurie žodžiai dažniausiai atsiranda šalia pasirinktų būdvardžių? • Ar jie yra išvardijimų dalis? • Aptarkite visos klasės rezultatus.
Žanrinis metodas • Analizuojant atskirų žanrų ar funkcinių stilių tekstus, studentams ar mokiniams galima parodyti kaip skirtingai juose veikia kalba. • Pavyzdžiui, tų pačių žodžių analizė grožinėje literatūroje, mokslinėje literatūroje, dokumentuose ir sakytinėje kalboje.
Sėkmingo mokymo prielaidos (1) • Akivaizdu, kad tokių užduočių sprendimui studentams ar mokiniams reikalingas bent jau pradinis suvokimas apie tekstynų lingvistiką ir pagrindines jos priemones. • Mokiniai turėtų žinoti • Kas yra tekstynas? • Ką galima sužinoti tekstyne ir ko ne? • Kaip reikėtų analizuoti konkordansus? • Kaip tekstynų duomenyse atsispindi kalbos vartosenos tendencijos?
Sėkmingo mokymo prielaidos (2) • Mokiniai turi taip pat turėti galimybę: • Dirbti prie kompiuterių; • Turėti prieigą prie tekstyno ar tekstynų; • Turėti programinę įrangą, kuri leistų analizuoti tekstynus; • Turėti internetinę prieigą prie internete prieinamų tekstynų.
Besimokančiųjų kalbos tekstynai(Learner corpora) Mokytojai galėtų susidaryti besimokančiųjų kalbos tekstynus. Kurių analizė leistų: • sužinoti tipiškas mokinių daromas klaidas; • efektyviau pritaikyti mokymosi medžiagą; • parodyti mokiniams jų daromas klaidas. Tokie tekstynai galėtų būti naudojami tiek mokytojų, tiek ir mokinių.
BT analizės pavyzdys Pavyzdžiui, Lorenz (1999) analizavo būdvardžių vartoseną besimokančiųjų tekstyne. Ir nustatė: Per daug vartojamas formas: really big, really important Per mažai vartojamas formas: particularly difficult Neteisingai vartojamas formas: absolutely silly Savos kūrybos formas: a too complex problem
Dažninių charakteristikų naudojimas mokantis užsienio kalbos žodyno • Analizuojant bendrojo pobūdžio dabartinės kalbos tekstyną, galima lengvai nustatyti kiek ir kuriuos žodžius gimtakalbiai naudoja kasdieninėje veikloje (O’Keeffe ir kt. (2007)).
Dažniausių žodžių formų užimama teksto dalis 10 mln. žodžių tekstyne (anglų k.)
Dažniausių žodžių formų užimama teksto dalis 60 mln. žodžių tekstyne (lietuvių k.)
Dažniausių lemų užimama teksto dalis 1 mln. žodžių tekstyne (liet. k.)
50 dažniausių žodžių (lemų) 1 mln. žodžių tekstyne – sudaro 23% teksto
Literatūra • Johns, T. ir P. King (eds.) (1991): Classroom Concordancing. Birmingham:University of Birmingham. • O’Keeffe, A., M. McCarthy, ir Carter R. (2007) From Corpus to Classroom. Cambridge: CUP. • Lorenz, G. (1999): Adjective Intensification - Learners versus Native Speakers: A Corpus Study of Argumentative Writing. Amsterdam: Rodopi.
IV dalis Praktinės užduotys
1 užduotis. Konkordansų analizė • Paanalizuokite žodžio formos santūrus kontekstą. Ką žodžio santūrus kontekstas pasako apie žodžio reikšmę?
2 užduotis. Paieška Dabartinės lietuvių kalbos tekstyne 2.1. Sudarykite šių žodžių visų formų konkordansus: dzin, kraikas, kraigas. Kokie dažniausi su šiais žodžiais sudaromi junginiai? Kokiose tekstyno dalyse šie žodžiai yra dažniau vartojami? 2.2. Koks lietuvių autorius daugiausia rašė apie Šambalą?
3 užduotis. Specialaus tekstyno sudarymas ir jo analizė • Sudarykite 10 tūkst. žodžių tam tikros temos tekstyną (pvz., politikos, pasakų, tam tikro autoriaus); • Parsisiųskite AntConc programą; • Sudarykite dažninį sąrašą; • Sudarykite dažniausios daiktavardžio formos konkordansą; • Surūšiuokite konkordansą pagal kairįjį arba dešinįjį žodį.