1 / 26

Мультимедийные корпуса

Ольга Созинова. Мультимедийные корпуса. Семинар по идишу 06.09.14. Список корпусов. http://www.ruscorpora.ru/search-murco.html НКРЯ, мультимедийный корпус http://childes.psy.cmu.edu/browser/index.php CHILDES Transcript Browser (Child Language Data Exchange System)

julie-avery
Télécharger la présentation

Мультимедийные корпуса

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Ольга Созинова Мультимедийные корпуса Семинар по идишу 06.09.14

  2. Список корпусов • http://www.ruscorpora.ru/search-murco.html НКРЯ, мультимедийный корпус • http://childes.psy.cmu.edu/browser/index.php CHILDES TranscriptBrowser (Child Language Data Exchange System) • http://secrets.rutgers.edu/dai/queryPages/querySelection.phpNationalCenterforSignLanguageandGestureResources (NCSLGR) corpus • http://research.nii.ac.jp/jsl-corpus/en/Corpus Project in ColloquialJapaneseSign Language • http://www.slavist.de/Pushkin/ Диалектологический корпус (Архангельская обл., д.Михалевская) • http://www.scottishcorpus.ac.uk/ScottishCorpusOfTexts & Speech • http://webapps.ael.uni-tuebingen.de/backbone-search/faces/search.jspBACKBONE Pedagogiccorporaforcontent & languageintegratedlearning • http://www.uni-tuebingen.de/elisa/html/elisa_index.htmlEnglishLanguageInterviewCorpusasaSecond-LanguageApplication • http://www.splloc.soton.ac.uk/search.phpSpanishLearner Language Oral Corpora • http://www.flloc.soton.ac.uk/search.phpFrench Learner Language Oral Corpora

  3. 1. НКРЯ, мультимедийный корпус • Написан на JavaScript • Видео в формате *.flv, проигрыватель: Yandex Player 13.101-123 • Есть возможность скачать видео в *.mp4 • Выдача большая: преконтекст, постконтекст • Нет синхронизации видео с текстом • Как и в основном корпусе НКРЯ – морфологическая разметка, мощный поиск

  4. 1. НКРЯ, мультимедийный корпус • Возможность задать речевые действия и жесты: • количество говорящих в клипе; • социальная ситуация, отраженная в клипе; • типы речевых действий; • ориентация ладони; • направление движения; • многое другое

  5. 1. НКРЯ, мультимедийный корпус • Запрос: ехать + речевое действие: вопрос к самому себе

  6. 2. CHILDES Transcript Browserhttp://childes.psy.cmu.edu/browser/index.php • Записи детской речи • Есть материалы с аудио, видео и просто текст • Материалы с видео: • Проигрыватель QuickTime Plug-in • Текст с пронумерованными строчками, синхронизация видео с текстом • Поиск при помощи особого языкакоманд CLAN. Разработано именно для этого проекта.

  7. 2. CHILDES Transcript Browserhttp://childes.psy.cmu.edu/browser/index.php • Страница примера

  8. 3. National Center for Sign Language and Gesture Resources (NCSLGR) corpushttp://secrets.rutgers.edu/dai/queryPages/querySelection.php • Корпус жестов • Поиск по разным свойствам жестов, чекбоксы • В выдаче таблица с названиями жестов и именами людей, в пересечении – ссылка на видео с жестом и видео с контекстом • Поисковая страница – PHP, также использован JavaScript • Видео – JW Player 5.1.897 (очень классный!) http://www.jwplayer.com

  9. 3. National Center for Sign Language and Gesture Resources (NCSLGR) corpushttp://secrets.rutgers.edu/dai/queryPages/querySelection.php • Страница выдачи

  10. 3. National Center for Sign Language and Gesture Resources (NCSLGR) corpushttp://secrets.rutgers.edu/dai/queryPages/querySelection.php • Видео в всплывающем окне

  11. 4. Corpus Project in Colloquial Japanese Sign Language http://research.nii.ac.jp/jsl-corpus/en/ • Безумно красивый сайтс Flash-вставками

  12. 4. Corpus Project in Colloquial Japanese Sign Language http://research.nii.ac.jp/jsl-corpus/en/ • Но совсем нет никакого поиска – просто 2 базы данных жестов • Страница «What is your sign for?»

  13. 4. Corpus Project in Colloquial Japanese Sign Language http://research.nii.ac.jp/jsl-corpus/en/ • Видео в всплывающем окнес аннотацией • Красиво, но написано на Flash -> долго грузится

  14. 5. Диалектологический корпус (Архангельская обл., д.Михалевская) http://www.slavist.de/Pushkin/ • Поиск с CQP-запросами • Выдача аудио и текста (контекст + выделено цветом искомое) • Синхронизации с текстом нет, аудио выдается только с контекстом • PHP, XML

  15. 5. Диалектологический корпус (Архангельская обл., д.Михалевская) http://www.slavist.de/Pushkin/ • Страница выдачи

  16. 6. Scottish Corpus Of Texts & Speech http://www.scottishcorpus.ac.uk/ • Простой поиск (слово/фраза, автор, тип текста – устный или письменный, и т.д.) • PHP, JavaScript • Аудио– всплывающее окно в QuickTime, возможность синхронизации с текстом • Возможность просмотреть только простой текст и скачать его; также можно скачать аудиофайл

  17. 6. Scottish Corpus Of Texts & Speech http://www.scottishcorpus.ac.uk/ • Страница выдачи

  18. 6. Scottish Corpus Of Texts & Speech http://www.scottishcorpus.ac.uk/ • Страница примера

  19. 6. Scottish Corpus Of Texts & Speech http://www.scottishcorpus.ac.uk/ • Всплывающее окно с аудио

  20. 7. BACKBONE Pedagogic corpora for content & language integrated learning http://webapps.ael.uni-tuebingen.de/backbone-search/faces/search.jsp • Видео-интервью с носителями 6 языков • Поиск по категориям (база данных), co-occurrence, concordance (но выдача только текстовая) • Аудио и видео только скачивать (несмотря на надпись Play), формат *.wvx • JavaScript

  21. 7. BACKBONE Pedagogic corpora for content & language integrated learning http://webapps.ael.uni-tuebingen.de/backbone-search/faces/search.jsp • Страница выдачи

  22. 7. BACKBONE Pedagogic corpora for content & language integrated learning http://webapps.ael.uni-tuebingen.de/backbone-search/faces/search.jsp • Всплывающее окно с аннотацией

  23. 8. English Language Interview Corpus as a Second-Language Application (ELISA)http://www.uni-tuebingen.de/elisa/html/elisa_index.html • Интервью с носителями английского языка • Похож на BACKBONE • Для каждого интервью можно просмотреть простой текст, XML, частотные списки слов • Видео только скачивать(формат *.smil)

  24. 8. English Language Interview Corpus as a Second-Language Application (ELISA)http://www.uni-tuebingen.de/elisa/html/elisa_index.html • Страница с интервью

  25. 9, 10. Spanish Learner Language Oral CorporaFrench Learner Language Oral Corpora http://www.splloc.soton.ac.uk/search.phphttp://www.flloc.soton.ac.uk/search.php • Корпуса для исследований французского и испанского языков как L2 • Использованы технологии CHILDES (Child Language Data Exchange System)http://childes.psy.cmu.edu/ • Поиск простой, по параметрам (корпус, тип задания – general chat, story recall, etc.) • Аудио открывается в том же окне • JavaScript

  26. 9, 10. Spanish Learner Language Oral CorporaFrench Learner Language Oral Corpora http://www.splloc.soton.ac.uk/search.phphttp://www.flloc.soton.ac.uk/search.php • Страница выдачи

More Related