1 / 19

華語文與科技研究中心 研究 主題三:語料庫基礎研究

陳浩然 英語系 & 國語中心. 華語文與科技研究中心 研究 主題三:語料庫基礎研究. Brown Corpus British National Corpus Collins Bank of English Gigaword English Google 1T Micase Base CANCODE. 著名英文語料. 語言研究 字典 編教科書 自然語言處理 數位學習. 語料的應用. 1. 華語母語語料庫、 2. 華語中介語語料庫 、 3. 多媒體影音語料庫、. 先介紹以此計畫下三部分.

clare
Télécharger la présentation

華語文與科技研究中心 研究 主題三:語料庫基礎研究

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 陳浩然 英語系& 國語中心 華語文與科技研究中心研究主題三:語料庫基礎研究

  2. Brown Corpus British National Corpus Collins Bank of English Gigaword English Google 1T Micase Base CANCODE 著名英文語料

  3. 語言研究 字典 編教科書 自然語言處理 數位學習 語料的應用

  4. 1. 華語母語語料庫、 2. 華語中介語語料庫、 3. 多媒體影音語料庫、 先介紹以此計畫下三部分

  5. Review of current systems. Academia Sinica. Gigaword Chinese. Google Chinese 5 grams. Sinica data: well-known but too small for collocation search. 語料庫檢索介面建置、 線上語料檢索工具研發 Web news CNA data中央社即時新聞CNA-NEWS.COM for the collocation search tool 華語母語語料庫

  6. Academia Sinica

  7. http://140.114.75.20:8002/CGW/index.htm Collocations search

  8. Collocation search tool

  9. 解決 方法(1007)有 方法(964)處理 方法(389)採取 方法(346)研究 方法(342)找出 方法(307)利用 方法(294)提出 方法(274)尋求 方法(245)使用 方法(241)改進 方法(183)防治 方法(179)說 方法(172)運用 方法(166)提供 方法(147)為 方法(146)檢驗 方法(145)找到 方法(143)認為 方法(143)表示 方法(114)計算 方法(111)用 方法(109)學習 方法(107)預防 方法(106)學 方法(106) Examples

  10. 新 方法(1182)有效 方法(1044)最好 方法(996)好 方法(585)最佳 方法(405)可行 方法(295)正確 方法(262)可以 方法(177)具體 方法(164)適當 方法(144)合作 方法(114)自己 方法(110)主要 方法(101)和平 方法(95)直接 方法(88)必須 方法(88)同樣 方法(86)唯一 方法(85)簡單 方法(81) Adj +noun

  11. 治療 方法(832)唯一 方法(306)使用 方法(251)管理 方法(197)和平 方法(120)調查 方法(92)手術 方法(90)傳統 方法(89)交易 方法(88)統計 方法(81)教育 方法(73)分析 方法(71)訓練 方法(68)測試 方法(63)製造 方法(55) Noun +NOUn

  12. 華語語言教材和工具書出版兩大方向執行。應用於華語教學之實證研究,並將結果彙編成相關教材或辭典,提供實用之華語教學建議.華語語言教材和工具書出版兩大方向執行。應用於華語教學之實證研究,並將結果彙編成相關教材或辭典,提供實用之華語教學建議. 搭配詞字典 相關詞彙教材 The Contrutions of Collocation tool

  13. 蒐集語料建構中介語語料庫:國語中心學生作文,以及華測會學生TOP考試的作文語料。蒐集語料建構中介語語料庫:國語中心學生作文,以及華測會學生TOP考試的作文語料。 進行詞性的自動標記。(會標錯) 進行錯誤類型標記,中介語料庫的標記與一般母語語料庫的標記有很大的不同,因為需要考慮學習者的錯誤,目前現有的中介語語料庫之標記沒有統一的標準,不同的語料庫往往按其目的之不同而有不同的標記,這個部分有待進一步的研究,由於中文與其他語言不同的特性有其探究的必要與價值。 學習者中介語語料庫分析及相關教材產出。如常犯錯誤手冊, 華語學習難點分析。 中介語料庫分析應用 (InterLanguage)

  14. The interface of the learner corpus site

  15. Demo

  16. 母語來源文體功能字數類別級分CEFR LEVEL韓語電子信件問候近況表達歉意說明理由273預試5A2...<略>...的情形還有給你安慰,但是我現在在台灣的關係沒辦法去看你。所以我也很難過。我希望你趕快堅固起來,我會去的時候好好的見面。助你身體健康...<略>... The larger context

  17. Collocation errors Classifiers Synonyms Verb copying Aspect marker Le. V-起來 The topics we are working on:

  18. The need to help students with scaffolding tools. The need for video-based learning materials. The need to automatically generated subtitles. The need to link to web dictionary. Synctolearn Chinese

  19. Demo of the sync system

More Related