1 / 15

字形數位化製作 現況

字形數位化製作 現況. 台灣: CMEX 中推會 報告人 2004/2/23. 為何建置全字庫?. 台灣各機關普遍有缺字問題 不同電腦系統中文資料交換問題 一字多碼的問題 系統版本字數不統一的問題 Win 95/98/ME 約 13,051 個字 Win 2000/XP 約 20,902 個字 字形不統一的問題 靜、逗、過、褚、 ──細明體 靜、逗、過、褚──教育部楷體. 異體字字典概述. 異體字字典於 2000 年六月發行,內容含正字與異體字,共 106,230 字。 其中正字 29,892 字,異體字 76,338 字(含待考之附錄字)。

moses
Télécharger la présentation

字形數位化製作 現況

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 字形數位化製作現況 台灣:CMEX中推會 報告人 2004/2/23

  2. 為何建置全字庫? • 台灣各機關普遍有缺字問題 • 不同電腦系統中文資料交換問題 • 一字多碼的問題 • 系統版本字數不統一的問題 • Win 95/98/ME約13,051個字 • Win 2000/XP約20,902個字 • 字形不統一的問題 • 靜、逗、過、褚、──細明體 • 靜、逗、過、褚──教育部楷體

  3. 異體字字典概述 • 異體字字典於2000年六月發行,內容含正字與異體字,共106,230字。 • 其中正字29,892字,異體字76,338字(含待考之附錄字)。 • 本字典所稱異體字乃指對應正字的其他寫法。 • 本字典附有形體資料表,為編輯基礎。表中收錄各種文獻,藉以觀察正字與異體字孳乳與演變的脈絡。 • 本字典對所收異體字形,皆提供原始形體出處以供參考 • 異體字字典以正字為編輯綱領,除部分罕用字字義外,逐字附上形音義及所領屬的異體字。 • 正字;坤 異體字;堃、巛……. • 本字典異體字之內容主要呈現所據之關鍵文獻,並說明該字所有之對應關係。 • 『巛』〔關鍵文獻〕 • 《隸辨.平聲.魂韻》引〈史晨奏銘〉。

  4. 文獻選錄類型 分為二大部分 (一) 基本文獻 約可分為以下幾類 01. 說 文 類: 大徐本《說文解字》、段注本《說文解字》 02. 古文字類: 《校正甲骨文編》、《金文編》... 03.簡 牘 類: 《漢簡文字類篇》 04. 隸 書 類: 《漢隸字源》、《隸辨》 05. 碑 刻 類: 《金石文字辨異》、《偏類碑別字》... 06. 書 帖 類: 《中國書法大字典》、《草書大字典》... 07. 字 書 類: 《玉篇》、《字彙》... 08. 韻 書 類: 《廣韻》、《集韻》 09. 字樣書類: 《干祿字書》、《五經文字》、《國字標準字體宋體母稿》… 10. 俗字譜類=;《敦煌俗字譜》、《宋元以來俗字譜》 11. 佛經文字類: 《龍龕手鏡》、《佛教難字字典》... 12. 現代字書類: 《角川漢和辭典》、《中文大辭典》、《漢語大字典》、《國字標準字體宋體母稿》…

  5. (二)參考文獻 • 因種類繁多(812本),此處從略,詳細書目及作者、版本、引書體例等資料,請參考本凡例附錄<參考文獻引書體例表>。

  6. 字形數位化(一) • 目前資料為鋼筆版。 • 將所有正體字、異體字用宋體風格造字,形態為向量字形。 • 造字過程中我們發現大部份字要以宋體字表示是有一定的難度。 • 因為部份字的來源為:厤辨、說文解字、集韻、禮記、金史等……

  7. 尋求文獻資料佐證 (p.30)

  8. 審稿樣張

  9. 精修前後字形比對

  10. 小字品簡內容:(看灰度、小字清晰度、整體視覺效果)小字品簡內容:(看灰度、小字清晰度、整體視覺效果) 教育部標準宋體(Size:12)P.77

  11. 字形數位化(二) • 保留原樣,將「原字放大掃瞄」取出形體,製作成WMF等格式。 • 資料來源為:各朝代的碑文、法帖等。 • 目前已完成十萬餘字,與BIG5對應的字數為9000餘字。 • 中研院目前有一組專家正大量的整理「金文」。

  12. 故事 一 • 台北:褚育靜先生 • 北京:褚育靜先生 透過電子商務轉帳

  13. 故事二 • 褚蜻達從銀行A了很多現金,粉開心 • 褚蜻達法院傳票來了……這不是 給我的,我不簽名。我的 名字是「褚蜻達」。

More Related