150 likes | 272 Vues
å—形數ä½åŒ–製作 ç¾æ³. å°ç£ï¼š CMEX ä¸æŽ¨æœƒ å ±å‘Šäºº 2004/2/23. 為何建置全å—庫?. å°ç£å„機關普é有缺å—å•é¡Œ ä¸åŒé›»è…¦ç³»çµ±ä¸æ–‡è³‡æ–™äº¤æ›å•é¡Œ 一å—多碼的å•é¡Œ 系統版本å—數ä¸çµ±ä¸€çš„å•é¡Œ Win 95/98/ME ç´„ 13,051 å€‹å— Win 2000/XP ç´„ 20,902 å€‹å— å—å½¢ä¸çµ±ä¸€çš„å•é¡Œ éœã€é€—ã€éŽã€è¤šã€ ──細明體 éœã€é€—ã€éŽã€è¤šâ”€â”€æ•™è‚²éƒ¨æ¥·é«”. ç•°é«”å—å—典概述. ç•°é«”å—å—典於 2000 å¹´å…月發行,內容å«æ£å—與異體å—,共 106,230 å—。 å…¶ä¸æ£å— 29,892 å—ï¼Œç•°é«”å— 76,338 å—(å«å¾…考之附錄å—)。
E N D
字形數位化製作現況 台灣:CMEX中推會 報告人 2004/2/23
為何建置全字庫? • 台灣各機關普遍有缺字問題 • 不同電腦系統中文資料交換問題 • 一字多碼的問題 • 系統版本字數不統一的問題 • Win 95/98/ME約13,051個字 • Win 2000/XP約20,902個字 • 字形不統一的問題 • 靜、逗、過、褚、──細明體 • 靜、逗、過、褚──教育部楷體
異體字字典概述 • 異體字字典於2000年六月發行,內容含正字與異體字,共106,230字。 • 其中正字29,892字,異體字76,338字(含待考之附錄字)。 • 本字典所稱異體字乃指對應正字的其他寫法。 • 本字典附有形體資料表,為編輯基礎。表中收錄各種文獻,藉以觀察正字與異體字孳乳與演變的脈絡。 • 本字典對所收異體字形,皆提供原始形體出處以供參考 • 異體字字典以正字為編輯綱領,除部分罕用字字義外,逐字附上形音義及所領屬的異體字。 • 正字;坤 異體字;堃、巛……. • 本字典異體字之內容主要呈現所據之關鍵文獻,並說明該字所有之對應關係。 • 『巛』〔關鍵文獻〕 • 《隸辨.平聲.魂韻》引〈史晨奏銘〉。
文獻選錄類型 分為二大部分 (一) 基本文獻 約可分為以下幾類 01. 說 文 類: 大徐本《說文解字》、段注本《說文解字》 02. 古文字類: 《校正甲骨文編》、《金文編》... 03.簡 牘 類: 《漢簡文字類篇》 04. 隸 書 類: 《漢隸字源》、《隸辨》 05. 碑 刻 類: 《金石文字辨異》、《偏類碑別字》... 06. 書 帖 類: 《中國書法大字典》、《草書大字典》... 07. 字 書 類: 《玉篇》、《字彙》... 08. 韻 書 類: 《廣韻》、《集韻》 09. 字樣書類: 《干祿字書》、《五經文字》、《國字標準字體宋體母稿》… 10. 俗字譜類=;《敦煌俗字譜》、《宋元以來俗字譜》 11. 佛經文字類: 《龍龕手鏡》、《佛教難字字典》... 12. 現代字書類: 《角川漢和辭典》、《中文大辭典》、《漢語大字典》、《國字標準字體宋體母稿》…
(二)參考文獻 • 因種類繁多(812本),此處從略,詳細書目及作者、版本、引書體例等資料,請參考本凡例附錄<參考文獻引書體例表>。
字形數位化(一) • 目前資料為鋼筆版。 • 將所有正體字、異體字用宋體風格造字,形態為向量字形。 • 造字過程中我們發現大部份字要以宋體字表示是有一定的難度。 • 因為部份字的來源為:厤辨、說文解字、集韻、禮記、金史等……
尋求文獻資料佐證 (p.30)
小字品簡內容:(看灰度、小字清晰度、整體視覺效果)小字品簡內容:(看灰度、小字清晰度、整體視覺效果) 教育部標準宋體(Size:12)P.77
字形數位化(二) • 保留原樣,將「原字放大掃瞄」取出形體,製作成WMF等格式。 • 資料來源為:各朝代的碑文、法帖等。 • 目前已完成十萬餘字,與BIG5對應的字數為9000餘字。 • 中研院目前有一組專家正大量的整理「金文」。
故事 一 • 台北:褚育靜先生 • 北京:褚育靜先生 透過電子商務轉帳
故事二 • 褚蜻達從銀行A了很多現金,粉開心 • 褚蜻達法院傳票來了……這不是 給我的,我不簽名。我的 名字是「褚蜻達」。