1 / 12

Character Set Standards

Character Set Standards. Nicht kodierte Charset Standards Kodierte Charset Standards Internationale Charset Standards. Nicht kodierte Charset Standards. Existierten meistens schon lange bevor kodierte Charsets entstehen (oder sogar deren Konzept)

lenora
Télécharger la présentation

Character Set Standards

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Character Set Standards Nicht kodierte Charset Standards Kodierte Charset Standards Internationale Charset Standards

  2. Nicht kodierte Charset Standards • Existierten meistens schon lange bevor kodierte Charsets entstehen (oder sogar deren Konzept) • Dienen der Beschränkung und Standardisierung der Zahl der sich in Gebrauch befindlichen chinesischen Zeichen • Didaktische Intention

  3. Hanzi in China • Standardliste 现代汉语通用字表 (7000) • Darunter: • Grundschule 现代汉语常用字表 (2500) • Mittelschule 现代汉语次常用字表 (1000) • Zusätzlich: • Liste vereinfachter Zeichen 简化字总表 (2249)

  4. Hanzi in Taiwan • Grundliste (4808) • Ergänzungsliste (6341) • Liste seltener Hanzi (18480) • Liste mit Hanzi-Varianten (18609)

  5. Kanji in Japan • Standardliste 常用漢字 (1945) • Darunter wichtig: • Schulliste 学習漢字 (1006) • Zusätzlich: • Liste für Namen 人名用漢字 (285)

  6. Hanja in Korea • Gesamtliste 상용한자/常用漢字 enthält: • Mittelschule (900) • Oberschule (900) • Zusätzlich Liste für Namen 인명용한자/人名用漢字 (2964)

  7. Kodierte Charset Standards • Durch Computersysteme Notwendigkeit von kodierten Charset Standards • Zuerst proprietäre Standards von Unternehmen später nationale Standards • Erster CJKV Standard: JIS C 6226-1978 • Methoden zum Arrangieren und Enkodieren werden von China, Taiwan und Korea übernommen

  8. Chinesische Charset Standards • Nationaler Standard GB (国标) • Grundstandard: GB 2312-80 • Wesentliche Kennzeichen: • Enthält verschiedene Zeichen anderer Sprachen (nicht nur ASCII-Zeichen) • Level 1 Hanzi (Anordnung nach Lesung) • Level 2 Hanzi (Anordnung nach Radikal und Strichzahl) • Folgestandards mit Ergänzungen und Korrekturen

  9. Taiwanesische Charset Standards • Big Five (大五) , CNS 11643-1986, CCCII • CNS zwar offizieller Standard aber Big Five gebräuchlicher (de-facto Standard) • Merkmale: • Big Five anfangs stark an JIS angelehnt und kleiner als CNS • Hanzi nach Strichzahl und Radikal geordnet • CNS mit Abstand größtes CJKV-Charset • Folgestandards bei beiden mit Ergänzungen

  10. Japanische Charset Standards • Fünf verbreitete Charsets in Japan: • ASCII • JIS-Roman • JIS X 0201-1997 (half-width Katakana) • JIS X 0208:1997 (und seine Vorgänger) • JIS X 0212-1990 (zusätzliche Zeichen) • Anmerkung: JIS X 0208:1997 und JIS X 0212-1990 ergänzen sich

  11. Koreanische Charset Standards • Meistverbreiteter Standard: KS X 1001:1993 • Wesentliche Merkmale: • Enthält ebenfalls Zeichen anderer Sprachen • Hangul und Hanja • KS X 1001:1991 mit zusätzlichen Hangul-Zeichen • KPS 9566-97 von Nordkorea verwendet • GB 12052-89 in China verwendet

  12. Internationale Charset Standards • Versuch, die meisten geschriebenen Sprachen der Welt in einem Charset zusammenzufassen • Unicode-Konsortium als bekanntester Vertreter • Start mit Unicode 1.0: 20902 chin. Zeichen, 2350 Hangul 5049 andere Zeichen etc. • In Folgeversionen Steigerung der Zeichenzahl (aber nicht der chin. Zeichen) • Nationale Standards ordnen sich in den Unicode ein wie z.B. GB 13000.1-93, JIS X 0221-1995, KS X 1005-1:1995 bzw. Kooperation mit ISO (ISO 10646-1:1993)

More Related