1 / 45

第二讲 信息组织方法论

第二讲 信息组织方法论. 第四章 分类法. 刘炜 wliu@libnet.sh.cn. 什么是分类?. 分类 ( grouping / categorizing ) :对事物区分而聚类 区分:由不同属性特征 聚类:由相同属性特征 分类方法是人类最本能认识世界的方法,可用于任何资源; 分类是主观的、人为的,反映了人对客观世界的认识; 按使用或内容而不是按物理顺序(如字顺)聚类; 用于类分事物的性质叫做“属性”,有内部属性和外部属性之分. 什么是分类 ( Classification )?. 荀子 :同其所同,異其所異。 墨子 :彼,彼止於彼;此,此止於此。

julio
Télécharger la présentation

第二讲 信息组织方法论

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第二讲 信息组织方法论 第四章 分类法 刘炜 wliu@libnet.sh.cn

  2. 什么是分类? • 分类( grouping/categorizing ):对事物区分而聚类 • 区分:由不同属性特征 • 聚类:由相同属性特征 • 分类方法是人类最本能认识世界的方法,可用于任何资源; • 分类是主观的、人为的,反映了人对客观世界的认识; • 按使用或内容而不是按物理顺序(如字顺)聚类; • 用于类分事物的性质叫做“属性”,有内部属性和外部属性之分

  3. 什么是分类(Classification)? • 荀子:同其所同,異其所異。 • 墨子:彼,彼止於彼;此,此止於此。 • Arlene Taylor: “Classification basically is categorizing, but during the twentieth century, classification has come to be associated with assigning some kind of notation to physical information package…” (The Organization of Information, 1999, p.173)

  4. 分类、类、组、分类系统、分类表 • 分类就是按照事物的性质、特点、用途等作为区分的标准,将符合同一标准的事物聚类,不同的则分开的一种认识事物的方法。 • 符合同一标准的事物构成一个类(Class 或Category )或组(Group)。 • 将类或组按照其相互间的联系,组成系统化的结构(例如层次结构),就是分类系统(Classification System)。 • 分类表(或称类目表:classificationscheme或classification table)是分类系统的具体体现,由一定学科领域的许多类目,按照一定的原则和关系组织起来的一个体系,作为分类工作的依据和工具。

  5. 什么是分类法? • 分类法是指将类或组按照相互间的关系,组成系统化的结构,并体现为许多类目按照一定的原则和关系组织起来的体系表,作为分类工作的依据和工具。

  6. 为什么要分类 • 认识事物的自然过程; • 事物数量庞大,为了管理上的方便性; • 事物经过分类之后,具有了按类检索的功能;使用上的方便性; • 分类使事物之间建立了一种关联:同类、不同类、相似类、从属类……; • 分类从总体上给事物提供了一个组织框架,从而达到了整体的有序化。

  7. 分类的相关因素 • 分类因…而不同: • 分类的对象(图书/期刊/论文/电子文本/..) • 分类对象的显著特性(内外部属性) • 分类的用户 • 分类的目的 • 分类是主观的,虽然所依据的是事务客观的属性。类别的判定与选择因人而异,分类的标准不同,结果就不同。

  8. 不同的分类法

  9. 传统分类的基本要求 • 要有清晰、明了的分类大纲 • 类目划分的层次要适当 • 类目划分的标准要易于理解 • 在一定范围内按主题集中信息 • 在浏览中需要导航和指引 见:戴维民《信息组织》p. 49

  10. 分类法(表)举例:中图法 • 大类 • A 马克思主义、列宁主义、毛泽东思想、邓小平理论B 哲学、宗教C 社会科学总论D 政治、法律E 军事F 经济G 文化、科学、教育、体育H 语言、文字I 文学J 艺术K 历史、地理 • N 自然科学总论O 数理科学和化学P 天文学、地球科学Q 生物科学R 医药、卫生S 农业科学T 工业技术U 交通运输V 航空、航天X 环境科学、安全科学Z 综合性图书 • 参见G.txt(G类)

  11. 分类表实例North American Industry Classification System (NAICS)

  12. Standard International Trade Classification (SITC)

  13. International Patent Classification(IPC) • 第1卷 A部─人类生活需要 • 第2卷 B部─作业、运输 • 第3卷 C部─化学;冶金 • 第4卷 D部─纺织;造纸 • 第5卷 E部─固定建筑物 • 第6卷 F部─机械工程;照明;供热;武器;爆破 • 第7卷 G部─物理 • 第8卷 H部─电学

  14. Mathematics Subject Classification (MSC) • 00-xx General • 01-xx History and biography [See also the classification number -03 in the other sections] • 03-xx Mathematical logic and foundations • 04-xx • 05-xx Combinatorics • 06-xx Order, lattices, ordered algebraic structures • 08-xx General algebraic systems • 11-xx Number theory • 12-xx Field theory and polynomials • 13-xx Commutative rings and algebras (more ……) (Source: http://www.ams.org/msc/)

  15. Mathematics Subject Classification (cont.) • 01-xx • History and biography • [See also the classification number -03 in the other sections] 01-00 General reference works (handbooks, dictionaries, bibliographies, etc.) 01-01 Instructional exposition (textbooks, tutorial papers, etc.) 01-02 Research exposition (monographs, survey articles) 01-06 Proceedings, conferences, collections, etc. 01-08 Computational methods 01Axx History of mathematics and mathematicians

  16. Physics and Astronomy Classification Scheme (PACS) • 00: General • 10: The Physics of Elementary Particles and Fields • 20: Nuclear Physics • 30: Atomic and Molecular Physics • 40: Electromagnetism, Optics, Acoustics, Heat Transfer, Classical Mechanics, and Fluid Dynamics • 50: Physics of Gases, Plasmas, and Electric Discharges • 60: Condensed Matter: Structure, Mechanical and Thermal Properties • 70: Condensed Matter: Electronic Structure, Electrical, Magnetic, and Optical Properties • 80: Interdisciplinary Physics and Related Areas of Science and Technology • 90: Geophysics, Astronomy, and Astrophysics

  17. 分类法的组成 • 编制说明:对分类法的编制理论、指导思想、编制原则、结构体系、知识范畴、适用范围、标记制度,以及编制的目的与经过、版本修订情况等基本事项的总体说明。 • 基本类目表:也称分类法简表,是由一、二、三级大类组成的目录体系框架。是分类法性质功能的集中反映。 • 分类法主表:包括术语(类名)系统、标记系统、注释与参照系统,使分类法编制的理论、技术与原则的完整体现,是进行分类标引工作的依据。 • 辅助分类体系:提供主分类体系聚类标准以外的检索途径,通常没有严格的逻辑次序,各辅助分类体系之间可以相互交叉,多用于网络信息分类。 • 分类法附则:也称分类法辅助表、通用复分表。是配有编号的标准子目表,单独编列在分类法主表之后,用于对主表中列举的类目进行细分。按适用范围可分为总论复分表、空间复分表、民族复分表、体裁复分表、人物复分表、材料复分表等等。 • 分类法索引:按字顺编排类目名称、事物主题以便于查找类目的工具。分直接索引和间接索引。 • 使用手册和附录:

  18. 类目结构——层级式 • 层级式结构(hierarchical structure)-- 如:杜威十进分类法(Dewey Decimal Classification, DDC) • DDC Web Site - http://www.oclc.org/dewey/index.htm • DDC简介 - http://datas.ncl.edu.tw/catweb/dewey.htm • 层级式分类法:一件事物只能存在一处

  19. 类目结构——层级式(续) Summary of the 10 Main DDC Classes 000 Generalities 100 Philosophy and Psychology 200 Religion 300 Social Sciences 400 Language 500 Natural Sciences and Mathematics 600 Technology (Applied Sciences) 700 The Arts 800 Literature and Rhetoric 900 Geography and History

  20. 类目结构——层级式(续) A Typical DDC Hierarchical Sequence 600 Technology (Applied Sciences) 610 Medical Sciences, Medicine 612 Human Physiology 612.1 Blood and Circulation 612.11 Blood 612.112 White Corpuscles

  21. 类目结构——列举式 • 列举式(Enumerative) – 如:国会图书馆图书分类法(Library of Congress Classification, LCC) • LCC Web Site - http://lcweb.loc.gov/catdir/cpso/lcco/lcco.html • LCC简介 – http://datas.ncl.edu.tw/catweb/2-2-6.htm

  22. 类目结构——列举式(续) Summary of the Subclasses of a Typical LC Class Q Science (general) QA Mathematics QB Astronomy QC Physics QD Chemistry QE Geology QH Natural History (general), Biology (general) QK Botany QL Zoology QM Human Anatomy QP Physiology QR Microbiology

  23. 类目结构——列举式(续) Example of the Divisions of a Typical LC Subclass QD Chemistry 23.2-26.5 Alchemy 71-142 Analytical Chemistry 146-197 Inorganic Chemistry 241-441 Organic Chemistry 450-731 Physical and Theoretical Chemistry 901-999 Crystallography

  24. 类目结构——列举式(续) A Typical Example of an LCC Subdivisions Q Science (general) QD Chemistry 146-197 Inorganic Chemistry 171-172 Metals 171 General works, treatises, … 172 By groups, A-Z .A3 Actinide elements .A4 Alkali metals .A42 Alkaline earth metals .I7 Iron group .M4 Magnesium group .P8 Platinum group ……

  25. 类目结构——分面组配式 • 分面组配式(Faceted Classification, Analytico-Synthetic Classification)- 如:国际十进分类法(Universal Decimal Classification, UDC)、Bliss Classification (BC)、冒号分类法(Colon Classification, CC) • UDC Consortium – http://www.udcc.org/ • Bliss Classification Association – http://www.sid.cam.ac.uk/bca/bcahome.htm • Colon Classification – http://www.slais.ubc.ca/courses/libr517/winter2000/Group7/colon.htm

  26. 分面分类法 • 原理:概念的分析与综合。复杂主题概念可以分析为若干简单的主题概念或概念因素,简单的主题概念可以综合表达复杂的主题。 • 分面分类法以简单主题为类目,赋予类号;按照简单主题的属性构成“面”,以一定顺序的连接“组配”表达复杂概念。

  27. 分面分类法类型 • 分面分面分类法:完全的分面分类法,直接由分面的概念组成,没有基本大类。多用于专业分类法。 • 组配-体系分类法:分面组配与体系分类相结合,以分面为主。基本大类(如学科)构成分类表的主干,下设若干分面。如CC、BC2等。 • 体系-分面分类法:在体系分类法中大量采用分面组配,通过通用、专用复分表及仿分,分类号保持分段,可进行轮排。

  28. 体系分类法的缺陷 • 细小专深的主题概念无法充分展示; • 线性排列是检索途径单一,难于插入新主题概念; • 先组式类号不便于灵活检索; • 难以及时修订和增补,往往落后于应用。

  29. 分面分类法的优点 • 通过简单主题概念的组配,可以确切表达各种主题概念; • 可以对标引对象进行多方面揭示,多向成族,提供多种检索途径; • 便于根据实际需要扩大或缩小检索范围; • 类目体系自由、灵活,便于修订、增补,可扩展性好; • 只列举简单主题概念,类表简化,篇幅小 • 其缺点:对于手工检索来说,分面分面分类法难于表达固定的专门概念(专有名称);标引和检索的一致性差;对除检索外的其他手工情报业务工作适应性差。

  30. 类目结构——分面组配式(以UDC为例) Common auxiliary tables and signs • + (plus) Addition附加, e.g. 59+636 Zoology and animal breeding • / (stroke) Extension扩展, e.g. 592/599 Systematic zoology (everything from 592 to 599 inclusive) • : (colon) Relation关联, e.g. 17:7 Relation of ethics to art • [] (square brackets) Algebraic subgrouping, e.g. 31:[622+669](485) Statistics of mining and metallurgy in Sweden (the auxiliary qualifies 622+669 considered as a unit) • :: (double colon) Order-fixing顺序固定 or irreversible relation非相关关系, especially in computerized systems, e.g. 061.2(100)::002FID International Federation for Documentation (if no entry is required under 002) • = (equals) Language, e.g. =20 in English; 59=20 Zoology, in English • (0...) Form, e.g. (051) Periodicals; 59(051) Zoology (brackets-nought) periodicals • (1/9) Place, e.g. (4) Europe; 59(4) Zoology of Europe (brackets-one-to-nine)

  31. 类目结构——分面组配式(以UDC为例)(续) • (=...) Race and nationality, e.g. (=3) Germanic races; (brackets-equals) 17(=3) Ethics in Germanic races • "..." (quotation marks) Time, e.g. "19" the 1900s (loosely, 20th century); 17"19" Ethics in 20th century • * (asterisk) Codes and notations (non-UDC), e.g. atomic mass number; 546.42.027*90 Strontium 90 • A/Z Names etc, e.g. REM (or Rembrandt); (alphabetic extension) 75REM Paintings of Rembrandt • .00 Point of view, e.g. .002.5 Tools, machinery, (point-nought-nought) equipment aspect; 622.002.5 Mining: tools, machinery, equipment • -0 (hyphen-nought) To be developed. So far, there are two sections: -03 Materials, e.g. -033.5 Glass etc; 683.512-033.5 Glass bottles -05 Persons, e.g. -053.2 Children (in general); 17-053.2 Ethics in children (Source: http://www.niss.ac.uk/resource-description/udcbrief.html)

  32. 类目结构——分面组配式(以UDC为例)(续) • The standard categories recognised in ‘classical’ facet analysis are: Thing – kind – part – property – material – process – operation – patient – product – by-product – agent – space – time • Any item, document or object acquired is placed into a subject arrangement (classification) by examining which categories are represented, then using the notation for these categories to build a classmark representing them in a fixed and easily remembered order. • EXAMPLE: an item on library provision for the elderly in residential care is placed first in the 'Patient' category and then in a 'Operation' sub-category. In the Social Welfare class (Q), the class mark representing this compound class is QLV EPX L: Q . . Social welfare QEL . . . Residential care QEP X . . . Library provision QLV . . . Old people (Source: http://www.sid.cam.ac.uk/bca/bcclass.htm)

  33. 类目结构——分面组配式(以UDC为例)(续) • 冒号分类法包括42个反映知识领域的主类目 • Each class is then analyzed and broken down into its basic elements, grouped together by common attributes, called facets. • There are five main groups into which the facets fall, and Ranganthan calls these the fundamental categories, represented by the mnemonic PMEST in an order of decreasing concreteness. Personality– the primary facet or the most prominent attribute Matter– physical material Energy– action Space– location Time– time period (Source: http://www.slais.ubc.ca/courses/libr517/winter2000/Group7/colon.htm)

  34. 类目结构——分面组配式(以CC为例) In formulating a class number, certain punctuation marks are used as facet indicators to show the nature of the element being presented. (,) connecting symbol for Personality (;) connecting symbol for Matter (:) connecting symbol for Energy (.) connecting symbol for Space (') connecting symbol for Time

  35. 类目结构——分面组配式(以CC为例)(续) An Example of CC class number: Research in th ecure of the tuberculosis of lungs by x-ray, conducted in India in 1950s -- L,45;421:6;253:f.44'N5 L Medicine 45 Lungs 421 Tuberculosis 6 Treatment 253 X-ray f Research 44 India N5 1950

  36. 类目结构:类目次序安排 • 类目的安排应该有一定的逻辑顺序。 • 相关的类别应作紧密的安排。 • 大类及小类的組合,应注意到概念的外延(extension)与內涵(intension),同時要顾及类别之间的互斥性。 • 实例: A STORY ABOUT THE DEWEY DECIMAL SYSTEM OF CLASSIFICATION http://mte.anacortes.k12.wa.us/library/dewey/deweystory.htm

  37. 分类表的组成:标记系统 • 标记(Notation)- 用以代表类目的文字符号,并据此组织分类系统。 • 以代号形式表达类目; • 固定类目位置; • 显示类目之间的关系

  38. 标记系统 • 按组成成分划分 • 单纯标记(pure notation)- 只用一种文字、字母、符号或数字的标记系统。 • 混合标记(mixed notation) – 运用两种以上的符号。

  39. 标记系统 • 按标记制度划分: • 层累标记制 • 顺序标记制 • 混合标记制 • 分面(分段)标记制 • 回归标记制(布利斯分类法,分面标记p.92) • 起讫标记制

  40. 分类表的组成–助记表(复分表)(Auxiliary table or Mnemonic table) • 按照Arlene Taylor的定义,助记表是 “A generalized subdivision table appended to a classification schedule for use in building specific class numbers where indicated in the schedule proper.” (Introduction to Cataloging and Classification, 8th ed., p. 574) • 助记表就是将一组可适用于多个类别的子目结构,单独制表。在分类时,若有需要用到這个复分结构时,可以自行组合运用。

  41. 分类表的组成–助记表(复分表) 一般的图书分类表中,常见的助记表有: • 标准复分表(或称形式复分表、总论复分表) • 时代复分表 • 国别复分表 • 语言复分表

  42. 分类表的组成–索引(Index) 常见的索引形式有二: • 列举(直接)索引(specific index):字顺排列 • 相关索引(relative index):采用标题字顺排列或者关键词轮排

  43. 如有兴趣,参考台湾辅仁大学课件: http://stmail.fju.edu.tw/~a8610011/master/ok08.htm • Chapter 8- Bibliographic classification schemes, from Organizing Knowledge : An Introduction to Managing Access to Information / by Jennifer Rowley, John Farrow; 3rd ed. Hampshire, England : Gower, 2000; ISBN: 0566080478 • 【大綱】 • 一、引言(完整翻譯) • 二、杜威十進分類法 • 三、美國國會圖書館分類法 • 四、其他通用分類法 • 五、修改已出版的分類表 • 六、特殊分類表 • 七、摘要(完整翻譯)

More Related