1 / 74

第十三章 言语识别

第十三章 言语识别. 教学目的 : 使学生了解言语识别的概念、熟悉不同地区、不同年龄、不同文化层次、不同职业作案人的言语特征、掌握进行言语识别的基本方法。 教学重点 : 言语特征、识别的方法. 第一节 言语识别的基本概念. 一、语言、言语 1 、语言: 是以语言为物质外壳,以词汇为建筑材料,以语 法为结构规律而构成的体系。 2 、言语: 是语言的个人变体,是人们在特定的环境中,为

emi-mann
Télécharger la présentation

第十三章 言语识别

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第十三章 言语识别 教学目的: 使学生了解言语识别的概念、熟悉不同地区、不同年龄、不同文化层次、不同职业作案人的言语特征、掌握进行言语识别的基本方法。 教学重点: 言语特征、识别的方法

  2. 第一节 言语识别的基本概念 一、语言、言语 1、语言: 是以语言为物质外壳,以词汇为建筑材料,以语 法为结构规律而构成的体系。 2、言语: 是语言的个人变体,是人们在特定的环境中,为 完成特定的交际任务,使用语言 的行为和结果。 二、言语与犯罪 作案人运用语言进行犯罪,或在犯罪过程中说出 来或写下来的话。

  3. 三、言语识别与语言分析 1、言语识别: 是运用语言学和有关技术科学的知识、 原理和方法,研究言语人的言语特点和规 律,分析、鉴别案件材料中的言语特征, 并以此判断言语人的社会种属性或认定言 语人的一种技术侦查和司法鉴定手段。 2、语言分析: 是指汉语语法中对语言的结构形式的 分析。

  4. 四、言语识别的对象和内容 • (一)言语识别的对象 • 1、按言语与案件性质来分 • 2、按言语与案件事实的联系来分: • 3、按言语存在的形式来分 • 现场口头言语材料 • 书面言语材料 • 视听言语材料 • 电子言语材料

  5. (二)言语识别的内容 • 1、按言语的构成成分来分: • 言语的形式识别(包括文 • 字、语音、词汇、语法) • 标点符号的识别 • 言语内容的识别 • 言语表达水平和风格的识别

  6. 2、按言语的社会种属性和个性特点 来分: 地域性言语的识别 社会性言语的识别 病态言语的识别(精神病和 聋哑人言语的识别) 个体言语的识别(言语风格 和声纹鉴定)

  7. 五、言语识别的任务和作用 (一)言语识别的任务 依法对有关案件的言语材料进行 分析和鉴别、判断言 语人的社会属 性和个人特征,确定案件言语与嫌 疑人的关系,从而为划定侦查方面 和范围提供依据,为认定作案人提供 证据。

  8. (二)言语识别的作用 1、为侦查破案提供线索和方向 2、为并案提供言语方面的依据 3、为认定书写人提供言语方面的 依据 4、为审查犯罪嫌疑人真实身份提供帮助 5、进行声纹鉴定、为诉讼提供证据

  9. 六、言语识别与其它学科的关系 (一)与文字艺术、历史学、民俗学等学科的关系 家住江面铺大雪 , 远望里遥其一村。 击鼓撞钟几时休? 唐宋帝王上下同, 人生一世往何走? 庚次甲戌为长兄。代号以名庚笔画88947 (二)与地理学、方言学等的关系 (三)与司法精神病学、犯罪心理学的关系

  10. 第二节 言语人所在地区的识别 一、汉语语音常识 (一)音节: 是人们在听觉上最容易分辨出来的语 言的自然单位。汉语里一个汉字就是一个 音节。 1、音节:由一个或几个音素组成的。 2、音素:是语音的最小单位。分元音和辅 音。

  11. (二)元音、辅音 1、元音:气流经过口腔不受牙齿、嘴唇、舌头、喉的阻碍直呼而出,可自成音节。 2、辅音:气流通过口腔时受到上述某一部分的阻碍。只能和元音相拼才能成为音节。

  12. (三)发音部位: 双唇、唇齿、舌尖前音、舌尖中音、舌 尖后音、舌面、舌根。 发音方法: 塞音、塞擦音、擦音、边音、边擦音、 鼻音、清音、浊音、 送气、不送气。 (四)清音:气流受阻,不振动声带。 浊音:气流受阻同时振动声带。

  13. (五)声母、韵母: 音节开头部分的辅音称声母,其余为韵母, 只有韵母的字称零声母。 (六)韵头、韵腹、韵尾 韵头:也叫介音,是韵母开头部分。发音时一 带而过。发音不清晰。 韵腹:是主元音,是韵母的中心部分,一般由 低元音或中元音充当发音清晰、响亮。 韵尾:是韵母的收尾部分,由元音或辅音充当 发音不清晰,也不响亮。

  14. (七)尖音、团音 • 尖音:Z、C、S、跟i.u.y开头的韵母拼成的音 • 节。(普通话无尖音) • 团音:j.q.x跟i.u.y.或i.u.y开头的的韵母拼成的 • 音节(普通话有团音) (八)四呼 • 开口呼:没有韵头,韵腹不是i.u.y的韵母,称 • 开口呼韵母。 • 齐齿呼:以i做韵头或韵腹的韵母。 • 合口呼:以u做韵头或韵腹的韵母。 • 撮口呼:以y做韵头或韵腹的韵母。

  15. (九)声调符号和附加符号 1、声调符号: 国际音标通常采用一种五度制调 符。即分成低、半低、中、半高、高。 2、附加符号: 送气:鼻化:自成音节的辅音: 两可: 清音化: 浊音化:

  16. 二、汉语方言的形成、特点及分类 • (一)方言及其特点: • 1、方言:是一种语言中跟标准语有区别的,只在一 • 个地区使用的话,是语言分化的结果,跟 • 标准语相比,不同方言有不同的语音系统、 • 词汇系统和语法系统。 • 方言与标准语的关系: • ①一般与个别的关系,从属与被从属的关系。 • ②标准语是以一个方言为基础建立起来的,其 • 它方言服从于它。 • ③标准语也要从其它方言中吸收有益的成份, • 不断丰富自己,不是互相排斥,是互相依存。

  17. 2、方言的特点: ①方言具有明显的地域性。 ②在本方言区内,方言具有全民 性(无阶级性)。 ③方言具有特殊性。具有自己的 语音、词汇、语法系统,不同 于全民共同语和其它方言的特 殊性。 ④方言同语言一样,具有渐变性, 即稳定性。

  18. 3、方言形成的历史原因 ①根本原因:社会的分化引起了 语言的分化,社会的统一引 起了语言的统一,语言的发 展具有渐变性规律。 ②直接原因:a.人口的自然分布。 b.人口的集体迁徙。c.地理的 因素。d.同异族的接触。

  19. (二)现代汉语的方言分区及其语音特点: 分类:主要是以语音为标准,词汇、语法为次要,不能以地理为标准,但与地理环境有联系。 1、北方方言区:人口占70%,区域占75%,包括长江以北地区,四川、云南、贵州、广西北部地区,湘西北地区,湖北除东南角外的大部分地区,长江以南的江苏镇江以西,九江以东的沿江地带,代表话是北京话,可分为四个次方言区。

  20. (1)华北次方言: 分布在河北省(北京、天津)、 河南、山东、东北三省以及内蒙 古自 治区的部分地区。可分为六个土语群。 (2)西北次方言: 分布在西北各省、自治区汉人聚居处, 包括山西、陕西、甘肃、青海、宁夏、 新疆汉族地区以及内蒙古自治区的西部 地区。

  21. (3)西南次方言:(西南官话) 分布在四川、云南、贵州三省,湖北的大部分地区(鄂东、黄冈地区及东南咸宁地区除外),河南西南部,湖南西北部及广西北部。 (4)江淮次方言:(下江官话) 分布在江苏、安徽、长江以北,淮河以南地区(蚌埠一带除外),还有江苏镇江以西,(包括镇江),江西九江以东的沿江地带。

  22. 2、吴方言区: 占汉语使用人数的8.7%,分布在江苏省长江 以南的镇江以东(镇江除外)部分和长江北岸 的靖江、启东、海门、安徽南部的铜陵、太平 地区、浙江省的绝大部分。代表话是苏州。 (1)江浙次方言: 江苏、浙江的北部(包括上海),是吴语的 正宗。 (2)浙南次方言: 分布在浙江中部和南部,中部以绍兴为代表, 南部以平阳为代表。平阳地处温州的南部和闽 方言交错,当地只有瓯语,蛮语属吴方言属闽方 言。

  23. 3、湘方言区: 占汉语人数的5%,主要分布在湖南中部和南 部。湘水、资水流域和沅江中游东岸的部分地 区。(岳阳、长沙、株州、湘潭、双峰、衡阳、 邵阳等主要县市,占全省面积的一小半),此 外,广西北部的全州、灌阳等地。 湘方言分二支: 1、新湘语:分布在湘北、湘中一带少数较大 的城市中。 2、老湘语:广泛地流行湖南中部,沅水东南, 湘水以西和资水流域。

  24. 湖南汉语方言分布情况 湖南省汉语分布广,使用人口多。其方言大到可以分为湘语,西南官语、赣语、客家话、乡话、湘南土话等六种。 A.湘语:主要分布在湘江、资江流 域。湘语古全浊声母,有的方言 “清音化”。且一般为不送气。 分为长益、娄邵、辰溆三片。

  25. a.长益片:包括长沙、株州、湘潭、宁乡、安乡(东南部)、湘阴、汩罗、岳阳(部分)、南县、沅江、安乡(东南部)、益阳、桃江、衡阳、衡南、衡东、衡山、邵东、绥宁(南部)、安化(东部)、浏阳(西部) a.长益片:包括长沙、株州、湘潭、宁乡、安乡(东南部)、湘阴、汩罗、岳阳(部分)、南县、沅江、安乡(东南部)、益阳、桃江、衡阳、衡南、衡东、衡山、邵东、绥宁(南部)、安化(东部)、浏阳(西部) b.娄邵片:包括娄底、双峰 、湘乡、涟源、冷水江、新化、安化(西部)、邵阳、隆回(南部)、 武岗、新宁、城步、祁东、祁阳、洞口(东部一部分,黄桥镇、金田、杨林乡) c.辰溆片:辰溪、泸溪、溆浦

  26. B.西南官话: 分布在湘北、湘西和湘南,分四片。 a.常澧片:包括常德、汉寿、桃源、安乡(大部分)津市、临澧、澧县、石门、慈利、华容 b.吉张片:吉首、古丈、保靖、花垣、沅陵、张家界、永顺、桑植、龙山、凤凰 c.怀靖片:怀化、芷江、新晃、靖州、通道、黔阳、洪江、会同、麻阳 d.湘南片:永州、冷水滩、新田、宁远、蓝山、江商业、双牌、道县、东安、江华、郴州、桂阳、宜章、临武、嘉禾(双语区)

  27. C.赣语: 临湘、岳阳(东部)平江、浏阳、醴陵、攸县(大部分)、茶陵、炎陵县(西北部)、安仁、永兴、资兴、耒阳、常宁、隆回(北部)、洞口(大部分)、绥宁(北部) D.客家: 湘东南的汝城、桂东、炎陵县(大部分),此外,茶陵、平江、攸县、浏阳的少数地区 E.乡话: 沅陵西南部以及溆浦、辰溪、泸溪、古丈、永顺、张家界等地与沅陵交界的地区 F.湘南土话: 湘南片的地区,一县之内有多种土语

  28. 4、粤方言区: 占汉语人口的6%,分布在广东中部、西南部、广西南 部、香港、澳门,散居在北美、南洋、东南亚的华侨。 代表语:广州话 分为四个次方言区 A.粤海次方言:珠江三角洲大部分地区,粤西肇庆一 带以广州话为代表。 B.高雷次方言:分布在雷州半岛、高州、雷州一带, 以阳江话为代表。 C.四邑次方言:分布在台山、新会、恩平、开平四县 美洲华侨、华裔大多原籍四邑。 D.钦廉次方言:分布在广西南部钦州一带。 E.桂南次方言:分布在广西东南部南宁、梧州、玉林 等十多个县市

  29. 5、客家方言区: 占汉语人口的4%,分布在广东东北部,福建西部,江西南部。此外台湾、四川华阳凉水井有零散分布。代表话:广东梅州。 6、赣方言区: 占汉语人口的2.4%。分布在江西省中部、北部(北部沿江地带除外),湖南北至临湘,南至汝城的狭长地带,湖北的东南角。代表话:南昌话。

  30. 7、闽方言区: 是汉语语音最复杂的一大方言,占汉语使用人口的4%,分布在福建省、台湾省、广东潮汕地区、海南地区、浙江南部温州地区,以及舟山群岛。 A.闽南次方言: 分布在厦门、漳州、泉州三市及龙溪、晋江、龙岩的一部分等地区。台湾省的大部分地区(80%人口)。以厦门话为代表。此外,广东东部汕头、海南岛、雷州半岛部分地区、浙江南部平阳、玉环、舟山群岛、江西铅山、上饶、玉山、广西中南部、桂平、北流等县市也有闽南方言的足迹。 B.闽东次方言: 北片包括以福安为中心的山区各县,南片包括以福州为中心的闽江下游各市县。以福州话为代表。 C.闽北次方言: 分布在建瓯、建阳、崇安、松政和浦城五县,以建瓯话为代表。

  31. 三、 地域性言语特征 (一)方言特征: 1、方音特征:通过字音(音节)表现出来的 分这声、韵、调类特征。 (1)声类特征:如:燃、叠、烫。 (2)韵类特征:如:烂和乱,团和谈。 (3)调类特征: 2、方言词语特征: (1)词素颠倒形成的方言词。在吴、客、粤 方言中出现得较多。 晨早(粤)、棒冰(吴) (2)词素部分不同形成的方言词。 单车:线车 下雨:落雨

  32. (3)词义宽窄不同形成的方言词。 呷、肥 (4)单双音词形成的方言词。 面、粉 (5)自然地理条件不同形成的方言词。 冰、霜、雪 (6)保留古汉语词形成的方言词。 食:(粤、客、吴)吃 。 饮:喝( 粤) (7)借词形成的方言词。 埋汰、菲林、卡通片

  33. 3、方言语法特征: 方言语法的面比较宽,在案件言语材料中,反映较 多的方言语法特征有以下几类: (1)重叠特征: 妹妹、哥哥,北方方言、湘方言、赣方言广泛运用 重叠方式。而粤、闽、客没有这种重叠方式。 (2)附加特征: “儿”尾主要颁在北方方言区,南方各大方言(除吴方言) 大多缺“儿”尾。 “子”尾:吴方言、湘方言、四川、客家方言,比北方方 言丰富。 “仔、佬、阿”:见于沿海地区方言。吴、粤、闽。 (3)词序特征: (4)句式特征: (5)虚词特征:被动句式

  34. (二)方言字特征: 指带有地域性的文字及其特殊写法。以下有几种: 1、方言字特征:囡、尕 2、地域性简化字特征。 (1)非规范的形声简化字: (2)非规范的非形声简化字: 3、外来汉字特征: 日语: 东南亚: 4、繁体字特征: 我国的台湾、香港、澳门以及国外的汉 语区汉字没有简化,仍然使用,因而有一定的地域性。

  35. (三)地域性言语内容特征: 1、涉及有关地点的内容。 2、涉及有关人物居住、活动的内 容。 3、涉及有关事件发生地区、环境 的内容。 4、涉及有关物的生长、生产和分 布地区的内容。

  36. 四、言语人所在地区的综合分析 (一)根据地区性言语特征分析言语人所在地区 1、别字定方音 2、方言词定地区 3、方言字定区域 (二)根据物证材料分析言语人所在地区 1、书写工具及色料分析 2、纸张分析 3、粘合剂的分析 4、打印机打印文件分析 5、复印机复印文件的分析 6、其他犯罪痕迹的分析利用

  37. 第三节 言语人年龄的识别 一、不同年龄段言语识别的依据 (一)汉字改革 1955年国家公布《第一批异体字整理表》分810组,共 1865个。 1956年1月28日,国务院公布《汉字简化方案》1956年 2月1日1959年7月15日先后分四批推行484个简化字。 1964年2月国家公布《汉字简化方案》,共推行2238个 简化字。 1977年国家试行第二次简化字草案,后于1986年宣布 草案作废。

  38. (二)时代差别 由于不同年龄段的人经历的历史时 期不同,受语言文字时代性的制约, 特 别是受基础文化教育的年代不同,他们 的言语必然表现出时代的特点和差别。 (三)年龄推算公式 设基本年龄为Y,发案年份为X。 Y=X-1964 +(-)7

  39. 二、不同年龄段的言语特征 一般分析不同年龄段可以从以下方面的特征去分析。 1、现代汉语和古汉语词语特征。2、特定时期的词语特征。 3、古汉语语法特征。 4、繁简文字特征。 5、异体字特征。 6、新旧字形特征。 7、日语汉字特征。 8、字行竖写特征。 9、标点符号使用特征。 10、笔迹方面的特征。 11、言语的内容特征。 根据以上特征,在言语识别中,一般把人分成四个年龄段,即:少年(12 – 18岁);青年(18 – 35岁);中年(35 – 55岁);老年(55以上)。 但要具体分析,同样年龄,城市人和农村人;体力劳动和脑力劳动者会有区别。

  40. 几种年龄段言语特征 (一)少年人作案言语特征: 少年儿童一般思想单纯,想法幼稚,辨别是 非好坏的能力低,极易受坏人欺骗,世界观还 没有形成,无论是从内容和手段上来看比较简 单幼稚。 (二)青年人作案的言语特征: 青年人作案的比较多,青年的特点是思想不 成熟,语言文字基础一般都比较差。缺少社会 经验、逞强好胜、侥幸心强、敢于冒险,往往 对后果考虑不周

  41. (三)中壮年人作案言语特征: 作案有一定数量,阅历深、社会经验丰富、考虑问题比较复杂、作案善于伪装、狡猾,具有一定的语言文字基础。从案情上考虑:作案的时间、地点,一般要经过精心地策划和安排,多搞异地作案,不安全可靠的环境一般不在现场直接书写,笔迹多伪装,竭力隐蔽自己的身份。 (四)老年人作案的言语特征: 这种年纪作案的人数较少,比较容易识别。人到老年以后,身体渐渐衰弱,行动不便,感官能力下降,思想逐渐迟钝,头脑日趋僵化,从实际情况来看,老年人书写标语、传单、信件的不多。

  42. 第四节 言语人文化程度的识别 一、识别的根据 文化水平主要是通过语言水平体现的。语文水 平具体表现为实际运用语言文字的能力,这是判 断言语人文化水平归属的主要依据。 言语识别所判断的作案人的文化水平是指案件 言语材料表现出来的作案人的实际文化水平,是 相当于某种学历的文化水平。 文化程度包括:语文水平和知识水平两个方面。

  43. 二、表现文化水平的言语特征 1、文字方面的特征 2、词语方面的特征 3、语法方面的特征 4、标点符号方面的特征 5、文章结构方面的特征 6、言语内容方面的特征 7、语体方面的特征 通常把作案人文化水平分为四个层次: 小学水平 、初中水平、高中水 平、大学水平

  44. 几种不同文化程度的言语特征 (一)小学文化程度的言语特征 无论是书写水平、写作能力、还是学识水平都很低。表现为:字不成体、几乎看不到流利的运笔动作,笔画多的字写得大、笔画少的写得小,多笔少笔,搭配不适称,文字布局不匀。基本不懂文章的书写格式,不会运用标点符号,不讲究篇章结构,词汇贫泛、不会修辞、病句连篇,作案内容及标语口号式,词义不清。 (二)初中文化程度的言语特征 书写水平上,字仍不成体,但字迹大小已经比较均匀,笔画多、少的字大小基本一致,字迹比较端正,布局比较整齐,常用字错别现象已经很少见。懂得一些常用的书写格式,会使用标点符号,词汇虽然不丰富,但一般能较完整的表达思想。无明显的语法毛病,但修辞能力不高。

  45. (三)高中文化程度的特点: 高中文理分科,差别不小,特别是在书写水平和写作能力上。一般说来,书写水平是比较高的,多数已经不满足字迹大小匀称,开始讲究外形美观,可以写出工整流利的文字,初步形成了自己的字体和风格。快写时,基本做到连而不乱,错别字很少,布局比较整齐。写作能力有了较大提高,多数人能够写出文字通顺、层次结构清楚的文章,比较讲究书写格式,准确使用标点符号,词汇已经比较丰富,水平稍高的人还可以在文章中自如地运用成语典故和形象生动的比喻,表现出较高的驾驭语言文字的能力。 (四)大学文化程度的特点: 大学文化程度是指受过高等教育(包括自学达到这一程度),学有所长,理论水平较高,但受作案内容限制,学识专长不一定充分反映出来,但或多或少地有所流露。

  46. 多数书写水平较高(学文史的书写水平更高些,甚至有的人达到了精湛的程度),讲究字句的斟酌和表达的准确,能够运用多种修辞手段,讲究文体风格,注意艺术性和感染力。学理工科的对字不甚讲究,但一般能达到书写流利自然,熟练运用的程度。多数书写水平较高(学文史的书写水平更高些,甚至有的人达到了精湛的程度),讲究字句的斟酌和表达的准确,能够运用多种修辞手段,讲究文体风格,注意艺术性和感染力。学理工科的对字不甚讲究,但一般能达到书写流利自然,熟练运用的程度。 总之,临近界限并不易划分,加上又受个人心理特征、文化教育质量、社会经历、职业的要求等因素的影响,在分析时,不仅要统观全篇,反复研究,结合其它情况推断。

  47. 第五节 言语人职业身份的识别 一、识别的依据 不同职业阶层的人具有不同的言语特点。这 是由于语言文字的职业变体和职业性的言语内 容特点所决定的。 1、语言的职业变体(行话、行业语) (1)行业语:言语中必然表现出他所属的职业集 团的特定的语言特点。 (2)术语:科学技术上的专门用语。 (3)隐语:流行在某些特殊行业和秘密集团中的 用语。

  48. 2、文字的职业变体 此外,从事某些特殊职业的人,常用某种特殊的字体或符号。如书法家、美术工作者、测绘工作者、秘书、记者的速记符号,语言学家的音标和文字等。 3、语言的风格变体 语言在不同社会领域中推行其交际功能 时,形成各种不同的语体。 口头语体:包括会话体和演讲体。 书面语体:包括公文语体、科技语体、政 治语体、文艺语体。 4、言语内容的职业性 三句话不离本行

  49. 二、职业性言语特征 1、行业语特征 2、术语特征 3、隐语特征 4、职业字特征 5、专用符号特征(如化学符号、物理符号、印 刷符号、音乐符号、音标符号) 6、语体风格和言语内容特征方面也具有职业性 特征 当然分析职业特征,一般从三个方面着手: (1)作案手段:包括纸张、浆糊、墨水、油墨等 (2)文字特点:异体字、行业字、行业书写习惯等 (3)内容用语:生活用语、专门术语等

  50. 几种职业的语言文字内容特点 (一)农民:(农村人作案,容易被识别) 1、语言文字上:由于文化程度多是高小和初中,一般书写水平比较低,运笔动作生硬,错别字多,不讲究行款格式。有的信封书写格式奇特(位置颠倒),句子不通顺,日常口语较多,年纪大的人作案,会用一部分过时的异体字或自造字,语句比较陈旧,甚至还常有迷信色彩。 2、内容范围上: 农村人接触面比较狭窄,内容多涉及农村生活。农业生产资料涨价,如农药化肥、粮食、作物等。 (二)职工:(最突出的反映是使用待行业字和专业术语) 1、行业字. 2、行业语:工矿企业职工作案,有时候会暴露出有关的行业语。有时侯这些专业语是散见于全篇的,稍不注意,就容易被忽略。

More Related