160 likes | 282 Vues
广东粤方言语音数据库的建设 邵慧君. 一、前期准备 (一) 调查工具的制定与问题 (二) 设备硬件和录音技术指标的测定 二、调查过程 (一)对发音人的要求 (二)对记音人的要求 (三)具体录音、记音过程 三、一点思考 (一) TFW 的优势 (二) TFW 的不足. (一)调查工具的制定与问题. 拟定原则 修改过程 现存问题. 1 、拟定原则. 《 方言调查字表 》 中有而粤方言不用的字 如 “ 汝、囥、繰 ~ 边 ” 予以删除 。 《 方言调查字表 》 中无而粤方言却常用的字 如 “ 播、旭、叮 ” 等则予以增加 。. 2 、修改过程.
E N D
广东粤方言语音数据库的建设 邵慧君
一、前期准备 • (一)调查工具的制定与问题 • (二)设备硬件和录音技术指标的测定 • 二、调查过程 • (一)对发音人的要求 • (二)对记音人的要求 • (三)具体录音、记音过程 • 三、一点思考 • (一)TFW的优势 • (二)TFW的不足
(一)调查工具的制定与问题 • 拟定原则 • 修改过程 • 现存问题
1、拟定原则 • 《方言调查字表》中有而粤方言不用的字如“汝、囥、繰~边”予以删除 。 • 《方言调查字表》中无而粤方言却常用的字如“播、旭、叮”等则予以增加 。
2、修改过程 • 删除古音地位,简化界面方便导入程序应用。 • 关于补充表:方言口语字列于末尾作为补充,包括本字、俗字形式,有音无字者暂未列入(如:“□na⁵⁵疤”,“□jɐi¹³顽劣、差” 等)。调查者需提前熟悉并准确解释。
3. 现存问题 • 字表不注古音,比对颇不方便。 • 多音字的困扰。 • 繁体字形的困扰。 化州话:甘-光 盒-鹤 洒、猫、筛、橙抹、核、盾、蚌 爲-為、併-倂 羡-羨、拼-拚、黄-黃
(二)设备硬件和录音技术指标的测定 • 录音设备 • 电脑型号不限,接外置Firewire Solo声卡,配铁三角ATM73a话筒 • 录音参数 • 录音噪音值≧60 db绝对值 • 信号采样值在1500至15000 smpl之间
一、前期准备 • (一)调查调查工具的制定与问题 • (二)设备硬件和录音技术指标的测定 • 二、调查过程 • (一)对发音人的要求 • (二)对记音人的要求 • (三)具体录音、记音过程 • 三、一点思考 • (一)TFW的优势 • (二)TFW的不足
(一)调查发音人的要求 • 总体要求:世居三代以上并长期居住在出生地、初中以上文化程度、年龄60以上的男性 • 吐字清晰、发音无明显生理缺陷、身体健康。耐心较好且有一定的领悟力。 • 文化程度适中,无长时间外出学习、工作的经历。
(二)对记音人的要求 • 扎实的语音功底 • 必要的电脑知识 • 一定物理知识和应急能力 • 吃苦耐劳的精神和一定的沟通能力 语言田野调查软件 辅助使用录音软件 数据资料妥善备份 语音图的初步分析
(三)录音、记音过程 • 1. 使用Adobe Audition监测录音环境,监测录音电平要求达到≧60 db绝对值。 • 2. 试录。选择几组具代表性的声韵调组合的字试录,调整录音参数,确保信号采样值在1500至15000 smpl之间。 • 3. 在录音过程中,要不定时进行监听,确保录音参数的一致性。
(三)录音、记音过程 • 4. 整理音系。先做135个字的音系调查,并当场录入国际音标和校音,在确定了基本的声韵调系统之后再进行其余3600余字的录音。 • 5. 字表调查。最好将当天所录全部字音的音标录入TFW软件;无法当场记音的必须做好音质描写和比字情况的详细记录。 • 6. 检查录音。逐字复听,校对输入音标;查看有无漏录、错读;监听录音质量是否合格;随时记录复听结果,以便第二天重录补录。 • 7. 录音全部完成之后,进行总体校音,得出完整的声韵调系统。 • 8. 在此基础上做同音字表并分析方言音韵特点。
一、前期准备 • (一)调查调查工具的制定与问题 • (二)设备硬件和录音技术指标的测定 • 二、调查过程 • (一)对发音人的要求 • (二)对记音人的要求 • (三)具体录音、记音过程 • 三、一点思考 • (一)TFW的优点 • (二)TFW的不足
(一)TFW(Tools for Field Word)的优点 • 1.突破传统调查记录的技术瓶颈,完整保留方言资料,对纯粹书面记录的方言资料起到很好的补充和印证作用,从而确保方言调查资料的可信度。 • 2. 界面设计清晰合理,每字独立切分并配合语图。 • 3.录音分步进行,方便调查者及早掌握音系概况,对于不熟悉该方言的调查者有一定帮助。 • 4.设有校音环节,方便归纳音系、校验记音错误和归纳同音字表。
(二)TFW(Tools for Field Word)的不足 1. 录音字表不标注古音,不方便随时调用比 字,不如方言调查字表的韵图格式一目了 然。 2. 要求比较苛刻,工作强度较之传统的田野 调查更强。 3. 3600多字无法做归一处理后再录音,这 就难保个别字的读音由于人为因素存在一 定的偏差。而机器会忠实记录所有语音变 体,这就对后期的音系归纳整理造成困 扰。因此对调查者的要求相对更高。 4. 语音的物理特征和语音的认知听辨有一定 的差距,有时会造成分析的困扰。 5. 后续的语音分析需要对照字表古音地位逐 字进行,目前尚未做到音韵特点的自动归 纳。