Reading online. http://www.rong-chang.com/reading.htm Good reading materials for students at different levels. Users can even listen to some materials. http://www.eslreading.org/ English language learning materials for students & teachers.
信息 语言 翻译技术 朱晓敏 Jacknj@netease.com
Reading online http://www.rong-chang.com/reading.htm Good reading materials for students at different levels. Users can even listen to some materials. http://www.eslreading.org/ English language learning materials for students & teachers http://www.insightin.com/ Vocabulary Building, Reading Comprehension and Learning
Speaking Online http://www.englishspeakingonline.com/ English speaking made easy! http://www.englishspeak.com/ EnglishSpeak is a revolutionary and award winning new system for learning spokenEnglishdesigned bylanguageexperts.
Listening online http://www.elllo.org Listening samples of English speakers from around the world with transcripts and interactive quizzes. http://www.esl-lab.com/ Randall’s ESL cyber listening lab
Writing Online I http://www.englishw.com/ “English Writing Online offers hundreds of interactive pages of English grammar, English writing and English pronunciation. We have hundreds of interactive readings, activities, quizzes and games. We also encourage you to participate in our online forums, opinion poll and chat room. We give you all this all for FREE.”
Writing Online II http://owl.english.purdue.edu/ Welcome to the Purdue OWL. We offer over 200 free resources including: • Writing and Teaching Writing • Research • Grammar and Mechanics • Style Guides • ESL (English as a Second Language) • Job Search and Professional Writing
Writing Online III http://write.scu.edu.tw/ 「英文寫作學習網」是一個多元、多功能的學習網站,建置詳盡實用之寫作教材供學生自學使用。內容主要由余綺芳老師無償提供她整理製作之「英文作文」課程教材和批改學生文章,這些教材的所有權為余綺芳所有,任何侵權行為將依法追究。
翻译的背景和需求 • 欧盟(European Union) 每年需要翻译的各类材料达200-300万页,需要翻译的各类会议每年逾1.1万次。 • 巨大的需要促使人们在机器翻译上投入大量资金和人力。 • 对机器翻译质量的不满,迫使用户转向计算机辅助翻译。
计算机辅助翻译: 萌芽与繁荣 • In 1970s, translation memory (翻译记忆) was proposed by someone. • In 1980s, Kay and Alan Melby were considered as the forerunner of CAT.
计算机辅助翻译: 萌芽与繁荣 • Suppose that the translators are provided with a terminal consisting of a keyboard, a screen, and some way of pointing at individual words and letters. The display on the screen is divided into two windows. The text to be translated appears in the upper window and the translation will be composed in the bottom one … Both windows behave in the same way. Using the pointing device, the translator can select a letter, word, sentence, line, or paragraph and, by pressing the appropriate key, cause some operation to be visited upon it. (Kay 1997:14) • 这些功能后来都得以实现。 • Melby 在1983年又提出了设计多层次的计算机辅助翻译系统的思想。
1. 翻译记忆系统 • 计算机辅助翻译的核心技术。“一种用语储存原文与对应译文的语言数据库”(Brown 2002:92) • 工作原理:将待译片段与数据库中已有的翻译片段进行比较,如果待译片段与现有片段匹配率较高,则提供数据库中的译文供译员参考。对于系统提供的译文,译员可以完全照搬,也可修改后使用,如果不满意可以弃之不用。修改后确定使用的片段,则自动保存到记忆库内。
2. 术语管理系统 • 术语数据库(terminological bank)也称术语库。术语库一般是双语或多语对照词表,并附带其他相关信息,如学科范围、行业、定义、词性等。 • 在实际操作中,可以将术语管理和翻译记忆库一起完全集成到翻译过程中。
3. 对齐工具 • 允许用户将已有的翻译成果,即原文和译文,作一一对齐处理。对齐通常需要人工校对,才能达到译文与原文的完全匹配。 • 对齐的单位可以是句子、短语、单词。对齐后的结果可以导入到翻译记忆卡中,供以后翻译类似文本时使用。
Useful online dictionaries • http://www.ourdict.cn/ 中华在线词典自2005年5月发布以来,深受大量网友的喜爱。目前共收录了12部词典中的汉字15702个,词语36万个(常用词语28770),成语31922个,近义词4322个,反义词7691个,歇后语14000个,谜语28071个,名言警句19424,所有功能一切免费。 • http://www.facstaff.bucknell.edu/rbeard/diction.html A web of online dictionaries.
Useful Online Corpora http://ccl.pku.edu.cn:8080/ccl_corpus/ CCL语料库规模:4.77亿字(1.06GB) 国家语委现代汉语通用平衡语料库全库约为1亿字符,其中1997年以前的语料约7000万字符,均为手工录入印刷版语料;1997之后的语料约为3000万字符,手工录入和取自电子文本各半。
http://www.natcorp.ox.ac.uk/ The British National Corpus (BNC) is a 100 million word collection of samples of written and spoken language from a wide range of sources, designed to represent a wide cross-section of current British English, both spoken and written. http://corpus.byu.edu/coca/ The corpus of contemporary American English; 425 million words (1990-2011)
http://www.icl.pku.edu.cn/icl_groups/parallel/concordance.asphttp://www.icl.pku.edu.cn/icl_groups/parallel/concordance.asp babel 汉英平行语料库始建于2001年,它最初服务于一个面向新闻领域的机器翻译系统,为基于其中存储的引擎提供翻译实例。目前,语料库的规模已达20万句对。 http://www.luweixmu.com/ec-corpus/index.htm. 本语料库收集英汉双语句对齐语料215713句,其中英文约3290670词次,中文约5370429字次。可进行英文和中文关键词检索,查询语料库中的英汉对译句子,进行英汉词语、语法等方面的对比分析研究。
Http://pcpt.cslg.cn 汉英政治平行语料库主要内容及特色 1. 语料类型:政府工作报告(包括中央人民政府工作报告、中国共产党的工作报告和财政预算报告)和政府白皮书; 2. 语料来源:中央人民政府门户网站(www.gov.cn);其他政府网站 3. 语料时间跨度:21年(1991-2011); 4. 语料库规模:中文(分词后)943,920词;英语1,136,551词;平行句对38,192对。 5. 独立开发的检索平台,支持多种检索模式(单语检索、双语检索、模糊检索、精确检索、指定年份检索、指定语料类型检索和带词性标注检索) 6. 适用对象:翻译学习和研究者;话语批评分析者;翻译资格证书报考者;语料库研究者以及其他一切热爱语言学习者。