对频率与互信息在汉语词典编撰中的作用的实例考察

来源 :华中学术 | 被引量 : 0次 | 上传用户:hhejiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
频率与互信息是近年来汉语新词自动发现中最重要的特征,它们还被列入现代汉语词典编撰选词原则中。本文以《现代汉语词典》(第6版)中全体包含“蛋”字的二字词、三字词为考察对象,分别在北京大学CCL语料库、华中师范大学Cici语料库中统计其频次,计算互信息。对比被收录词和部分未被收录词的频次和互信息却发现:部分被收录词的频次、互信息都比一些未被收录的词低。分析多组频次和互信息数值,可推测在《现代汉语词典》编撰中,词的频次与互信息其实不如词典编撰者的语感关键。 Frequency and mutual information are the most important features of automatic Chinese new word discovery in recent years. They are also included in the compilation and selection principle of modern Chinese dictionaries. In this paper, we use the two-character and three-character words that contain “egg” in the “Modern Chinese Dictionary” (6th edition) as the object of study and count their frequencies in CCL corpus of Peking University and Cici corpus of Huazhong Normal University respectively, Calculate mutual information. Comparing the frequencies and mutual information between the collected words and some unaccomplished words reveals that the frequency and the mutual information of some collected words are lower than some unrecorded words. Analysis of multiple frequency and mutual information value, it can be speculated in the “Modern Chinese Dictionary” compilation, the frequency of the word and mutual information is actually not as key language compiler language.
其他文献
在教学过程中,对学生的学习效果进行考核评价是整个教学的一个重要环节。科学合理的考核方式对学生的学习会产生很大的促进作用。那么,针对不同的课程、不同的授课对象制定科
工学结合是高职教育人才培养模式改革的切入点,也是高素质技能型人才培养的必要途径。本文阐述了“工学结合”人才培养模式的内涵及其优势,提出校企人才培养方案共建、课程共
笔者以青藏高原西部喜马拉雅期花岗岩类为例,论述了富含地幔流体的花岗岩特征,并探讨了其形成机制。研究结果表明,青藏高原西部喜马拉雅期花岗岩类岩石组合为透辉石正长岩-
职业能力和技术素养的培养是高职教育人才培养目标的核心。文章阐述了职业标准和高职高技能人才培养之间的关系,提出了按分层化职业能力框架确定专业培养目标,构建校企导学人
水轮发电机单机容量的增大,受推力轴承负荷、转子强度以及通风冷却技术所控制。现在,很大程度上还取决于推力轴承的承载能力。根据国内外制造和运行经验,为提高推力轴承的承
一、世界水库概貌全世界现有库容百万立米以上的水库达110,000座,总体积超过64,000亿立米,使地球上河川径流的稳定部分增加了1/4。我国是世界上水库数量最多的国家,据1981年
带着本民族文化观念的外国人学习汉语,必然发生跨文化的问题,因而对外国人进行的汉语教育应站在跨文化的角度开展。本文为跨文化背景下的汉语教育提出四点建议。 As a forei
网络孔子在线课堂在两年内发展迅速,为对外汉语教学带来了更广阔的发展天地,但与此同时也存在着一些问题。本文从网络孔子在线课堂的特点出发,具体分析其优势和不足,以期对其
乌江渡发电厂三台水轮发电机型号为TS1035/240—40半伞式,单机容量21万千瓦。采用自润滑、弹性液压支撑式推力轴承,其主要技术参数如表1所示。在投产运行初期,发电机组由于
目前美国、英国、法国、德国和日本等国家都积极采取措施促进本国语言的国际传播。本文从语言是一种商品的角度分析促进汉语国际传播的三种常见营销策略,即提高供应、刺激需