【摘 要】
:
未登录词识别是汉语分词处理中的一个难点。在大规模中文文本的自动分词处理中,未登录词是造成分词错误的一个重要原因。为了解决自动分词的这一“瓶颈”问题,对未登录词中的
【机 构】
:
鲁东大学文学院 山东烟台264000
论文部分内容阅读
未登录词识别是汉语分词处理中的一个难点。在大规模中文文本的自动分词处理中,未登录词是造成分词错误的一个重要原因。为了解决自动分词的这一“瓶颈”问题,对未登录词中的新词语的结构进行分析,总结新词语的构词类序,发掘新词语的构词规律,以期为未登录词的识别和标注提供一套规则。
Unrecognized word recognition is a difficult point in Chinese word segmentation. In large-scale Chinese text automatic word segmentation, unregistered words is an important reason for word segmentation errors. In order to solve the problem of “bottleneck” in automatic word segmentation, this paper analyzes the structure of new words in unregistered words, summarizes the word-formation order of new words, and excavates the word formation rules of new words, in order to identify unregistered words And labeling provide a set of rules.
其他文献
成都公交六公司601车队党支部书记、优秀共产党员白怀真,在公交公司一干就是20多个春秋。她满腔热忱开拓工作,处处展示共产党员吃苦在前,享受在后的高尚作风。
Chengdu bus
植被、地貌是构成地表生态地理格局与过程的主要因素,二者相互作用形成地表丰富多彩的景观类型。植被、地貌也是地球各种营力、自然过程、生物和非生物环境条件的显性表示,对环
近年来,气候变化和人类活动导致全球土地覆被剧烈变化,给人类的生活、生产及生存带来了重大影响。土地覆被变化研究成为全球变化研究的核心和热点研究领域之一。青藏高原的东缘
+代表创意与技术的协同配合,-代表纯粹的、无技术辅助的创意,×代表不同技术与创意交织产生的多样形式,÷代表将创意以技术之形分享给世界的方式……2017年8月下旬,釜山国际
降水是陆地水循环和能量循环的关键变量,是水文、气象、生态和气候变化等研究领域中重要的研究对象。由于受到大气环流和下垫面条件等多重复杂因素影响,降水具有较强的空间变异
还是在学《民法学》的时候,主讲老师说,我们每个人,从他诞生起,就生活在一个由各种“纪律”、“法律”构织的社会环境里,随着他的成长,各种社会关系日趋纷繁而复杂,他也不得
开遍全球10万+为做好一顿饭服务亿万人而“折腾”2017年7月18日,西贝新品牌麦香村发布会于亚洲大酒店隆重举行。此次新品牌发布会以“开遍全球10万+做好一顿饭服务亿万人”为
刚结束的省委十届四次全体(扩大)会议,是在我省经济社会发展进入新的发展阶段的关键时期召开的一次具有跨世纪意义的重要会议。省委书记张德江同志
The just-concluded fou
尽管山地探险旅游的重要性日益增加,然而其产业发展已经远远领先于学术研究,对山地探险旅游进行的系统性的研究仍显不足。本文通过进行市场——资源——开发的三段式研究,提出新
互联网营销,绝不是把线下内容搬到线上,就能赚钱!殊不知——互联网时代,无数传统企业相继涌入互联网营销的大潮。于是乎,互联网+、线上与线下融合、全方位构建电商平台,成为