【摘 要】
:
基于机器学习的文本分类中,维吾尔文传统分词方法表现出非常明显的不足和局限性.该文使用另外一种维吾尔文自动分词方法dme-TS.dme-TS中,不再以词间空格作为切分标记提取词特
【机 构】
:
新疆大学信息科学与工程学院,新疆乌鲁木齐,830046
论文部分内容阅读
基于机器学习的文本分类中,维吾尔文传统分词方法表现出非常明显的不足和局限性.该文使用另外一种维吾尔文自动分词方法dme-TS.dme-TS中,不再以词间空格作为切分标记提取词特征,而是用一种组合统计量(dme)来度量文本中相邻单词之间的关联程度,并以dme度量的弱关联的词间位置作为切分点,提取对学习算法真正有意义的语义词特征.实验结果表明,用dme-TS提取文本特征可以降低特征空间的维度,同时也能有效的提高传统以单词为特征的分类算法的性能.
其他文献
本文主要介绍了Beckhoff控制器的开放式应用和通讯.
随着免费开放工作意见的出台实施,对图书馆的读者服务工作提出了更高要求,图书馆的读者服务内容、服务方法、服务手段、服务功能出现了新的变化.这一背景下,就需要图书馆及时
本文报告71例(77例次)肺心病急性期在综合治疗的基础上,应用小剂量肝素50毫克/日,并以同期160例,(170例次)作为对照组;结果为显效46例(64.8%),有效12例(16.9%);无效1例(1.4%
本文通过对强个体效应近似因子模型ER方法的再理解,尝试利用机器学习方法对ER法进行改进,尝试寻找其改进算法解决ER方法在强个体情况下失效的情况,并与已经提出的利用有界单
采用浸渍法得到Pt-Co/γ-Al2O3,用XRD、XPS气相色谱、分光光度法进行活性评价.结果表明,催化剂中的活性非贵金属在高温下将转化为尖晶石,尖晶石活性较为稳定,因而催化剂中的
李某,男性,37岁,工人,因规律性上腹痛16年,近三年来加重,于1983年5月行纤维胃镜检查诊断为浅表性胃炎、食道贲门炎,胃窦部粘膜活检病理报告为肠上皮化生Ⅰ级。因消化道出血
近年来,应用血管扩张药治疗急、慢性心力衰竭受到较大的重视。血管扩张药对心力衰竭病人的血液动力学效应和临床效果,不少作者曾进行研究,并有不少报导。这些资料表明,血管
当今社会,企业之间的竞争,最终都体现在企业的核心竞争力上,而研发人员又是企业拥有核心竞争力的关键.如何通过一种有效的激励方法,最大限度的调动研发人员的工作积极性和创
随着我国精神文明建设工作持续推进,公共图书馆作为精神文明建设的重要场所,对群众精神文明建设有十分重要的意义.完善总分馆制度,对于县级公共图书馆的发展以及功能发挥至关