基于langid模型的多语言微博识别研究

来源 :现代计算机:中旬刊 | 被引量 : 0次 | 上传用户:zhoulinqin274385037
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于langid模型对新浪微博用户发布微博中的汉语、英语、维吾尔语、音译维吾尔语四种语言进行识别研究。介绍基于langid模型的系统结构与原理,同时根据微博博文的特点,介绍影响langid模型识别效果的影响因子,并通过实验验证这些影响因子对实验识别效果。同时对结构比较相似、书写相似的英语和音译维吾尔语,基于langid语言识别模型能够取得更高的准确率。
其他文献
本刊讯财政部国库司副司长周成跃说,政府采购作为财政支出改革的重要内容之一,在规范预算单位采购行为,提高财政资金使用效益,从源头上遏制腐败现象的发生等方面已发挥了积极
期刊
半纤维素有着取之不尽的特点优势,但在这一方面的研究工作还有待进一步的加强。目前在针对食用菌半纤维素酶系的研究当中已累积有α-葡萄糖醛酸酶、α-阿拉伯呋喃糖苷酶、β-
我国作为农业大国,农作物的高产种植技术尤为重要。在我国东北地区,大多以种植玉米为主。在玉米种植过程中,会出现很多问题,如病虫、杂草的危害,管理的不到位及任务繁重,导致玉米的