【摘 要】
:
冗余信息去重是信息抽取中的重要任务,对于多元素表示的信息,该文针对以往对各个元素统一处理所存在的问题,将信息元素进行分类,由各类元素的冗余判断难易出发,归纳相似度计
论文部分内容阅读
冗余信息去重是信息抽取中的重要任务,对于多元素表示的信息,该文针对以往对各个元素统一处理所存在的问题,将信息元素进行分类,由各类元素的冗余判断难易出发,归纳相似度计算方法,并将各相似度作为特征,通过分类器判断信息间的冗余性。同时对最难判断的命名实体信息元素,该文从其他易判断相似性的信息元素出发,通过同义命名实体的自动扩展,提高信息去重的效果。
其他文献
岁月在女人脸上刻下的年轮,以一道道细纹计算。伊莱美镭射美肤中心率先于国内引入的深蓝射频技术,从而成为微整形除皱领域的新势力。
引言根据资料显示.历年美国专业线产品的利润排行为:嫩肤类、保湿类、抗衰类.而美白祛斑产品的利润从来都是位居末位。“美国人不是不重视祛斑,只是美白祛斑产品只有上升到医疗级
杆状病毒的命名一般为宿主拉丁文名+病毒属名,病毒的中文名称亦遵循这一规则,由病毒宿主名加病毒名构成[1].
尊敬的各位来宾,女士们,先生们,朋友们:在这春暖花开的美好时节,中外企业家、专家学者、政府官员和国际组织代表欢聚一堂,围绕"中国改革开放和全面建成小康社会"的主题进行研讨,
该文提出了一种基于音子HMM输出概率分布(0PD)计算集外词(OOV)拒绝的方法,该方法主要用于语音识别中的验证阶段。与动态垃圾模型中使用经过排序的概率数值的方法相比,OPD向量包含了