基于知识图谱的Web信息抽取系统

来源 :计算机工程 | 被引量 : 0次 | 上传用户:lmaster
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为实现多领域海量网页信息的有效抽取,以中文知识图谱CN-DBpedia为基础设计Web信息抽取系统。基于知识图谱对网页数据项进行自动标注,建立具有容错能力的包装器归纳框架,从包含错误的标注集中归纳学习出正确的包装器。实验结果表明,该系统的准确率和召回率均高于传统人工标注方法,可显著降低网页信息抽取过程中的人力成本,灵活运用于大规模、多领域的网页信息抽取任务。
其他文献
如果没有说明,你能猜出图中这位穿着破烂运动服的小男孩在参加什么活动吗?抑或他站错了一个队伍?他是站错了队伍,但他又没站错,这位南苏丹儿童参加的是儿童兵复员典礼,当天,
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
自1994年AbumiK 等^[1]和JeanneretB等^[2]。分别报道应用颈椎椎弓根螺钉内固定技术以来,它以其独特的三柱稳定优势,在临床得到了广泛应用。但是,下颈椎椎弓根螺钉内固定技术由
目的观察干部病房师以上老年患者医院感染的发生情况,探讨控制医院感染的方法。方法通过对各种标本进行培养及鉴定,检出院内感染致病菌,用构成比、感染比、阳性比等进行统计学处
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
随着企业对于建设项目的合规性越来越重视,催生出了全过程跟踪审计的服务需求。但是,对于如何认识和开展全过程跟踪审计还有诸多误区。文章从咨询公司的角度,通过对比全过程
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
提出了一种基于灰色预测模型的遗传算法优化BP神经网络的组合预测模型。通过对原始大坝序列进行灰色拟合,弱化原始序列的随机扰动影响,增强数据的线性规律,并采用遗传算法优
在我国的传统建筑当中吉祥文化是一种非常特殊的设计理念, 吉祥文化最初并不是一种设计理念, 而是中华民族传统思维的一部分,与祭祀文化、 节庆文化等都可以说是经过民俗文化