带模板的结构化HTML文档深度标注框架

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:dizenxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将现有Web提升为语义Web的有效方法之一就是标注Web页.当前Web上,动态生成页面的规模有静态页面的500倍之多,标注从数据库动态生成的页面是深度标注方法之一.针对数据库生成的Web页面具有模板和结构化的特征,在对带模板的结构化HTML文档和本体形式化表示之后,提出了两段式的深度标注框架,即第一阶段解析HTML文档,抽取结构化信息,第二阶段指定实例与词汇间的映射,标注自动生成.与其他标注方法相比,该方法能明显降低标注过程的工作量.
其他文献
The case when the source of information provides precise belief function/mass,within the generalized power space,has been studied by many people.However,in many
水库库容是水库的一个非常重要的参数,本文探讨利用等高线建立水库库区的数字高程模型(DEM),通过数字高程模型来计算水库库容的方法来提高库容计算的精度。
To research the loading characteristic of rocks with different structures cut by helical cutting mechanism (HCM),three different structures of rock (hard-soft-h
在中国航空工业空气动力研究院FL-5低速风洞进行了80°三角翼流动显示和涡频测量试验研究。介绍了能产生扫描式6片光的旋转镜平行多片光装置;介绍了能产生连续、均匀的示踪粒
针对某大型光电望远镜的指标要求,设计了相应的方位和俯仰伺服系统的硬件组成和软件接口,对方位和俯仰伺服系统的控制性能进行了仿真分析,并对设计缮果进行了分析验证.在测试
综合叙述了当前激光陀螺膜片检测技术领域的研究进展情况。介绍了激光陀螺用超低损耗膜片检测技术的应用背景;在对激光陀螺三类误差因素进行分析的基础上,探讨了膜片的各项参
For Otolaryngologist, it is the most important to know the principle of anatomy, physiology and common ototoxicity. Short but more concise summary has been sum
用二阶矩亚网格(SOM-SGS)燃烧模型和文献中的涡旋破碎亚网格(EBU-SGS)燃烧模型,对甲烷-空气旋流扩散燃烧进行了大涡模拟,将二者得到的LES统计平均温度分布和实验结果以及用二
以提高地理综合野外实习水平和效果为目的,从实习的内容和要求出发,通过分析目前地理综合野外实习的经验和不足,提出了建立野外实习基地和调整综合野外实习路线、完善野外实
On the basis of the geological and geochemical studies, including chemical analysis of bulk rocks, rare-earth and trace element studies, fluid inclusion, and S