【摘 要】
:
随着互联网上XML文档的大量增加,如何高效地索引、存储和检索这些XML数据成为一个非常值得深入研究的课题.目前,在XML关键词检索方面,主流的检索系统都是建立在一级索引的基
【机 构】
:
北京大学信息科学技术学院机器感知与智能教育部重点实验室
论文部分内容阅读
随着互联网上XML文档的大量增加,如何高效地索引、存储和检索这些XML数据成为一个非常值得深入研究的课题.目前,在XML关键词检索方面,主流的检索系统都是建立在一级索引的基础上.一级索引存在两个明显的缺点:1)索引的冗余度比较高;2)索引的可扩展性和灵活性较差.通过结合传统倒排索引和基于杜威编码的XML节点索引的优点,提出面向XML文档的二级索引模型,并把该模型应用于求解XML关键词检索中的SLCA,实现了基于二级索引的求解SLCA的栈算法.实验表明,二级索引模型能够节省约30%的空间开销,在时间效率方面,基于二级索引的栈算法在效率上比基于一级索引的栈算法要高1个数量级左右,并且随着关键词数目的增加,这种效率优势会越加明显.
其他文献
For the pre-acquired serial images from camera lengthways motion, a view synthesis algorithm based on epipolar geometry constraint is proposed in this paper. It
By choosing different weight contents of Ni and Cu,Mo alloys have been densified under 1473K-30MPa-1h in a vacuum furnace.The experimental results indicate that
机械化秸秆还田技术有效地改善了土壤有机质,提高土壤供肥能力,增加粮食产量,让农民朋友充分了解秸秆综合利用技术的科学性、实用性、经济性和社会性。从而有效地杜绝秸秆焚烧带
随着“三北”四期防沙、治沙、退耕还林、村屯绿化造林工程的发展,我县杨树人工林面积不断增多。杨树溃疡病以及钻蛀性病害对杨树成林和幼树的危害越来越重,严重发生地病害率达
石楠 (国际城市与区域规划师学会副主席,中国城市规划学会副理事长兼秘书长,本论坛主持人):非常欢迎大家参加这个关于教育和人才的论坛.参加组织这个讨论的有四家机构的代表,
6-(Bromomethyl)-4-methoxy-5,6,7,8-tetrahydropyrido[3,2-d]pyrimidin-2-ol(compound 9) was synthesized from 6-methylpyrimidine-2,4-diol(compound 1) through the cru
首先提出以音素合并后模型自身似然度下降为距离依据,通过聚类生成多语言通用音素的声学建模方法.在此基础上,比较聚类时增加两种约束条件(同一语种内音素不聚类、不同IPA族
Current serum neutralization assays based on the inhibition of the eytopathic effect(Nt-CPE) need to manipulate live viruses,which are time-consuming,labor-inte
为考虑岩土介质参数的空间分布的结构性和随机性等不确定因素,引入了克里金参数估值法.采用变异函数描述参数在空间结构上的变化,建立其空间变异规律的数学模型,从而实现对岩
信息集成系统中存在重复记录,重复记录的存在为数据处理和分析带来了困难.重复记录检测已经成为当前数据库研究中的热点问题之一.目前的方法主要集中在计算具有同样数据类型属性