基于最小圆覆盖区域划分的索引过滤算法

来源 :2012中国计算机大会 | 被引量 : 0次 | 上传用户:ftlfh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  过滤算法设计是信息内容安全处理系统中的一个重要环节,过滤速度成为衡量过滤系统性能的首要因素.索引结构是处理大规模数据的一种有效方式,但目前索引方法都是针对特定检索领域而设计,在实际过滤应用中,并不能满足过滤实时性需求.为了加快信息过滤中数据查询的判定速度,文中提出一种基于最小圆覆盖的区域划分方法,构建了适合过滤的索引结构:Ftree.该算法充分考虑实际过滤环境中正例(正常信息)多、反例(敏感信息)少的非平衡数据分布特性,利用最小圆覆盖划分方法得到最大否定判断区域.在查询阶段,正例以最大概率落入否定区域,根据否定性判定原理可以对正例快速否定判定,从而加快整体查询的判定速度.实验表明,与现有算法相比,所提出的算法减少了查询中的距离计算次数,有效提高了过滤查询性能.
其他文献
“冀优Ⅰ型”日光温室新型骨架———“LHG”无柱拱梁“LHG”65米无柱日光温室拱梁,是以居国内先进水平的高效能日光温室为基本模式,选用国内新开发的强度高于普遍钢筋2倍的冷轧钢筋
玉米是我国重要的粮食作物,它的种植管理和病虫害防治一直是农民关心的重要问题。本文重点分析了玉米的种植管理以及防病虫害的相关问题,旨在更好地提高玉米的产量。
近年来,由于病原学和血清学的突破性进展,我国已报道的流行性出血热(EHF)宿主动物有50多种。米尔英等从家鼠型疫区6种家畜家禽血清中检出EHF 病毒抗体,张云等从野鼠型疫区狗
山东省是全国13个粮食主产省之一,粮食总产量已经连续六年超过1000kg以上,位居全国第三位,尤其小麦,2020年总产量达到513.84kg,较去年相比增加了3.18kg,增产幅度达到0.6%。在这一利
珍真,本名王真,1985年生,西安人。11岁时身患“系统性红斑狼疮”,不得不辍学回家。从小热爱文学的她,15岁时完成了14万字的长篇小说《别哭》,16岁时完成了10万字的长篇小说《爱戒》,17岁时完成了10万字的长篇小说《午夜天使》,18岁时完成了百首诗集《忧情诗词》。目前,她正创作约20万字的叙事长诗《法比奥》。    1985年7月26日,一个可爱的小生命降生了,在西安市某建筑设计院工作的唐莉
  现代企业计算的业务过程越来越复杂,有很多分散且相对独立的组织机构,为了协同来自不同组织的业务过程,文中提出一种IOPB模型(面向交互的Petri网)用于描述跨组织的工作流协
会议
  本文介绍了一个采用笔画、部件等汉字特征要素进行汉字书写规范性评价的实验系统,并指出了系统实现遇到的主要困难。系统采用的评价要素主要包括笔顺、笔画书写、笔画位置
近年来,我国对稻米的需求渐长。因此,想解决此问题,仅仅扩大水稻的耕种总面积是不够的,还必须改善水稻的栽培技术手段,同时将其广泛推广具有重要的现实意义。本文阐述了芜湖市水稻
今年70岁的薛文淑,曾经在空中飞行过3100多个小时,是新中国自己培养的第二批女飞行员之一,一位飞过6个机种、带过30多名学员、多次战胜厄运的“空中女杰”。而今,她又在学英语、学计算机。她那飞行员特质的干练和迅速的反应依然让人钦佩不已。    蓝天任翱翔    1956年春,19岁的薛文淑从北京40中毕业,因为品学兼优,她已被保送到大连海运学院就读,同时,她也顺利通过了空军“招飞办”的体检。面对选
1,工作现场的评价应采用系统的工作回顾或工艺分析,如工业卫生调查、工作安全性分析或事故树分析,确定工作现场可能接触的化学物和化学防护服装必须耐受的条件。并应回答如