论文部分内容阅读
随着网络中资源交换数据量的增多,用户交换节点数量的增大,交换过程搜索的效率成为提升整个资源网络信息传递交换的关键。非结构化P2P对等网络结构以其灵活性易扩展性受到了很多项目开发者的欢迎。这种非结构化网络如Gnutella已被广泛应用,通过向网络中所有节点发送查询消息来找到目标节点,正因为这种泛洪发送消息的方式而耗费带宽资源,产生大量冗余信息。研究过程中,人们通过为各节点增加访问记录表、邻居节点信息列表,形成生成树等方法,来缓解冗余信息的压力。但当节点数量庞大,资源种类繁多的网络结构中原本所存在的问题都会扩大,整体资源效率低下,冗余依旧存在,缓存的巨大耗损反而使查找速度滞后。
本文针对这些问题,提出了基于兴趣度算法和基于聚类的移位算法。基于兴趣度算法根据各个节点资源信息的关键词判断彼此兴趣相关度,将兴趣相近的资源归类。这样,查询请求只要在与该请求兴趣相关度高的节点范围内搜索就能较大几率的查找到目标节点,缩短了查询请求的时间,提高了搜索的效率和准确率。通常被访问的节点只占全部节点数量的20%左右,因此,基于聚类的移位算法正是在这种理论指导下提出,在节点聚类已经趋于完善的网络中建立搜索树模型,通过对命中率计数加权值,来决定该节点的被访问热度,权值高,热度越高的节点则升级在树的上面的层,而偏冷的节点则降级。研究背景基于对国家科技部项目全国科技信息资源交换门户平台,算法的提出根据该项目实际应用过程中所出现问题提出,并在平台系统中得到了验证。兴趣度算法和基于聚类的移位搜索树算法对比传统算法准确程度都达到了90%以上。