中文搜索引擎中网页排序模型的优化与实现

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:zhochg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于网页质量千差万别,对网页进行基于网络链接图的质量排序变成了现代搜索引擎的一个重要部件.该文详细介绍了两种目前使用较为广泛的网页排序算法,并采用了PageRank算法应用于实际系统.在对网页排序模块的实现进行优化时,我们系统分析了造成大规模稀疏矩阵-向量乘法运算低效的原因,并结合网络链接图的实际情况提出了几种不同的优化策略.然后,我们采用了其中五种优化策略作了实验性能比较,并综合考虑各种优化策略的运算效率和存储量需求,选择了适合实际系统的优化策略.同时,我们提出PageRank算法在实现时的一个变通处理——除汇.最后,该文阐述了搜索引擎未来的发展趋势.
其他文献
该文的主要工作包括以下几个方面:1.概括传统网络管理的发展历史和基本概念,探讨传统集中式网络管理的主要技术,特别对SNMP协议机制进行了深入的研究和分析.2.总结和分析了现
该文首先介绍了软件工厂的相关概念、技术发展现状以及一个通用软件工厂模型,接着以沈飞物资供应系统为参考,对物资供应领域信息系统的界面部分进行了详细的分析,建立了界面
信息和网络安全技术的发展,尤其是密码学的发展为在计算机网络上展开高效率的商业活动提供了安全基础.虚拟企业作为一种重要的企业模型,其通过网络传输信息的重要性日益提高,
该论文共四部分,研究了基于离散点的图形绘制方法.第一部分回顾了图形生成方法的发展历史.第二部分介绍了基于细分的图形生成方法.第三部分给出了基于离散点的图形生成方法,
同时,应用系统的开发一直面临着重大挑战:一方面,应用系统面对的是一个异构的分布式环境,它必须支持与已有系统的集成性和与其他系统的互操作性;另一方面,作为为客户、合作伙
该文研究和实现的内容主要体现在以下几个方面:(1)总结了柔性软件系统的基本特征.(2)提出了柔性报表系统的概念,并阐述了其特点和三个层次上的"柔性".(3)在提出柔性报表系统
随着国民经济的发展,对电力的需求愈来愈大,对供电系统的供电质量和供电可靠性要求越来越高,传统的技术已经不能适应新的形势.为解决这一问题,近几年国内外兴起了配电自动化
模式识别、机器学习的广泛研究以及各部门系统对于安全级别要求的提高,促使人脸识别技术的自动化、智能化、速度化、精准化成为研究的热点。随着光照、姿态、表情等的变化,人脸
本论文以非线性编辑系统的系统分析,设计以及实现为基本内容,重点介绍了应用设计模式对素材管理器和故事板编辑子系统的分析与设计,并对非线性编辑系统的概念和设计模式给出了详
目前网络安全问题日益增多,必须高度重视信息安全。要保障信息系统安全,保护系统业务和数据,不能仅仅依靠安全防护设备实行被动防御,更需要周期性的主动对信息系统进行安全性测试