【摘 要】
:
随着网络资源的不断丰富和网络信息量的不断膨胀,信息过载和资源迷向已经成为制约人们高效使用Web信息的瓶颈。网站需要引入一种能够根据用户的兴趣爱好自动组织和调整信息的
论文部分内容阅读
随着网络资源的不断丰富和网络信息量的不断膨胀,信息过载和资源迷向已经成为制约人们高效使用Web信息的瓶颈。网站需要引入一种能够根据用户的兴趣爱好自动组织和调整信息的服务模式,即个性化服务方式,使信息服务方式从传统“一对多”发展到“一对一”,而利用Web使用挖掘技术已经成为个性化服务的一个研究热点。本文对国内外关于个性化技术的研究现状进行了综合分析比较,从一个全新的角度对基于Web使用挖掘的个性化技术进行了研究。首先,提出了具有实际意义的访问序列(有效访问序列),使页面可以重复点击(回退和刷新),而且项集中的页面可以相邻或近似相邻,然后在此基础之上提出了一种最大频繁项集挖掘算法,该算法采用叠加、合并、筛选的方法挖掘最大频繁项集,同时采用优化子集和忽略单页面检测策略,提高了算法的执行性能和效率。其次,提出了一种新的最大频繁序列模式有向图结构,并基于此有向图结构提出了一种个性化推荐算法,由于该方法只需访问有向图结构的若干子图,无需搜索整个模式库,大大缩短了模式匹配的时间,因而能够更好地满足页面推荐的实时需要。最后,通过实验来验证本文所提出的最大频繁项集挖掘算法及其在个性化推荐中应用的可行性和有效性,并分别比较了两种方法的效率。
其他文献
在全球化信息浪潮正迅猛推进的今天,电子商务逐渐渗透到人们生活的各个方面,发展速度之快超过了任何传统的商务模式。学校作为一个特殊的群体,以其网络建设良好、信息化程度高和
随着计算机技术和电子技术的快速发展,越来越多的嵌入式系统应用在一些完全关键性的领域中,嵌入式软件的质量保证因此显得尤为重要.该论文研究实现了一种基于软件仿真方法的
随着计算机应用的不断深入,各企业已经积累了大量的生产业务数据,如何有效地利用这些数据进行正确及时的决策是企业生存与发展的重要环节。数据仓库正是以汇总这些数据为基础,进
本文对TD-SCDMA在线监控终端系统的设计与实现进行了研究。文章所涉及的系统,是基于FTMS开发的Uu接口测试软件,它在线跟踪并解析FTMS串口送出的层间消息,可实时显示L2/L3消
可信软件的不断发展,进一步推动了形式化方法的深入研究。形式化方法具有严格的数学语言和精确的逻辑语义,从而保证软件在开发过程中的正确性。形式化方法主要包括形式化推导
本文首先对.NET平台进行了简单介绍,包括窗体、程序集与命名空间,讲述了如何构建安全的程序集与避免“DLL HELL”问题。接着论述了组件设计如何通过扩展类与设计时环境集成的问
随着信息时代的来临,信息技术的迅速发展加快了企业信息化的进程。现在的计算技术正经历着“以机器为中心→以应用为中心→以企业为中心”的变化,软件系统的开发也由技术驱动
随着科学的发展,科学对计算的要求不断提高。受到物理器件极限速度和技术水平的限制,单处理机远远满足不了现代许多领域中具有挑战性的大规模计算课题对计算资源的需求。利用
地理信息系统(GeographicInformationSystem,GIS)是用于采集、存储、管理、处理、检索、分析和表达地理空间数据的计算机系统。地理数据由属性数据和空间数据构成。据统计,80%以
数据挖掘(Data Mining简称DM)是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数