【摘 要】
:
Web站点的日志数据记录了浏览用户对此Web站点访问时的大量信息,对这些信息的分析有利于网站设计人员掌握用户的爱好和习惯,网站设计人员可以据此对网站的结构进行优化和页面
论文部分内容阅读
Web站点的日志数据记录了浏览用户对此Web站点访问时的大量信息,对这些信息的分析有利于网站设计人员掌握用户的爱好和习惯,网站设计人员可以据此对网站的结构进行优化和页面重组。聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方法。目前,传统的聚类算法大体上分为划分的方法、层次的方法、基于密度的方法、基于网格的方法和基于模型的方法。本文首先对Web挖掘技术分类进行介绍,然后重点对本论文用到的算法进行了详细的介绍。K-means算法是一种基于划分的聚类算法,它把n个对象划分成K个类,其中的聚类数目K是输入参数。该算法是通过不断地迭代来进行聚类,当算法收敛到一个结束条件时,就终止迭代过程,输出一个聚类结果。层次的方法对给定数据对象集合进行层次的分解,层次的聚类方法可以进一步分为凝聚的和分裂的层次聚类。模糊聚类分析的实质则是根据研究对象本身的属性来构造模糊矩阵,在此基础上根据一定的隶属度来确定其分类关系。本文给出了科学文献的模糊聚类算法的具体算法描述,对于新的用户,当他们第一次浏览网站的时候,通过计算他们和其他用户的相似度对其进行归类。最后,本文将K-MEANS算法和层次聚类算法应用到中俄经贸合作网的日志分析系统中,对该网站的日志数据进行聚类,对模糊聚类算法进行了理论移植,实现了整体架构和数据库的框架设计,对最初始的数据进行了预处理,可以为今后的个性化服务做准备。
其他文献
实际经济问题研究的需要和数学工具的进步一直是推动计量经济学发展的主要动力.在经历了截面和平稳时间序列的计量经济分析、非平稳时间序列的计量经济分析几个阶段之后,随着越
校对是报纸出版工作的重要环节,它是前期编辑工作的必要延续,是拾遗补缺或补充完善的文字性、知识性的创造性劳动。当前,网络办公方式快速发展,校对工作难度相对加大,因为校
近年来,APEC 始终积极引导贸易便利化进程,致力于在亚太地区为企业创建更加良好的商业环境。APEC领导人在2001年通过的《上海共识》为“贸易便利化行动计划”(TFAP)的实施奠定
近年来,食品安全问题越来越成为人们关注的焦点,今年底在北京召开的中央经济工作会议也将加快转变农业发展方式,走高效、安全、资源节约、环境友好的现代农业发展道路提上明年的
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
在近年来,我国的科学技术水平得到了空前的发展,也得到了空前的提高.然而我国快速发展的文化、 科学技术、 经济产业背后,能源问题和环境保护问题也开始得到越来越多的关注.
农业的基础地位使得各国都对农业政策的制定和实施十分重视,不仅本国的农业政策是被高度关注的对象,政府还对贸易伙伴国的农业支持政策以及世界农产品生产和贸易环境进行严密关
贵州省旅游资源丰富,近年来,在政府的大力支持和政策的积极推动下,遵义县通过“四在农家·美丽乡村”创建,乡村旅游产业发展迅速,在调整农业产业结构,增加农民收入,促进新农村建设方
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
旅游者参与特种旅游的普遍形式是小团体、自发式无导游、无专业机构提供的先进设备、完全AA制形式。而这种形式的弊端是无安全保障、服务体系不完善、配套设施不健全。随着人