基于有向带权图的页面聚类算法研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:tangtongyue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类算法是数据挖掘中的一个重要的分析工具。Web使用挖掘中的聚类分析一般分为用户聚类和页面聚类。其中页面聚类是指导网站结构离线优化的重要方法。利用有向带权图表示用户的访问会话记录,对建立的有向带权图模型运用聚类算法实现页面聚类。选取真实数据对典型的聚类算法K—means算法、DBSCAN算法和COBWEB算法进行实验。实验结果表明,在选取的数据集范围内,COBWEB算法准确率要高于K—means算法和DBSCAN算法,时间性能与用户访问频率矩阵大小有密切关系。
其他文献
中文分词是中文信息处理系统中的一个重要部分。主题信息检索系统对分词的速度和准确率有特殊的要求。文中回答了词库建立的词条来源和存储结构两大问题,提出了一种基于专有
在保证生态优先的前提下,遵照"地尽其力,物尽其用"的原则,注重保护和开发相结合,充分提高土地的利用率。上海环城绿带的建设和发展可融入更多的农业元素,利用有限的土地资源,
沉积相分析是有机质富集及油页岩和煤形成和分布研究的基础。通过鱼油页1井岩芯的岩性组合、泥岩颜色、沉积结构和构造、含有物及接触关系等特征研究,结合显微镜下薄片鉴定、