【摘 要】
:
在线用户行为的挖掘和建模,是社会学和复杂性科学研究的热点。大数据、智能终端等技术的出现,为研究在线用户行为提供了技术和数据支持。通过分析在线用户行为相似性使得隐藏在数据背后的规律得以浮现。由于在不同研究中,对用户行为的影响因素的考量有所差别,因此用户行为相似性计算方法的选取依具体研究情况而定,至今还未形成标准化、统一化的计算方法。此外,在线用户自身特征属性对其行为相似性的贡献度的研究也相对匮乏。基
论文部分内容阅读
在线用户行为的挖掘和建模,是社会学和复杂性科学研究的热点。大数据、智能终端等技术的出现,为研究在线用户行为提供了技术和数据支持。通过分析在线用户行为相似性使得隐藏在数据背后的规律得以浮现。由于在不同研究中,对用户行为的影响因素的考量有所差别,因此用户行为相似性计算方法的选取依具体研究情况而定,至今还未形成标准化、统一化的计算方法。此外,在线用户自身特征属性对其行为相似性的贡献度的研究也相对匮乏。基于此背景,本文选取在线用户行为日志作为数据来源,验证了虚拟空间中用户行为存在不同程度的相似性和差异性,识别了相似度较高的用户群体。进一步,结合用户自身的相关信息,研究了不同特征属性及其组合对在线用户行为相似性的影响程度。主要研究内容为以下三个方面:(1)在线用户行为相似性计算。基于生物学中序列对齐的思想,通过引入时间因素提出一种基于序列对齐的在线用户行为相似性计算算法SA-OUBSC。该算法首先将用户点击流数据转换成点击序列,进一步通过插入、删除、补偿等操作计算出不同用户点击序列的距离,从而得出用户间的行为相似性,并将这种相似性以矩阵的形式表达出来,最终验证了虚拟空间中不同用户其点击行为存在不同程度的相似性和差异性。(2)在线用户群体识别。在传统层次聚类的基础上通过引入优先级队列提出OUBS-GR算法。该方法首先从用户自身的基础信息中提取六个维度的特征属性;然后根据行为相似度矩阵对用户进行聚类,识别并区分出相似度较高的用户群体。进一步,基于熵值和纯度的评价方法对比了传统层次聚类群体识别的效果,验证了OUBS-GR算法的优越性。最后根据评价方法的计算结果初步得出不同特征属性对用户行为会产生不同程度的影响。(3)特征属性及其组合对行为相似性的贡献度。通过构建基于GraphSAGE的用户行为预测模型,分析基于不同特征属性所构建的模型的准确率来研究用户特征属性及其组合对用户行为相似性的贡献度。该模型首先基于相似度矩阵构建符合幂律分布的用户关系图;然后通过邻居采样、聚合邻居等操作构建用户行为预测模型。实验结果表明,单属性中基于性别构建的模型预测准确率为80%,预测准确率最高,则性别对于用户行为相似性的影响最大。属性组合中基于性别+教育程度这一组合的模型预测准确率最高,为65.3%,则该种组合对于用户行为相似性的贡献度高于其他组合。
其他文献
石墨烯因其独特的结构和优异的物理性能在材料、新能源以及航空航天等领域都具有广阔的应用前景。随着石墨烯制备和加工技术的不断发展,使其工程应用具有可行性。但在实际生产制备过程中,制备得到的石墨烯片总是无法避免缺陷的存在而影响其力学性能,裂纹缺陷在荷载作用下还会继续扩展而影响微纳米器件的性能,了解裂纹缺陷在荷载作用下裂纹扩展路径的情况是避免石墨烯灾难性失效的一种有效方法。另一方面,在加工具有特定功能的石
图像融合是一个重要课题在图像处理领域,融合的图像在视觉、监控和医学成像方面有着广泛的应用。其中,多聚焦图像融合是图像融合的重要支系,一直是研究的热点。研究人员提出了大量的研究和算法应用于多聚焦图像融合。大数据时代已经到来,常规的小波分析已无法提供灵活的多分辨率和多方向分解满足应用于大量图像的融合。非下采样剪切波变换(Non-subsampled shearlet transform,NSST)没有
布鲁氏菌属的细菌是兼性胞内寄生菌,属于变形菌门的α-2型分支,会感染多种陆地和水生哺乳动物,包括猪、牛、山羊、绵羊、狗、海豚、鲸鱼、海豹和沙漠木鼠等。动物感染布鲁氏菌后会引起流产、不孕、繁殖成活率低、产肉及产奶量下降、生产能力下降。入侵相关位点B(invasion associated locus B,ialB)基因位于布鲁氏菌第Ⅰ号染色体上,目前关于ialB的报道较少,主要与杆菌样巴尔通体入侵红
外源添加氮磷是草地管理的主要措施之一。研究不同氮磷添加下退耕草地群落优势种的生理与生长响应,对揭示氮磷添加对草地群落物种多样性及稳定性的影响具有重要意义,也可为退耕草地恢复过程中的施肥管理与调控提供科学依据。论文以黄土丘陵区退耕草地群落典型优势种白羊草(Bothriochloa ischaemum)、长芒草(Stipa bungeana)和达乌里胡枝子(Lespedeza davurica)为研究
苹果浊汁营养丰富,风味怡人,符合消费者对天然健康食品的需求。浓缩是提高液态食品品质、延长保质期、降低运输成本的重要手段。苹果浊汁与苹果清汁不同,它含有丰富的多糖等有机大分子,难以通过常规手段浓缩。正渗透(Forward osmosis,FO)技术是一种可常温操作的膜技术,避免了传统热法浓缩造成热敏性活性成分损失的缺点。本研究基于正渗透技术,围绕苹果浊汁的浓缩展开,探究了正渗透技术浓缩苹果浊汁的可行
现实生活中的属性网络分析是一个复杂的问题。高质量社区能够捕获属性网络全局的重要信息,研究可解释性社区发现方法可为推动相关研究的进一步发展和应用提供一定可能性。通常情况下,结构简单的模型可解释性好,但拟合能力差,往往准确率不高。结构复杂的模型,拟合能力强,准确性高,但由于模型参数量大、工作机制复杂、透明性低,因而模型的可解释性又相对较差。社区发现任务中可选择设计结构简单易于解释的模型然后训练该模型,
猪伪狂犬病由伪狂犬病毒(Pseudorabies virus,PRV)引起,仔猪感染死亡率高,母猪感染可导致繁殖功能障碍,成年猪感染PRV可引起呼吸和神经系统疾病。它是猪病中最具危害的传染病之一,给全世界的养猪业带来了巨大的经济损失。PRV进入易感性细胞需要由细胞受体或因子的协同相互作用介导。PRV感染过程中至少有5种病毒糖蛋白(gB,gC,gD,gH和gL)参与其中,并且已将细胞硫酸肝素(HS)
河川径流是寒旱区居民生产生活用水的主要来源,但其生态环境脆弱,对全球环境变化极为敏感。在全球气候变暖和人类活动加剧的背景下,探讨河川径流的变化特征、控制因子并对其未来变化进行预测,可为寒旱区水资源的管理、生态经济可持续发展等提供重要的科学依据。本文以玛纳斯河源区为研究区,利用实测径流和气象数据及土地利用、植被覆盖、大气环流等数据,采用线性回归、Mann-Kendall检验、偏相关、小波相干等方法研
枯落物是连接植物–土壤复合体的重要“纽带”,其分解是生态系统能量和物质循环的重要环节,对退耕地土壤碳氮循环及土壤生物环境有着重要作用。为探究枯落物分解对退耕地土壤碳氮动态变化的影响以及分解过程中酶活性的作用机制,本研究以黄土丘陵区不同恢复阶段刺槐林为研究对象,通过野外模拟枯落物分解与室内分析相结合的方法,探究枯落物分解特征,同时分析枯落物分解过程中土壤(0–10cm,10–20cm)碳氮组分及酶活
水文干旱通常表现为地表径流和地下水量亏缺,与水文循环和水量平衡密切相关。研究东北松花江流域水文干旱及其与气象干旱间的响应关系,对区域防旱、水资源管理及生活生产有重要意义。本文以松花江流域为研究区,利用概率函数模拟并优选大赉、扶余、哈尔滨和佳木斯4个水文站各尺度月径流的最优分布,计算1、3、6、12个月尺度的水文干旱指数SRI,以游程理论识别干旱特征,进而分析松花江流域水文干旱的时空分布特征;使用5