企业微博粉丝兴趣识别及用户细分研究

来源 :福州大学 | 被引量 : 1次 | 上传用户:xieyinglan2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,伴随Web2.0技术的发展,社交网络异军突起,微博作为一种新型的社交网络媒体,在短短数年内积累了海量的用户,其中,尤以新浪微博为代表。新浪微博依托其庞大的用户群体和流量,创造了巨大的商业价值,逐渐发展成为企业拓展客户关系的重要营销工具。企业可以利用微博平台,建立粉丝关注网络,实现实时快速的商业信息分享与传播,同时,通过分析粉丝用户的相关微博信息,准确把控用户需求,据此进行个性化的信息推荐和营销服务。企业要实现基于微博平台的个性化营销推荐,准确识别粉丝用户的兴趣倾向是关键所在,而微博中存储的海量用户信息和文本内容为用户兴趣识别提供了丰富的数据源。在获取用户兴趣的基础上,基于兴趣相似性实现粉丝用户细分,可以帮助企业了解粉丝用户群体的关注和需求,从而有针对性地面向细分用户群提供个性化的信息推荐和营销服务,提高微博营销的效率和效果。基于以上背景,本文以企业微博的粉丝用户为研究对象,提出一种基于主题模型和机器学习的微博用户兴趣识别和用户细分方法。在构建微博用户兴趣模型时,首先,通过对微博中的信息特征进行全面分析,最终选取用户关注的特殊用户信息和发布、转发及评论的微博时间文本作为挖掘用户兴趣的信息源;其次,针对微博文本短小特点,引入适用于短文本的词对主题模型(Biterm Topic Model,BTM),考虑微博内容的时效性和用户兴趣的漂移,提出时间敏感的T-BTM微博用户兴趣识别模型,全面挖掘用户的长期兴趣、短期兴趣和整体兴趣。利用新浪微博API和网络爬虫采集企业微博粉丝用户的真实数据集,通过实验证明了 T-BTM能够有效识别微博用户兴趣及其变化,且在兴趣提取性能上要优于BTM和LDA模型。在获取用户兴趣的基础上,以实现粉丝用户细分为目标,提出微博用户谱聚类算法(Microblog User Spectral Clustering,MUSC),将用户的兴趣主题分布向量作为特征项,构造基于JS距离的相似函数,构建用户兴趣相似矩阵;求解相似矩阵对应的规范拉普拉斯矩阵及其谱分解;针对传统谱聚类算法中聚类个数无法确定的问题,通过分析拉普拉斯矩阵特征值之间的本征间隙,自适应地确定聚类个数,并据此构建特征向量空间;对特征向量空间实施K-means聚类,完成对粉丝用户的聚类,将粉丝用户划分为兴趣相仿的若干用户簇,并用主题特征词集合形式描述用户簇的群体兴趣。利用微博真实数据集实现企业微博粉丝用户细分,实验结果表明,MUSC算法能够有效划分用户群体,发现粉丝用户的群体兴趣。依托细分的用户兴趣簇,企业微博可以通过计算候选文档与用户簇兴趣特征向量的相似度,生成个性化推荐列表。
其他文献
移行上皮反应基因(Transitional epithelial response gene 1,TERE1),定位在染色体1p36上,编码一个含338个氨基酸,分子量为36.8KD的蛋白质,广泛表达在人类各种组织中,包括泌
暗挖隧道是城市地下空间比较常见的隧道类型,土体的性质和所建构筑物的环境直接影响地下结构的稳定性,且施工过程中需要保证周边建筑物的安全,尤其是暗挖隧道直接关系到隧道
随着环保形势的严峻,国家对环保要求的不断提高,工业烟气处理排放的标准越来越高,循环流化床干法脱硫工艺逐渐崭露头角。该工艺对安装质量控制有较高要求,掌握这种工艺的正确
当前对于互联网技术的应用一定要重视起来,互联网技术具有个性化的特征,所以在网络教育服务中必须要发挥出个性化的优势,解决网络技术个性化融入到网络教育中的各种问题,提高
目的:探讨术前MRV联合术中超声评估对窦旁脑膜瘤的手术治疗的临床应用价值。方法:我院2009年1月至2012年03月经MRI诊断为颅内肿瘤(术后病理检查证实)的患者21例,均行神经外科显
"人肉搜索"是网络时代的热词,也是网络侵权的主要方式之一。人肉搜索让被搜索者的个人隐私不复存在,这使得它在公众的心中多一丝恐惧与忌惮。但网络不是法外之地,对人肉搜索
【目的】探讨Stathmin/Op18在上皮性卵巢癌组织中的表达;分析与卵巢癌临床病理参数的关系。【方法】利用逆转录聚合酶链反应(RT-PCR)和免疫组化方法检测22例卵巢正常上皮组织
随着建筑信息模型(BIM)技术的不断发展,BIM在交通基础设施领域已有广泛应用,但由于技术沉淀不足,仍存在建模困难、可视化效率不足等问题。特别是对路线长、结构异形、受地下
分析现行缓冲包装设计存在的模糊性及可能造成的影响,指出在包装上应用冲击过载指示器,是提高缓冲包装合理化的重要措施。阐述冲击过载指示器的种类、结构、工作原理及性能特点