微博内容对移动应用销售的影响研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:a247114340
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博作为新型社交媒体的代表,自诞生以来就具备以用户为信息产生源和以用户为关注中心两个不同于其他媒体的特点,这也使其吸引了全世界十几亿的使用者,成为当今最热的网络媒体。微博用户在使用微博的同时产生了大量文本内容,这些文本内容具有相当研究价值,也逐渐成为国内外学者研究的焦点。国内受微博用户关注最高的行业是移动互联网行业,移动应用的使用和销售情况在微博中的讨论热度极高。本文旨在通过文本处理方法、情感分析方法和数据回归方法研究微博中与某一移动应用的相关内容对该移动应用销售情况的影响。微博是短文本数据,所以处理微博的内容需要应用一系列的文本处理手段。本文首先研究了现有的文本预处理方法、主观识别方法和情感分析方法,其次针对微博的特点,提出了基于信息来源和关键符号屏蔽推广信息的预处理方法,然后用2-POS方法标记微博的主观性程度,最后运用X-Means聚类方法将微博样本按情感特征标记为四个类别,并对四个类别进行分析得到各自的特点。基于微博的基本操作包括转发、评论、赞、关注、阅读等,每个操作都有不同的影响作用,本文通过对现有微博影响力计算方法的研究,基于TURank方法提出了针对本研究的微博影响力表示方法,并根据微博数据回归得到微博阅读量的计算公式。运用以上得到的研究手段和处理方法,并结合一些统计方法,对抓取的微博进行处理得到每条微博的统计量特征、情感类别特征和影响力特征,再根据日期和移动应用名称将微博数据合并得到关于某移动应用的微博特征样本,最后通过对移动应用市场的每日下载量数据进行记录,得到研究需要的微博特征样本。本文利用一系列统计手段对微博特征样本进行分析,结果显示软文型微博的比例和绝对数量分别有78%和73%的概率对下载量产生正向影响;原创赞扬型微博不一定(有49%概率)会对下载量有正向的影响;吐槽型微博的绝对数量有79%概率对下载量产生正向影响;一段时期内关于某一移动应用的所有微博的发博人平均粉丝数越多、微博的平均赞数越多、微博平均被阅读的次数越多,则在相应时期内该移动应用的下载量就越大;有关某一移动应用的所有微博的数量和平均字数不仅影响着该移动应用在微博中的讨论热度,也影响着该移动应用在移动应用市场的下载热度。本文在最后采用线性回归模型对得到的微博特征样本进行回归分析,下载量作为因变量,其他的16个特征(包括情感分类特征、影响力特征和统计量特征)作为自变量,采用逐步回归的方法得到5个有效的预测模型。
其他文献
期刊
工程教育教学质量的提升亟需成立工程教育系等专门凝聚工程教育教学和研究资源的组织机构.美国普渡大学工程教育系根基深厚、资源丰厚、特色明显,形成了涵盖新生工程教育项目
期刊
本研究旨在对某管理学院工商管理本科专业零售管理课程翻转学习的效果进行评估.该课程中消费者价值传递及运营管理的相关内容被翻转,重新设计后的模式从以教师为中心转变为以
期刊
近十多年来,全球气候变暖问题已被国际社会列为全球十大环境问题之首,人类活动排放的温室气体中对气候变化影响最大的是二氧化碳。2010年8月,国家将陕西确定为低碳试点省,低碳发