论文部分内容阅读
当前,心理问题凸显,然而传统心理学方法很难及时获取心理状态,制约了心理服务的时效性。近些年来,利用网络数据预测人们的心理状况逐渐成为研究热点,由于其利用客观数据,普及面广且能够即时感知用户的心理状态。本文在深入调研当前各种心理建模的技术及问题的基础上,根据网络数据的特点,研究了包括采样、行为分析、监督学习预测模型以及半监督学习预测模型等问题,旨在研究摸索出一系列比较完善的网络心理建模的关键技术,提高网络心理建模效率。本文主要在如下几个方面开展工作: (1)通过对微博用户网络行为的总结分析,深入探讨分析了网络行为与心理特征之间的关联模式,发现网络行为与心理特征的相关性;并根据人口统计学信息比较不同人群之间网络行为,验证了网络行为特征在不同用户群体上的适用性。 (2)心理学研究的用户实验成本高昂。本文采用了主动学习的思路,并设计了适合心理学实验的用户采样函数,帮助选取对心理建模最有用的用户。实验结果表明基于主动学习的实验被试采样方法不仅可以有效提高实验室用户被试的价值,而且选取的用户被试比随机选取的被试,建模的相关性也有提高,在五个人格维度上,至少提高8%,最高提高了一倍。这相当于减少了被试选取的人数,直接降低了获取被试实验的代价。 (3)在微博心理建模时,标注的心理数据有限,而无标注的心理数据量巨大,本文探讨半监督学习算法以充分利用无标注数据,训练的心理特征分类模型,预测精度平均最高为80%。进一步,本文探索适合心理特征预测的回归算法,提取有效的半监督回归算法,让预测误差大幅度减小,相对绝对误差成功的降到75%以下。 (4)利用机器学习算法,针对浏览行为进行网络心理建模。利用朴素贝叶斯和SVM算法训练有监督学习模型,预测用户的心理状态,根据心理学规律建立心理建议库,运用内容推荐模型给有心理健康问题用户做出合适的心理推荐,经过用户的测试,该推荐系统获得了55%以上的推荐满意度,75.1%的测试者对心理推荐引擎的效率表示认可。 本文开展了网络心理建模的多项关键技术研究,为计算网络心理学提供了新的有效的理论和技术支持。这些技术方法的研究,提高了网络心理建模的效率,为将来大规模的网络心理应用打下了深厚的基础,同时促进了网络心理科学的发展。