论文部分内容阅读
学术社交网络中关键人物挖掘算法是一种通过分析学术社交网络信息找出网络中具有代表性关键人物的算法。这类算法可以分析学术社交网络中原本容易被忽略的信息,通过挖掘其深层的联系,挖掘出具有代表意义的关键人物。关键人物挖掘技术通常被认为是关键节点挖掘。根据原理的不同,关键节点挖掘主要分为基于PageRank算法和基于社区发现两种方法。其中,基于PageRank算法的方法只考虑了网络邻居对节点的影响,忽略了节点本身的属性信息;基于社区发现的方法则是通过分析社区的划分和社区的凝聚度来寻找关键节点,但却忽略了邻居节点的重要性对评估节点重要性也具有重要意义。Skyline算法主要研究自身属性与其他目标属性作对比,多应用于多目标决策问题,我们研究发现将Skyline算法用于寻找关键节点也是一种有效的解决方法。 本文结合PageRank算法的重要性传播的优点和Skyline算法的着重关注自身属性的优势,提出了一种新型的学术社交网络中关键人物挖掘方法,我们称之为PageSkyline。该方法通过构建学术社交网络,计算学者的PageRank值,并且对PageRank值的人物集合进行排序;然后在Skyline算法的基础上结合PageRank排序的结果快速得出关键人物。同时,我们设计了基于PageSkyline算法的关键人物推荐系统。 数据日益增长,单机版算法并不能满足实际需求,因此本文也采用分布式思想,设计了基于MapReduce框架和Spark框架的实验。实验表明,本文提出的PageSkyline算法应用在学术社交网络中可以快速的找出关键人物。此外,将其应用于关键人物推荐,也取得良好的效果。为关键节点挖掘和推荐系统提供了一种新的解决思路。