论文部分内容阅读
地理图片共享已逐渐成人们网络社交活动中的重要组成部分,既包含图片拍摄时的地理信息,又蕴含着人们的喜好、意图和形为模式,同时大量地理图片数据揭示着人们活动的共同规律。本文通过分析大量图片的地理信息,挖掘人们的旅行模式和提供贴切的旅行服务,使得图片共享更有意义和人们的旅行更加方便。
本文的研究工作主要包括以下三个方面:
1)提出了景点抽取方法,建立了景点兴趣度评价体系。本文针对地理图片的主观集聚性,人们共享的图片大都是主观的选择,具有主观集聚性,我们通过密度聚类算法(Density-Based Spatial Clustering of Applacafions with Noise,DBSCAN)不同粒度地聚类出景区或景点的信息:并应用类簇中的情景信息构建了客观的景点评价体系,能合理地反映出景区或景点的受关注程度。通过实验分析,结果表明我们的景点抽取与评价方法十分符合客观情况。
2)提出了基于少量地理图片的旅行路线还原方法。在景点抽取与评价的基础上,先基于隐马尔可夫模型,将用户的地理图片序列,解码成用户旅行时的景点路线(SightRoute);并进一步提出均值还原的方法,还原出完整的用户旅行路线,使还原的路线既具有个性化的特征,又包含着人们旅行时的共性特征。文中提出的路线还原方法,适应性广,能满足用户的不同需求,也能十分方便地与用户交互。由隐马尔可夫模型(HiddenMarkov Model,HMM)的Viterbi算法,图片序列还原成的景点路线能满足人们对旅行路线的总体认识,因为日常生活中,人们对旅行路线的认知都是景点路线,描述旅行中的位置也大都与景点相关的;均值还原的实质是均值能反映样本整体的倾向特性,通过大量图片的地理信息,还原出不动点(Non-moved Point)之间符合大众的旅行规律的完整的旅行路线,这样的路线十分平滑,完全符合人们对路线的认识。当不动点采用抽取的景点序列或地理图片序列时,能完整地还原出不同需求的完整的旅行路线,前者称为景点完整旅行路线(Sight Pefect Route),符合人们对旅行路线认识,但与实际轨迹偏移稍大,后者完全恰恰相反,称为图片点完整旅行路线(Point Pefect Route)。通过实验分析,还原方法还原出的各种旅行路线都比较符合用户真实的旅行轨迹。
3)建立合理的实验环境,验证景点抽取、兴趣度评价和路线还原方法的有效性。对于提出的景点抽取与评价方法,我们应用旅行网站的统计信息和自愿者评分的方式,抽取景点序列的nDCG值大于0.9,评价体系的MAE值为39.3。对于旅行路线还原,我们创新性地设计了基于完整GPS轨迹识别的实验验证方法,对提出的路线还原方法中还原出的满足各种需求的旅行路线实验分析。实验结果表明:本文提出的还原方法还原的旅行路线依然满足人们的活动规律,即旅行步行符合人们旅行规律的幂律法则;同时,还原出的路线比较符合人们真实的旅行轨迹,路线偏移度低,路线相似度达79.2%。