社会媒体下地理数据的处理与应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:mc_2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0技术的迅速发展和GPS手持移动智能设备的广泛应用,人们在使用各种社会媒体的同时以各种各样的形式分享自己的地理位置,产生了大量地理数据。例如用户在Flickr上分享某一地点比较有名的地标图片,在Foursquare上分享他们当前所在的商户位置。这类地理数据除了包含地理位置信息外,还通常关联其他各种上下文信息,比如时间和文本标签等。这些内容丰富、形式多样、数量巨大的地理数据能够服务于基于地理位置的各种应用,比如社会媒体的组织和检索、旅游推荐和媒体可视化等,因此如何对来自社会媒体的地理数据进行有效处理就成为开展基于地理位置的各种应用的关键。  来自社会媒体的地理数据和传统的网络多媒体相比有自己更突出的特点,比如这些地理数据通常都包含位置信息,数量巨大和数据异质等。尽管研究人员已经做了大量的工作,但是来自社会媒体的地理数据处理技术仍然存在着一些关键问题需要解决,比如异质多模态信息的有效融合和统一建模,跨平台的信息关联等。针对以上问题,我们从社会媒体下地理数据的处理和应用两个方面进行了研究和探讨,主要研究内容和贡献如下:  (1)基于场景和角度的地标总结。考虑到地标场景和拍摄角度的多样性,我们提出了一个场景角度主题模型对地标进行总结。在角度聚类集合的基础上,该模型能够学习来自不同角度聚类共享的场景主题子空间以及同一场景下不同角度聚类所特有的场景角度主题子空间。我们利用学习的两类主题子空间得到每个地标对应的不同场景和角度的代表性图片。  (2)基于时空主题的地标分析。来自社会媒体的地标图片除了地标的视觉信息外,通常还包括和它关联的其他信息,比如文本和时间信息等。本工作充分考虑各种异质信息提出了一种时空主题模型学习地标的三类主题子空间,即所有地标都享有的全局主题子空间,只和某个地标相关的位置主题子空间以及在某个地标的某些时刻对应的时间主题子空间。此外,我们考虑地标和位置主题的关联以及地标-时间和时间主题的关联引入了基于互信息的正则化的优化目标函数。最后我们利用贝叶斯定理从地标的时间和空间两个方面对发现的主题进行了分析。  (3)基于异质元数据的社会事件检测。社会媒体下的地理数据和关联的其他各种信息(比如时间信息)的重要应用之一是检测这类媒体数据中的社会事件实现基于社会事件的媒体组织和搜索。本工作充分考虑社会媒体的各种异质信息包括位置信息,时间信息、文本和视觉信息进行社会事件检测。为此我们提出了一种鲁棒的高阶联合聚类方法。一方面构建星结构的K分图建模社会媒体本身和各种类型的信息之间的依附关系,实现这些异质信息的有效融合;另一方面考虑时间空间内时间之间的关系,并将该关系作为全局正则化项引入到总的目标函数中,进一步提高了社会事件检测的精度。  (4)基于位置情景的跨平台个性化推荐。在地理数据处理和分析的基础上,本工作设计了一个基于位置情景的跨平台协同应用:在给定某一位置情景和两个不同的社会媒体平台Flickr和Foursquare的条件下,让Flickr用户能够享受来自Foursquare的当前位置的商户信息服务,同时让Foursquare用户能够享受来自Flickr的和当前位置相关的图片服务。为此,我们提出了一个跨平台多模态主题模型,一方面该模型能够区分和发现两类不同的主题,即平台特有的主题和所有平台共享的主题,以平台共享的主题作为桥梁连接两个平台;另一方面,该模型能够对齐同一主题来自不同平台的多种模态,保证不同平台之间不同模态的特色推荐。
其他文献
推荐系统通过对内容和用户行为的分析,建立适当的模型,帮助用户从海量的数据中找到自己感兴趣的内容。推荐系统中用户的行为反馈包括显式反馈和隐式反馈,其中隐式反馈信息在推荐
该文首先对某热轧厂2050mm板形计算机控制系统进行消化、分析,根据系统的应用软件,提炼相相应的板形控制模型.同时,从整个系统角度出发,对整套计算机控制系统进行描述,总结出
该文主要研究了直升机地形跟随的系统要求,地形跟随飞行航迹控制器的设计;并利用模糊控制和神经网络来设计地形跟随的习控系统部分.首先对TF技术的发展作了简要的介绍,建立了
该文主要介绍了统计信号处理在通信系统中的两上重要应用--信道均衡和多用户检测,其中后者是前者在多用户通信条件下的推广.该文工作的第一个重点是对建模成FIR(有限冲激响应
该文论述了交流伺服系统的发展历史和技术现状,分析了交流永磁同步电动机的数学模型,研究了解耦控制的不同方式及其解耦控制效果,指出电流比例型解耦控制的有效性.针对伺服系
该论文在综述了神经网络及其辨识与控制方法的基础上,针对具有不确定性和时变性的非线性系统,结合自适应控制方案,提出了两种神经网络自适应控制方法,通过计算机仿真,证明了
该文对具有大滞后的工业复杂对象的控制问题,进行了评述,对各种控制方法进行了论述和比较,同时将预测控制、模糊控制的现状与发展趋势作了一些综述.现有的模糊控制方法一般适
预见控制是未来目标值及示来干扰在一定程度上为已知的情况下,充分利用这种未来情报来改善控制系统的性能的方法.预见控制主要应用于对一定程度的未来目标值及干扰已知的控制
应用管理信息系统(MIS)作为企业生产和经营管理的工具已成为企业发展的必然趋势,许多钢铁联合企业都十分迫切地要求开发应用计算机管理信息系统.由于大型钢铁企业业务和管理
统计参数语音合成,特别是其中的基于隐马尔科夫模型(Hidden MarkovModel,HMM)的语音合成,近年来经过了一个快速而蓬勃的发展期,展示出一系列优点,包括输出语音平稳、流畅,可以快速