面向用户交互网站的信息检索与浏览关键技术研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:gtrfanfan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的飞速发展,以用户交互为核心的网站逐渐成为主流的信息交流平台。用户交互行为包括与网络实体信息的交互,例如分享信息、收藏信息、添加标签和心情投票等,以及与用户间的交互,例如建立好友关系等。这些交互行为极大地丰富了互联网内容,但也使得用户面临信息过载的困扰。因此在用户交互网站中(如允许用户交互的新闻网站、Flickr等),充分挖掘用户交互行为提供的新元素,研究基于新元素特征的关键技术,提供有效的检索和浏览策略,帮助用户快速准确地获取所需的实体信息(如群组、新闻、图片等),是信息检索领域面临的新挑战。   用户为群组中的图片添加标签的同时丰富了群组的语义信息,挖掘语义信息中的主题结构,将群组按主题逐层细化的层级结构进行组织,有助于用户通过层级浏览的方式,逐步明确查询目的,从而快速准确地定位所需群组:用户为新闻进行心情投票进一步丰富了新闻的情感信息,该信息反映了新闻内容对读者心情的影响,挖掘新闻内容的读者心情特征,研究综合考虑心情、语义等多方面因素的新闻检索方法,有助于满足用户多元化的信息检索需求;用户与好友间的交互信息反映了其相似兴趣,挖掘用户与好友问关联关系能够根据好友的喜好预测用户的喜好,从而满足用户日益个性化的检索需求;综合利用用户的多种交互行为,挖掘利分析用户交互行为所反映出的用户行为特征,特别是发现和预测有影响力的用户,能够帮助用户通过有影响力用户,有选择的浏览高质量信息,从而丰富和提升用户的浏览体验。目前,对网络内容检索和浏览的研究多利用其自身信息或用户的搜索日志,较少从利用用户交互信息、综合多种元素的角度,提供检索和浏览策略。本文以允许用户交互的新闻网站和Flickr为研究背景,以网络数据挖掘技术为手段,针对用户交互的上述特点展开研究,主要研究内容包括:   1.提出了一个面向Flickr群组的层级语义结构挖掘、构建方法,用于将群组按主题逐层细化的层级结构进行组织,从而便于用户通过层级浏览的方式逐层明确感兴趣的主题,快速定位所需群组。该方法基于层级主题模型,通过抽取群组集合中具有层级关联关系的潜在主题结构,并将群组映射到己构建的层级主题结构上,形成群组的层级组织结构。在数据集上的实验结果表明,该方法能够有效地组织群组满足用户的浏览需求。   2.提出了一种融合读者情感要素的新闻检索方法,刖于满足用户多元化的检索需求。该方法重点研究了依据读者心情的新闻排序算法,并考虑新闻内容与查询词的语义相关性,以及新闻的重要性随时间变化的特性,实现了一种从多角度满足用户需求的新闻检索方法。基于所提方法,我们设计了一个新闻检索系统,验证了该方法的有效性和实用性。   3.提出了基于Flickr用户兴趣挖掘的个性化检索模型,通过挖掘用户与好友间的兴趣关联关系,利用好友喜好预测用户喜好,从而满足用户个性化的检索需求。该模型基于图分割方法将用户兴趣用统一的潜在特征空间表示,并利用判别式模型进行特征选择,实现基于好友喜好预测当前检索用户喜好。在数据集上的实验分析表明,该方法能够提高用户对检索结果的满意度。   4.提出了一个发现和预测Flickr群组有影响力用户的研究方法,用于识别现阶段以及预测近期阶段,用户认可度高、关注度高的有影响力用户,从而便于用户通过有影响力用户选择性地浏览高质量信息。该方法基于社交网络结构理论,由行为网络构建、网络结构特征挖掘、用户行为模式分析、用户影响力计算和用户影响力预测五个主要步骤组成。在数据集上的实验分析表明,该方法能够有效的对用户影响力走势进行预测。
其他文献
人脸特征点的自动定位技术一直是学者们研究的热点,可以应用于三维人脸建模,人脸表情识别等领域。目前人脸特征点定位的方法较多,但在定位精度和计算速度方面都存在需要改进
从20世纪80年代闭环辨识的概念提出以来,闭环测试条件下的多变量系统辨识一直是过程控制领域的热点问题,它对多变量控制系统设计以及控制器的参数调整等方面都有着重要意义。
模块化机器人是由一系列标准的关节模块和连接模块构成的机器人系统。传统的机器人一般都是基于位置控制的机电一体化系统,将力矩传感系统引入机器人中,可以提高机器人的智能化
语义角色标注是一种浅层语义分析技术。它以句子为单位,不对句子所包含的语义信息进行深入的分析,而只分析句子的谓词—论元结构。语义角色标注能够为信息抽取、问答系统、以
针刺作为一种传统中医治疗手段,以毒副作用小、经济、适应症广、疗效显著等特点得到大力推广并逐步被国际医学界认可。然而由于传统中医理论难以与现代生物医学理论相融,使得
对睡眠的研究是一个很重要的课题,睡眠主要分为晚上的整夜睡眠以及白天的短时睡眠,这两种睡眠的机理是不同的,对人体的作用也不同。在睡眠的过程中,人对外界刺激所作出的反应
在公共安全领域,原有身份认证方式逐渐显露其弊端,公认的比较可靠和安全的的生物特征识别技术随之出现,其中的静脉识别由于其具有活体识别、内部特征、非接触式采集、且在特定条
本文以风力发电实验平台为依托,以低速大转矩永磁同步电机作为研究对象,结合永磁同步电机的特性,着重进行了永磁同步电机驱动控制研究。首先针对关于永磁同步电机驱动相关方面,对国内外研究现状与相关技术进行了解和分析,针对实验平台的硬件建立了仿真模型并选取相对合适的算法。其次推导和分析了坐标变换原理,熟悉各个坐标系间的互相转换,并结合PMSM空间矢量坐标关系,推导永磁同步电机在三种坐标系(a-b-c、α-β
美国国家科学研究委员会发布的《2013-2022年行星科学的愿景与航程》报告指出:“火星在行星中是独特的,它经历了与地球相似的形成与演化过程。”基于此,当今世界主要航天大国对
交通问题是城市发展过程中的严重问题,交通拥堵已经成为“城市病”的典型特征之一。由于城市空间有限,开发现有交通资源的潜力成为解决交通拥堵现象的首选方案。  交通流理