虚拟问答社区专家黄页的构建方法研究

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:wr123456789dtdx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于社区的Q&A服务网站越来越成为一种流行的知识共享平台,可以迅速吸引大量用户。在这些网站中,大多数用户不仅是知识的寻求者,也是知识的提供者,通过回答来进行知识的分享与共享,因此这些用户是蕴含知识的载体。然而,专家数量的增加也导致了用户在有知识需求时,难以定位到一个合适的专家寻求答案。针对上述专家难以定位的问题,为了便于找到合适的专家并减轻寻找过程中的信息过载,本文构建了基于虚拟问答社区(CQA)的专家黄页。首先,考虑到文本的长度不一,应用BTM主题模型对问题和专家建模;其次,构建了二维的专家黄页(2DEYP),分别为问题维度和专家专业领域维度,两个维度交叉部分为回答了对应类问题的对应专家集,二维专家黄页从横向和纵向两个方向的生长。由于较近的神经元代表两个神经元具有一定相似性,存在相同的主题,因此提出一种新的神经元标记方式,该方法使用神经元之间的距离作为区分能力。为了进一步减轻信息过载并进一步区分专家,提出了一种新的排序机制,对每一个神经元内的专家进行排序。该排序机制考虑了专家的专业性和专家的活跃性,专家专业性又包含专业性深度和专业性广度两部分。专家专业性深度的计算是根据专家之间问答的点赞数关系得到用户-用户关系网络图,然后基于修正的Page Rank算法得到专家的专业性深度得分;专家专业性广度的计算是基于JS距离的算法,在满足所在领域内专业知识的基础之上,掌握的其他知识越多,该专家专业性广度越强;而专家活跃性考虑回答的数量和时间两部分。最后,通过对专家专业性深度、专业性广度和活跃度进行整合,得到专家的最终排序。通过实际数据,对本文中的聚类方法、关键词提取方法以及专家排序机制进行了真实地评估,实验结果表明该方法具有较好的可行性与良好的性能。
其他文献
随着以社交媒体为代表的Web2.0技术的飞速发展,互联网广告总体市场规模逐年攀升,保持着持续较快的增长。与此同时,Web2.0技术也催生了一种新型媒介文化——参与式文化,即网民基于自发形成的某种身份认同,积极、主动地创作、传播媒介内容。网民对广告的参与行为作为一种主动的参与、创作、分享行为也在参与式文化的概念范畴之内,参与式文化一方面是受众身份转变的重要体现,但同时由于个体媒介素养水平的良莠不齐必
如何从含有异常值点或噪声污染的部分观测数据中有效地恢复出低秩部分,这一问题的实现可以广泛地应用于现代社会生活中,包括机器学习,数据挖掘和图像处理等各个领域。例如购
本文以淮南矿区六个煤矿区的塌陷塘(两座新矿区、两座中年矿区和两座老年矿区)为主要研究对象,采集六座矿区塌陷塘周边土壤、塌陷塘水体沉积物和塌陷塘水体样品,共计90个样品。通过样品的分析,对塌陷塘周边土壤和塌陷塘水体沉积物重金属含量的特征、重金属在不同介质中的浓度分布与其理化性质之间的关系进行研究;采用污染负荷指数法、地积累指数法和潜在生态危害指数对塌陷塘周边土壤和其水体沉积物中重金属的污染情况进行评
菊粉酶是一种能够水解β-2,1-D-果聚糖果糖苷键的水解酶,可用于生产生物燃料乙醇、丁醇、单细胞油脂、低聚果糖和乳酸等工业产品。因此,菊粉酶在医药、保健、食品和生物能源等领域显示出巨大的的应用前景。在利用毕赤酵母高密度发酵生成菊粉酶过程中需要测量的参数包括化学参数、生物参数和物理参数。其中,产物菊粉酶的浓度只能通过考马斯亮蓝法(Bradford)离线测量,这样不仅造成发酵成本的增加,而且对发酵过程
伴随着高科技在各领域的应用,网络通信已普遍引入到控制系统的闭环,形成一种新兴的网络控制系统(NCS)。NCS的存在可以为工程应用带来众多优点,但是同时网络的引入也使得控制系统产生数据包丢失、信号传输延迟等现象,导致网络化系统变差。目前对该方法的研究,主要是将定常时滞和丢包结合,对于具有这类问题的非线性离散T-S模糊控制器与观测器的建模与分析,尚未有系统的理论。本文利用离散T-S模糊模型,提出了一类
矩阵特征值估计是矩阵理论中十分热门的课题,具不变主对角线元矩阵作为一类特殊的矩阵,在图像处理、微分与积分方程理论等方面有重要应用.本文首先利用具不变主对角线元矩阵非奇异的已有充分条件,得到具不变主对角线元矩阵特征值的一个新包含集;其次,利用双α1-矩阵和双α:-矩阵的非奇异性,给出具不变主对角线元矩阵非奇异的两个新的充分条件,并由此得到具不变主对角线元矩阵特征值的两个新包含集;最后,把所获结果应用
在本文中,我们研究了下列一类半线性椭圆方程-Δu+a(x)u=g(x,u),x∈Ω,u=0,x∈(?)Ω.运用变分法和临界点理论,在非线性项是渐近线性和超线性的假设条件下,我们建立了三个存在准则保证上述方程有无穷多个解,改进了已有文章的结果。本文共分三章。第一章介绍了研究背景和意义、国内外研究现状和本文的主要工作。第二章中,在假设非线性项g满足更弱的渐近线性条件下,利用山路引理证明上述方程存在无穷
细纱工序作为纺纱厂的一个重要工序,对纺纱质量、生产效率及成本有着至关重要的影响。采用无刷直流电机直接驱动的电锭细纱机,其运行状态对细纱生产效率影响较大,主要表现为运行中出现的断头直接影响纱线的质量和成纱率。随着工厂信息化管理的需求,传统人工记录锭子断头等工况的方法难以满足需求。为此,本文采用无线自组网、GPRS(General Packet Radio Service,通用分组无线服务技术)和数据
高校档案馆馆藏丰富,包含了学校的历史变迁、科研成果、教职工学生档案等,承载着学校在不同时期的各种活动记录,是一个学校历史发展的见证者。2017年,我国建设世界一流大学和
煤炭资源是我国能源系统的重要组成部分,为我国社会经济的发展提供重要的能源支撑,煤炭长期以来一直是我国的第一大消费能源,煤炭产业与我国经济、社会、政治、生态的发展密切相关。我国资源禀赋的特点是“富煤、贫油、少气”,这一特点决定了煤炭资源在我国一次能源生产和消费中将占据主导地位且长期不会改变。近年来,我国经济增速放缓,煤炭产业产能过剩问题、环境问题对煤炭产业的发展产生了巨大的影响,煤炭业目前面临着巨大