论文部分内容阅读
基于话题的信息组织,检索,分析等服务已成为学术领域的重要研究话题。学术会议检索主要是根据学术会议名称、召开时间等信息进行检索,可以设定基本检索和高级检索。然而,这些基本的检索已经不能满足学术研究领域的服务需求。目前,基于社会网络的理论和方法对学术领域的信息挖掘技术已经成为研究的热门。学术文献资源是进行这些研究很好的载体,其不仅包含丰富的文本信息,而且有文献引用关系组成的网络,再加上作者、会议以及它们之间的关联关系,组成了非常复杂的社会网络。因此,在这些数据的基础上,以学术会议为对象,利用有价值的学术资源信息,分析学术会议的话题趋势,同时,基于文献引用关系进行学术会议推荐,进一步改进学术会议检索系统的性能,具有十分重要的意义。对于学术会议的话题趋势分析,构建学术会议的话题模型,对学术文献和学术会议的话题统一建模,根据各个学术会议各个年份的学术文献分析学术会议话题,直接对学术各个年份的话题分布进行建模,然后根据模型训练得到的话题进行话题过滤后分析学术会议的话题趋势。采用聚类及词组抽取等方法直接分析各个话题的名称,从而得到学术会议研究话题各年的分布情况,分析其趋势的变化。研究了基于话题的学术会议推荐,学术研究人员可以根据自己的论文及其参考文献,利用模型为文献选择相关的学术会议。通过学术文献及其参考文献的分析得到各个学术会议的话题分布参数,在话题层面分析学术文献与各个学术会议的相关性,从而辅助进行学术会议的推荐。通过实验,验证了本研究课题中的模型及方法,可以有效的利用学术会议及其文献信息,改进学术服务,提高服务质量,推荐准确率达到83.7%,而不考虑引用关系的准确率为75.4%。