国际标准热点技术信息发现

来源 :北京信息科技大学 | 被引量 : 0次 | 上传用户:wxm2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现今标准领域成为一个热门话题,我国在标准领域起步较晚,所以我们要参考国际先进的标准技术信息研制情况从而制定有利于我国标准发展的政策。参考热点信息所具有的行业属性情况决策者可以制定和推动有利于我国标准发展的政策。本文研究的内容就是国际标准热点技术信息发现,这是一个特定领域的知识发现研究。文中首次提出国际标准技术信息的定义,并且首次全面分析了国际标准技术信息的主要数据源。这里所指的国际标准技术信息都是英文文本的信息。因此,如何准确有效的描述英文文本信息就显得十分重要了。文本表示方法的好坏足影响知识发现、文本挖掘效果的主要因素。  为了提高标准文本表示的效果本文提出了一种基于语义相似度的英文文本向量空间表示方法。构建标准领域专有词典,用词典映射提高文本表示效果。把标准领域的语义特点考虑到语义相似度计算方法中,在语义相似度计算方法中引入标准环境下的语义特征因子。借助WordNet词典,提出了一种英文语义相似度的计算方法并用实验验证其有效性。把这一文本表示方法应用在标准信息领域,并用文本聚类的方法验证其有效性。这一文本表示方法解决了传统向量空间模型所忽略的特征之间语义相关性的问题,从而降低了这一问题给实际的应用系统所带来的语义损失。在这一文本表示方法的基础上搭建国际标准热点技术信息发现实验平台,通过文本分类的方法给获取的海量杂乱的标准技术信息打上类别属性标记,并用聚类的方法分析出热点信息所具有的行业类别属性。
其他文献
在Web2.0时代,网络已逐渐由用户单纯地浏览信息发展到更加侧重用户的交互,这产生了一类重要的用户数据:大规模富含情感信息的Web资源。面对如此大规模的情感文本,如何能通过计算
多参数监护仪可以对病人进行长时间的、连续的自动实时监护,能提供多种生理参数的测量和分析,有利于医生及时了解患者的病情变化,是现代化医院不可缺少的医疗设备。由于我国
随着计算机技术和网络技术的飞速发展,现有的搜索引擎虽然采用了各种方法来提高信息的检索精度,但是相关的文档和不相关的文档仍相互混杂,给用户带来了很大的负担。因此,如何快速
时-频分析是信号处理中的重要手段之一。作为经典的时频分析工具Fourier变换建立了信号从时域到频域的桥梁。但它反映的只是整个信号在全部时间下的整体频域特征,而不能提供
在21世纪,以网络通讯技术和多媒体技术为核心的信息技术的迅猛发展在社会的许多领域中引发各种深层的变革,从而加速了人类迈向信息社会的步伐。教育信息化是当今世界教育发展
本文对NTFS文件系统进行了较为深入的研究,系统论述了NTFS文件系统中的各主要的数据结构,并动态分析了NTFS文件系统中各数据结构之间协调工作的原理,并且设计了一个嵌入式NTFS文
随着HT-7、EAST托卡马克物理实验的不断深入,更多的物理论断应用到实验中来,数据量较过去有了爆发性的增长,信号采样频率、数据存取速率、网络带宽等方面都有了新的要求。不
学位
专利信息作为重要的信息资源,越来越受到人们的重视。目前,专利分类采用传统的手工分类方法,存在分类周期长、费用高、效率低、一致性差等缺点。近年来,随着专利申请数量的迅
车身是汽车各大总成中极为重要的一部分,新车型的开发首先是新车身的开发,其开发周期,制造成本约占整车的50%左右。车身外形各曲面片要求光滑拼接,圆滑过渡,遵从光顺原理,其
基于计算机网络传输的远程数字视频监控系统弥补了传统监控系统因专线布局而限制传输距离的不足,使监控主体与客体摆脱了地理位置的束缚,理论上可以相隔任意远的距离,只要通过计