基于BI的专利数据整合分析研究及实现

来源 :北京工业大学 | 被引量 : 6次 | 上传用户:b188413920
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专利作为能迅速、全面反映科技创新成果的重要形式,对跟踪政府、市场、企业行为等具有指导意义,专利信息已成为不可或缺的情报信息源。因此,专利文献信息检索服务、专利信息统计分析及数据挖掘已经受到国内外越来越多的重视,意在从海量数据中收集有效专利信息,帮助了解企业或国家的技术地位、研发动向,识别技术领域和技术机会,从而提高专利预警能力,引导高效决策等。目前国内在专利分析方面主要提供专利信息分类、检索、管理、统计等服务,但仍存在分析前数据预处理弱、分析指标与分析方法不匹配、多维分析和数据挖掘深度不够等问题;而且使用的软件工具多针对单一专利库进行外部特征项统计分析,未能实现对异构数据源的数据结构操作,使得数据源融合度不高、可扩展性差。本文针对基于概念检索抽取到本地数据库的专利数据源,设计并实现了基于BI(Business Intelligence)的专利数据整合及分析方案,即结合本地专利数据源特征及现有专利分析方法,搭建面向KPI指标分析主题的数据仓库;专利数据从数据源加载到数据仓库的过程中,为由于专利数据源存储格式的不同导致的异构数据,以及系统因素或人为错误引起的“脏数据”设计相应的ETLfE\1raction._rramsformal,ion.Loading){l见则并执行包处理,即通过数据抽取、清洗、转换得到高质量、规范、纯净的专利数据,将其装载到数据仓库中,并实现维表和事实表的逻辑关联;对数据仓库中的专利数据建立多维立方体和多维数据模型进行联机分析处理和数据挖掘,完成基于KeI(Keyr PeV. Peformance Indicator)指标的专利信息分析,并通过E=vcel2007数据挖掘插件实现前端展示,呈现商业信息。本文的创新之处在于:第一,设计了基于数据仓库的商务智能技术方案框架应用于专利数据整合及分析研究领域,解决数据源异构、数据不规范、分析深度不够等问题;第二,利用sQL Server整合服务SSIS完成各类维表和事实表的ETL设计,通过执行包处理完成专利数据从业务数据源到数据仓库的装载工作,并实现了对维表和事实表数据发生变化时的跟踪处理;第三,在sQL SeiⅥr 2005。Analysis Setvices中以专利数据仓库为数据源,建立多维数据集模型,设置面向KPI指标的维度层次结构和维度关系,通过OLAP完成切片、切块、钻取、旋转等数据分析操作,并选择前端展现工具Excel 2007数据挖掘插件将分析结果以数据透视图的形式实现商业信息的呈现。
其他文献
贮氢合金是一种重要的功能材料.在多种贮氢合金中,AB_5型稀土系贮氢合金的应用最为广泛.本文用正电子湮没技术(PAT)对AB_5型混合稀土贮氢合金的缺陷进行了研究,并结合X射线衍
近几年来,世界经济发展迅速,随着全球对原油资源需求的不断增长,原油国际贸易不断发展,国际原油市场也越来越成熟。随着交易机制和仓储设施的不断完善,原油贸易模式也进一步
怎样才能不断地提出问题,分析问题和解决问题呢?我个人的经验是,首先要认真地反复地学习党和政府的政策和文件,了解工作的方针是什么?政策界限在那里?哪些是值得注意的问题?
伴随着国民经济的飞速增长,我国的天然气工业不断发展壮大,天然气消费量与日俱增。作为最清洁的化石能源,天然气将在未来的能源市场中占据举足轻重的位置。然而,我国的天然气
近几年来,由于编辑的不断努力,在我们的新闻照片中,出现了很多好的照片说明。但也有一些照片说明写得思想性不强、不够鲜明生动。要写好照片说明,必需作多方面的努力,首先要
近年来,全球各地的商业贸易活动和因特网广泛结合,催生了电子商务的快速繁荣。随着国内因特网用户的不断增加,利用因特网进行网络购物的消费方式日渐流行,消费者对C2C电子商
科研机构的科技资源使用效率及规模收益情况是决策者制定相关科技政策的重要依据之一。本文的研究范围为科研机构相对效率和方向规模收益分析方法,从科技投入使用和组织规模的
1979年上半年,中国作家协会会员、湖北长阳县农民诗人习久兰身患重病,在宜昌市医院逝世了。他住院期间,宜昌报文艺副刊《西陵峡》的编辑去探望时,这位被誉为“泥巴腿子上诗
该文在论述了供应厂商的选择歌功颂德在企业的生产经营中的重要作用,分析了买方市场下选择供应厂商应遵循的原则和可能的影响因素的基础上,较系统地分析了在新形势下,做好供
在山西省资源型经济转型综合配套改革试验阶段,山西煤炭运销集团有限公司投资组建了新的煤炭经销单位—煤炭超市。“煤炭超市”借鉴了现代大型综合超市商品种类齐全、直接服