互联网信息自动采集系统设计与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:sabot
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文结合所承担的中国工商银行总行"十五"规划项目"中国工商银行信贷综合管理系统"中的互联网信息自动采集系统的开发任务,对互联网信息的搜索问题和信息集成问题进行研究,并设计实现了该系统.该文首先回顾了互联网信息搜索技术的发展经历,针对不同的搜索技术分别分析了各自的优缺点,结合该系统的需求确定采用元搜索技术来实现该系统的信息搜索功能.接下来,该文阐述了元搜索引擎的基本构成、元搜索技术的评价指标以及元搜索技术的局限性等基本原理.分析了元搜索技术实现中的三个核心技术:搜索引擎选择技术、搜索结果选择技术以及搜索结果合并技术所解决的基本问题以及当前国内外相关的研究成果,在此基础上分别提出了该系统的解决方案.最后,简要介绍了系统的设计和实现方案.该系统通过搜索指标管理模块完成搜索信息的定义,元搜索管理模块实现对定义的搜索指标的搜索,信息集成管理模块实现对搜索结果信息的集成,系统管理模块实现对系统的管理功能.
其他文献
事务处理技术是保证信息可靠性和一致性的关键技术,事务监控器是提供这种技术的一类中间件产品,它是开发、部署、监控和管理基于三层结构的联机事务处理应用系统的基础平台,在构
文章首先分析了视频压缩编码面向对象的智能化发展趋势,然后介绍了在解码端进行研究的意义.然后在第二章介绍了流媒体技术和MPEG-4的视频编码标准.研究一个视频压缩标准的解
网络信息挖掘是利用数据挖掘技术,自动地从网络文档及服务中发现抽取信息的过程,论文首先分析网络信息挖掘技术应用,对数据挖掘中的关联规则挖掘进行深入剖析,分析并且实现了
随着计算机技术的快速发展,通过现代化的信息管理工具管理企事业日常生产经营活动已经成为了一种趋势与发展方向,但是企事业信息化建设与实际生产经营活动中的要求相比还显得相
随着空间技术和载人航天的深入发展,人们停留在空间中的时间越来越长,人们对空间生物学提出了迫切的要求。空间飞行中的环境生物学研究,除了失重生物学、辐射生物学外,亚磁环境生
IP传真系指传真信息(ITU-T建议T.4和T.6格式的信息)的传输路径包含IP网路的通信,该文参考了电信级IP电话/传真系统三层解决方案,比较讨论了IP传真两种实现方式(存储转发和实
计算机网络的吞吐量在很大程度上依靠于高效的网络管理,简单网络管理协议(SNMP)规定了采集和管理网络信息的规则。使用该协议,任何体系结构的网络(包括局域网)可以被指定的网络服务
随着我国空间科学先导专项的启动,包括“硬X射线调制望远镜”、“暗物质探测”等一批空间天文卫星项目已经开始逐步实施。开展空间天文卫星的任务规划是空间天文卫星地面系统
随着计算机及网络技术的飞速发展,使得分布实时系统中硬件平台、操作系统、软件开发环境均存在很大程度的异构性。 中间件的出现,降低了硬件、操作系统、应用软件之间的耦合
该文围绕体系结构的构造与描述展开研究,取得如下主要研究成果:·归纳与总结了现代软件开发的几个主要特点及其挑战,从软件体系结构角度对上述挑战的解决思路,归纳与整理了软件体