基于多agent强化学习的语义Web爬虫设计

来源 :漳州师范学院学报:自然科学版 | 被引量 : 0次 | 上传用户:yt2099
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web的海量信息导致了搜索引擎的出现,同时,Web数据的迅速膨胀以及频繁的更新对搜索引擎提出了更高的要求,而并行搜索引擎可以提高抓取速度,并改善更新效率.语义Web是对未来Web的一个设想,语义Web的数据同传统Web一样面临着数据的膨胀更新问题.于是研究语义Web并行搜索引擎成了一个重要的研究方向.介绍了如何设计一个基本的面向语义Web的并行爬虫系统.该系统由一个中央控制器和若干个子爬虫组成.中央控制器负责为爬虫分配抓取任务,并汇总抓取的数据;子爬虫负责抓取并抽取URLs的工作.而对于每个子爬虫除了处理
其他文献
高校维修改造工程的总量大,类型也比较复杂,成本控制成为一个突出的问题.应把握维修工程重要环节,在立项阶段、招标阶段、施工阶段和结算阶段对成本进行控制,以达到节约的目
用去壁低渗法制备水仙花根尖染色体标本,采用2×4型析因实验设计,探讨酸解时闻和后低渗时间对水仙花根尖染色体标本制备的影响.结果表明酸解时间为14min、后低渗时间为8min
在双势阱模型的基础上考虑了Josephson流与凝聚体的相互作用而引起的阻尼效应,及粒子之间的相互作用势能差而引起的保守力,及凝聚体耗散等因素,提出了一个经典模型,得出相对