基于增量学习的SVM网页分类器

来源 :中国人工智能学会第10届全国学术年会 | 被引量 : 0次 | 上传用户:c122319673
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的到来和网络的迅猛发展,具有增量学习功能的分类技术正逐渐成为当前信息的智能化发现和挖掘的关键技术之一。与传统的分类技术相比,增量学习分类技术的优越性在于它不仅可以舍弃无用样本并减小训练集,而且可以充分利用学习的历史结果,使学习具有了延续性。本文比较了两种基于支持向量机的增量学习算法在网页分类中的应用,并分析了它们各自的性能。
其他文献
IHSMTS是我们提出并设计的一个交互式多策略机器翻译系统,该系统把基于规则和基于实例的类比推理等多种方法有机地结合起来。本文提出了IHSMTS系统中多层次特征一体化的启发式
会议
本文主要陈述现代维吾尔语语料库的建设和管理问题。重点研究和讨论在现代维吾尔语语料库的建设中文本资料的收集和选择原则,资料的管理,对每一个文本的特性来描述它包括文本属
本文对面向奥运的多语种人机对话智能平台进行了研究。多语种人机对话智能平台的研究将在人类历史上第一次利用多语言智能信息处理和服务技术来解决奥运会的语言交流问题,真正
有监督的统计词义消歧方法需要大规模高质量的词义标注实例。词义标注的首要问题是确定词义标注集。基于翻译时源语中多义词被译成不同目标词的现象,一些学者建议采用异词汇化
本文研究与设计的人机对话管理器是面向2008年北京奥运会的多语言智能信息服务系统核心平台的一部分。混合主导的对话管理系统的关键问题是用户输入偏离所期望的对话顺序;而多
会议
自然语言生成是人机对话系统中的基本组成部分。其性能的优劣决定着对话系统应答的智能性和友好性。本文介绍了一种基于模板的自然语言生成方法,并将其应用于多语言智能信息服
本文给出了一个基于知识的Internet新闻信息自动识别、采集、过滤、索引的软件Agent系统KBAS,介绍了该系统的体系结构和功能,讨论了系统实现中涉及的新闻信息采集器、知识库、
随着网络信息的日益增加和广泛传播,口语对话系统已经为越来越多的研究者所关注。本文主要介绍了一个天气预报口语对话系统的设计与实现,该系统可以实现对国内外150个城市的天
对于一个概念来说,存在很多不同的解释,因此,解释说明一个概念的语义是非常重要的,为了得到模糊集合理论中联合的隶属函数,需要一定的定性解释,本文从两个方面讨论了模糊集合的语义
目前网上文本过滤多采用基于关键词匹配的文本分类技术,虽然简单、快捷,但效果并不理想。本文以全信息自然语言理解方法论为指导,采用统计(粗分——主题识别)和规则(细分——倾