文本分类算法相关论文
随着Internet的迅速发展,以Web形式呈现的电子文本的数据量成几何速度增长。如何高效的组织和管理这些数据,并全面、准确、快速地推......
本文研究内容基于国家自然科学基金项目“项目管理中项目关联分析与立项决策支持系统研究”,项目的相关性分析依据项目建议书的研究......
由于半结构数据具有结构复杂、不规范和易变等特点,研究人员普遍采用灵活的图或树形结构来设计半结构数据模型。在数据模型的基础上......
2008年以来,云计算在IT业被广泛关注。云计算被看作是分布式处理、并行处理以及网格计算发展的产物,其中云计算的关键是并发、分布......
随着计算机技术、数据库技术、网络技术的飞速发展和Internet的日益普及,在现实生活中,每一个领域都不断产生海量数据和信息,特别是海......
随着互联网技术的不断发展,INTERNET上的信息日益丰富,已经成为人们日常工作和生活中获取信息的重要来源。但是,由于INTERNET所固有的......
中文Web文档的自动分类主要还是以文本分类的算法思想为基础来进行的。但由于中文Web文档的数量巨大,内容多样,噪音繁多,很多比较......
Web2.0概念的出现使互联网新媒体发展进入了新阶段。博客作为Web2.0概念下的典型应用正在推动整个互联网业的发展。近几年来,作为......
随着互联网的高速发展,通用爬虫在浩瀚如海的网络世界里,对高效提取有效网页信息显得越来越力不从心。而主题爬虫是解决通用搜索引......
目前大量有用信息以文本形式存在,因此如何快速对大规模的文本分类成为亟待解决的问题。为应对这一问题,文本自动分类应用而生。文......
信息技术的飞速发展和互联网的广泛普及使得人们越来越容易地得到信息。然而,互联网的信息往往是包括各个行业的文本数据,为了高效地......
以网络为重要组成部分的计算机应用走到了一个空前繁荣的时代,各种新的应用环境、应用需求纷纷出现,在一些如搜索引擎、社交网络等大......
随着近几年通信业的迅猛发展,移动通信网业务己成为通信行业的支柱产业之一,如何保障移动通信网业务的正常运行,已成为各大通信运......
近年来,互联网技术迅猛发展,已经应用在我们日常生活中的各个领域。互联网技术也大量应用在农业领域,农业信息化开始出现在人们的......
在关联文本分类算法ARC-BC中,往往采用人工收集训练样本的方法,由于人工方法的主观不确定性使得收集到的训练样本的质量有差异,使得分......
随着互联网技术的飞速发展,网上的资源呈指数增长,人工处理这些海量信息代价非常高昂,因此如何高效地组织和管理这些资源成为近些......
计算机评阅客观题已基本实现,对于主观题,由于它的答题特点和复杂性,目前还没有一种考试系统能很好地完成其自动评阅。随着数据挖掘、......
随着计算机和互联网技术的迅猛发展,网络已经成为人们获取信息的不可或缺的重要来源。自互联网进入Web2.0时代以来,网民越来越习惯......
在以新浪微博近九万条微博作为语料库的为背景的算例下进行实验,结果表明在召回率相近的情况下,该算法在话题推送时比CPAR和SVM算法,......

