【摘 要】
:
随着博客信息源成指数级的增长,在博客空间中的信息检索,知识发现等任务正面临着巨大的挑战.博客特有的格式为以博客为载体的数据挖掘任务带来不便.本文提出挑选最具代表性的
【机 构】
:
武汉大学计算机科学与技术学院,长江大学计算机科学与技术学院,
论文部分内容阅读
随着博客信息源成指数级的增长,在博客空间中的信息检索,知识发现等任务正面临着巨大的挑战.博客特有的格式为以博客为载体的数据挖掘任务带来不便.本文提出挑选最具代表性的m个博文构成的博文集对博客兴趣建模,挑选的标准保证博文集中博文的重要性和主题多样性,并根据这两个指标来构造博文评估函数,将其转换成实例选择优化问题求解.实验以博客分类为目标,表明通过本文方法预处理后的博客,能够降低时间复杂度,提高分类准确率.
With the exponential growth of blog information sources, tasks such as information retrieval and knowledge discovery in the blog space are facing enormous challenges.The blog-specific format brings inconvenience to the data mining task with blog as the carrier. The most representative blog post consists of m blog posts. The selected criteria ensure the importance and theme diversity of the blog posts. According to these two indexes, we construct the blog post evaluation function and convert it into instances Select the optimization problem to solve.The experiment to blog as the goal, indicating that the method of preprocessing blog, can reduce the time complexity and improve classification accuracy.
其他文献
脊髓损伤是一种发病率较高的致残病变.振荡电场刺激可以促进损伤的轴突再生.就近年来振荡电场刺激治疗脊髓损伤的进展进行了综述,包括人体临床试验、联合疗法的应用、治疗领
建立了在表面活性剂(十二烷基硫酸钠)的活化作用下,铜试剂修饰的纳米TiO2分离富集,电感耦合等离子体原子发射光谱(ICP-AES)测定Cu2、pb2和Zn2的新方法.考察了溶液pH、洗脱条
进行了Fe(0)和H2O2协同催化降解亚甲基蓝的研究,分析了Fe(0)投加量、H2O2投加量、溶液初始pH值和染料初始质量浓度等因素的影响.研究表明:Fe(0)和H2O2协同可有效催化降解亚甲
目的 克隆表达B.longum NCC2705果糖ABC转运系统中BL0033、BL0034及其截短突变体,验证两蛋白的体外相互作用,并确定介导彼此相互作用的功能区域.方法 将bl0033与bl0034基因克
滞育激素(DH)是导致家蚕滞育生理现象出现的关键因素.研究卵期不同温度和光照节律引起家蚕滞育激素基因Dh表达的变化,探讨温度和光照对家蚕滞育调控的机制.催青期25℃持续光
随着可用的基因组水平代谢网络越来越多,计算方法在这些网络的分析中越来越重要.约束建模法只需少量参数即可建立模型,备受代谢网络分析的重视.本文借助COBRA工具箱,采用约束
ComGIS在当今组件式软件技术潮流中应运而生,应用模型以及模型实现技术的研究是当前GIS领域深入研究的热点,基于COM和ArcObjects的区域环境污染源分析评价系统体现了GIS建模技术在地学领域的具体应用。文章探讨了COM和ComGIS的基本原理以及基于ArcObjects组件库的二次开发技术方法,在分析环境污染源数据的基础上构建了环境污染源专题数据库,通过拟定系统建设目标、系统架构、界面设
目的:分析补骨脂中的挥发性成分。方法:采用顶空直接进样技术采集补骨脂的挥发性成分,GC-MS结合保留指数进行分析鉴定。结果:采用GC-MS分析,检出39个组分;MS结合保留指数定性
文章以重庆市各区县2009年化学需氧量排放量为依据,采用资源环境基尼系数法对重庆市各区县化学需氧量排放状况相对于GDP、人口数、水资源量等自然、社会和经济等指标的公平性
分析了VACOMASS曝气气体精确分配与控制系统在太湖新城污水处理厂应用过程中的工艺运行数据,结果显示,自引进该套系统后各曝气控制区的溶解氧浓度均稳定控制在设定值(±0.3 mg/L)范围内,同时确保缺氧段内溶解氧浓度<0.5 mg/L,保障了缺氧池反硝化反应的稳定、高效进行,出水水质明显得到改善。抽样检测显示,试验池出水TN的平均浓度较对比池的低1.35 mg/L;出水TP浓度较对比池的低0.1