竹类种质资源数据抽取与分类方法研究

来源 :安徽农业大学 | 被引量 : 2次 | 上传用户:Gaosboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
论文针对我国竹类种质资源基础数据不全面、不完整、信息分析处理和利用程度低,以及竹亚科属种分类存在争议的问题,开展竹类种质资源数据抽取与分类方法研究。研究以构建竹类种质资源数据库为基础,主要解决两个问题:竹种形态学数据的自动抽取与结构化问题、基于数据挖掘的竹种归属分类建模问题,以及竹类种质资源数据挖掘系统的设计与实现。论文首先研究了基于正则抽取模型的竹种数据结构化方法,完成对竹种形态学数据的自动获取;再以竹种形态学数据库为研究对象,基于支持向量机算法构建了竹种归属分类模型;最后采用Java语言和MySQL数据库,研究开发了竹类种质资源数据挖掘系统,从实例角度验证了前述方法的可行性和有效性。具体研究内容及成果如下:(1)研究了基于正则抽取模型的竹种数据结构化方法。该方法以竹种数据库属性为抽取模板,利用正则表达式构建抽取规则,构建竹种正则抽取模型,并设计实现了竹种信息抽取系统,解决了从竹类植物历史文献和电子资源中自动抽取竹种形态学数据并结构化存储的问题。(2)研究了基于支持向量机算法的竹种分类方法。该方法以ReliefF算法为属性选择策略,以SMO函数为建模算法,以网格搜索法结合交叉验证优化模型参数,构建了基于混合策略的竹种归属分类模型,并在竹种数据库上进行小样本实例验证,证明模型对竹种分类的有效性。该方法为竹亚科分类提供了一种基于数据和多参数定量分析的方法。(3)研发了竹类种质资源数据挖掘系统。在Eclipse平台上通过Java语言和MySQL数据库编程,设计开发了竹种数据挖掘系统,实现了论文中提出的方法。系统从功能上设计了对不同用户的权限管理、对源数据的多方式采集、对竹种数据的预处理与分类挖掘、以及对数据库的维护与检索模块。论文研究探索了数据挖掘技术在竹类种质资源信息保护、存储、分析以及竹类植物分类上的应用和实现。研究成果对提高竹类种质资源信息利用程度,创新竹类种质资源数据分析、处理与优化的方法和技术,建立竹亚科植物分类方法体系具有重要的理论研究价值和实际意义。
其他文献
计算机网络的出现极大方便了人们之间信息的传输与获取,但也造成了数字化作品版权失控的问题。数字水印技术的产生,为多媒体数据版权保护、内容认证及操作跟踪的研究开拓了新
文本特征提取是从文本信息中抽取能够代表此类或某文本的信息。特征提取方法研究的目的是过滤数据噪音特征、选择最优的特征子集来优化文本的表示,实现文本数据降维并提高降
传统的分类问题中,一个实例只和一个类标号相关联,但是多类标号分类问题中,一个实例可以和多个类标号相关联,所以,与单类标号分类问题的任务不同,多类标号分类的任务是为一个
随着网络和多媒体技术的迅速普及和发展,越来越多的用户使用多媒体设备和网络获得并查询图像。因此图像检索已经成为一个研究的热点。现有的图像检索技术主要是基于文本查询
网络信息含量的爆炸和过载给人们带来了Web时代的新挑战,网页分类是组织和利用海量互联网信息的一种有效途径。在已出现的多种网页自动分类算法中,支持向量机(SVM)学习能力出
社会发展带来物资与人员的流动。作为经济流动与发展的基础之一,物流行业在近年来得到了巨大的发展与进步,同时物流的成本也受到越来越多的重视。在运输环节,解决车辆路由问
古琴,是中华民族传统文化的瑰宝,更是世界人类文明的重要文化遗产。当前,随着信息科学与技术应用领域的不断深入,各学科领域的信息化、数字化工作正以前所未有之势开展,计算
人体运动捕捉是计算机视觉领域倍受关注的一个研究热点,在智能视频监控、视频分析、动画、游戏、医学诊断和人机交互等领域均有广阔的应用前景。它包括人体的标定与跟踪和人
检测技术及设备在工业、农业等领域应用非常广泛。面对高性能、便捷性等市场需求,系统架构是检测设备成败的关键因素。传统的检测平台或终端多采用以单片机或简易嵌入式微处理
随着生物数据的增长,利用计算机处理,分析和存储浩如烟海的生物数据已经成为一种趋势,从原始的序列分析逐渐发展到包含基因组学,基因表达研究学、和结构生物学的科学。MADS-box基