基于系统科学的中药NIR定量建模方法及其稳健性研究

来源 :北京中医药大学 | 被引量 : 0次 | 上传用户:minister635298
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近红外光谱法(near infrared spectroscopy,NIRS)是一种快速无损的分析技术,建立稳健可靠的模型是近红外(near infrared,NIR)应用的前提。近红外定量模型的建立包括样本集的划分、光谱预处理、变量筛选、校正等过程,各建模过程中包含多个建模参数,选择最佳的建模参数有助于提高模型的准确性和稳健性。现有文献中多以模型的预测结果为评价指标优选建模参数,缺少对参数稳健性的评价,且涉及多个建模参数的优选时,常用分步优化方法优选建模参数组合。因此,基于以上问题,本文以开放玉米NIR数据及中药银黄颗粒NIR数据为研究载体,建立关键建模参数光谱预处理和变量筛选的稳健性评价方法,并利用系统科学思想基于系统要素与要素的关联性提出参数轨迹全局化方法优选建模参数组合,在此基础上,将参数轨迹全局化方法引入校正子模型的建立中,基于系统要素与要素的层次性提出串联和并联两种模型融合方法,以期提高模型的稳健性和准确性。主要研究内容包括以下四个部分:一、基于统计分析和共线值的中药NIR数据结构分析研究本文以开放玉米NIR数据及中药银黄颗粒NIR数据为研究载体,采用统计分析和共线值初步分析两套数据的数据结构,对玉米和银黄颗粒数据的指标成分水分和黄芩苷含量进行统计分析,水分及黄芩的含量范围分别为9.38-10.99(%,w/w)和1.61-6.66(%,w/w),其平均含量分别为10.23%和3.83%,且水分和黄芩苷均为正态分布。对玉米和银黄颗粒光谱数据进行共线值分析,玉米和银黄颗粒数据第一主成分和第二主成分的累积贡献率分别为99.84%和99.04%,且第一潜变量光谱矩阵得分与指标成分含测值得分的结果表明玉米和银黄颗粒数据均为少样本弱数据结构。二、基于四种噪音的中药NIR定量建模关键参数稳健性研究本文以开放玉米NIR数据及中药银黄颗粒NIR数据为研究载体,通过添加模拟的高斯噪音、光程噪音、光散射噪音及其组合噪音至验证集、校正集和验证集中,以模型的预测能力和模型的多变量检测限为评价指标比较不同预处理方法的稳健性,并以模型的预测能力和筛选变量的重现性比较不同变量筛选方法的稳健性。两套数据的结果显示:标准正则变换(standardized normal variate,SNV)和多元散射校正(multiple scattering correction,MSC)预处理方法比一阶导数(first derivative spectrum,1D)、二阶导数(second derivative spectrum,2D)和 SG 平滑(Savitzky-Golay filter smoothing,SG(9))预处理方法较稳健,变量投影重要性(variable importance in projection,VIP)变量筛选方法比竞争自适应重采样方法(competitive adaptive reweighted sampling method,CARS)、无信息变量消除法(uninformative variable elimination,UVE)和组合间隔偏最小二乘(synergy interval partial least square,SiPLS)变量筛选方法较稳健。上述内容建立了光谱预处理和变量筛选方法稳健性评价方法,通过噪音同时添加至验证集和校正集,并选用两个评价指标系统地比较不同方法的稳健性,为光谱预处理方法及变量筛选方法的优选提供一定的指导。三、基于中药NIR定量建模参数关系建模方法及其稳健性研究本文以开放玉米NIR数据及中药银黄颗粒NIR数据为研究载体,分别采用分步优化及本文利用系统科学思想基于系统要素与要素的关联性提出的参数轨迹全局化方法优选建模参数组合,建立玉米及银黄颗粒指标成分水分及黄芩苷定量模型,并通过向验证集、校正集和验证集中添加模拟噪音方法比较各方法所得模型的稳健性,结果表明参数轨迹可得多个较优建模参数组合,且最佳建模参数组合所得模型稳健性和准确性均优于分步优化所得模型。以上结果说明过程轨迹用于优选建立定量模型的可行性及优势,基于过程轨迹系统优选建模参数可用于建立稳健准确的模型。四、基于串并联结构的中药NIR定量模型融合方法及其稳健性研究本文以开放玉米NIR数据及中药银黄颗粒NIR数据为研究载体,将参数轨迹全局化方法引入校正子模型的建立中,基于系统要素与要素的层次性提出串联和并联两种模型融合方法,以预测均方差(the rootmean square error ofprediction,RMSEP)、验证集相关系数(the correlation coefficient of validation,Rpre)和预测残差偏差(the ratio of standard error of prediction to standard deviation,RPD)为评价指标,建立玉米及银黄颗粒指标成分水分及黄芩苷参数轨迹全局模型、Bagging模型和串并联模型,并通过添加模拟噪音至验证集、校正集和验证集的方法比较各模型的稳健性。结果表明,采用串并联方法可用于建立稳健准确的定量模型,尤其是串联模型融合方法所建定量模型稳健性和准确性均优于单一模型和Bagging模型。综上,本文以开放玉米NIR数据及中药银黄颗粒NIR数据为研究载体,分析两套数据的数据结构,建立关键建模参数光谱预处理和变量筛选方法稳健性评价方法,为单个建模参数的选择提供指导,此外,利用系统科学思想基于系统要素与要素的关联性提出的参数轨迹全局化方法优选建模参数组合,在此基础上,将参数轨迹全局化方法引入校正子模型的建立中,基于系统要素与要素的层次性提出串联和并联两种模型融合方法,并通过添加模拟噪音的方法比较各模型的稳健性,结果表明所提出的参数轨迹全局在优化建模参数组合,及串并联模型融合方法在建立融合模型方面有一定的优势。该研究为建立中药近红外定量模型过程中,参数的评价和选择、参数组合的优选及建立融合模型提供依据和指导。
其他文献
在世界范围内,共享经济正处于高速发展阶段,中国共享经济发展势头迅猛,并在大中城市迅速崛起。共享经济作为一种新经济业态,其发展的基本要素是什么,在新疆发展现状如何,占新疆GDP的比重有多少?以及新疆应该在哪些领域发展共享经济,发展前景怎么样?本文针对这些问题展开了研究。本文研究数据来源于全国各省市的各类统计年鉴、中国共享经济发展报告、各地区的国民经济和社会发展统计公报等。主要从共享经济发展要素分析、
无线传感器网络(Wireless Sensor Network,WSN)被用于感知和传输各种监测信息,电力行业是物联网感知技术应用较为广泛的领域之一。其中,输电线路物联感知监控可以起到监测电网设备安全,及时防范风险的作用。输电线路在线监测WSN采用特殊的链式拓扑结构,其节点部署和数据传输均具有较强的场景特征。面向输电线路WSN的路由规划技术以层次化路由为主,而现有算法仍存在簇头节点失效过快、簇间路
以聚丙烯腈(PAN)、Zn(NO3)2为主要原料,采用离子交换及共沉淀法制备了PAN/Zn(OH)2复合物,然后在一定温度及氮气气氛下进行热处理得到具有共轭结构的环化聚丙烯腈/氧化锌(CPAN/ZnO)复合材料。采用扫描电子显微镜(SEM)、透射电子显微镜(TEM)、X射线衍射(XRD)、荧光光谱(PL)、紫外-可见漫反射吸收光谱(UV-vis DRS)等测试方法对CPAN/ZnO复合材料进行表征
本研究于2017年和2018年的6~9月在国家节水灌溉北京工程技术研究中心大兴试验研究基地开展,以夏玉米为研究对象进行小型蒸渗仪试验和大田小区试验。通过小型蒸渗仪试验分析了不同施肥水平下夏玉米植株冠层光谱反射率的变化特征,研究了夏玉米植株冠层光谱反射率及其含氮量的响应关系,筛选出玉米冠层含氮量监测的敏感波段与适宜的光谱指数,构建夏玉米冠层含氮量的高光谱估算模型;同时基于实测的夏玉米冠层高光谱信息,
目前,社区文本数据管理系统被广泛应用在各大社区的信息化服务中。随着信息量的爆炸式增长以及人口老龄化日益严重,很有必要建立起社区文本数据管理系统。系统主要包括文本上传、数据存储、文本分类和人机交互四个部分。其中,文本分类要按文本深层次语义信息进行分类,主要包括了文本预处理、文本向量化和分类模型构建等。然而大多数算法没有考虑训练模型的优化、语义信息层面的挖掘,进而导致分类准确率下降,影响系统性能。本文
项目编号:121201074 1403项目来源:中国地质调查局项目起止时间:2007年1月~2008年12月主要完成单位:中国地质科学院地质力学研究所主要完成人:乔彦松,蒋复初,王书兵,傅建利,李
税收是国家财政收入的主要来源,税收收入直接影响着国计民生。现阶段,随着我国经济的发展,税收也随着飞速发展的经济而发展。然而,与此同时,偷逃税款现象仍然屡禁不止,国家出
随着“中国制造2025”战略举措的提出,我国由制造大国向制造强国的转变刻不容缓。工业智能化建设作为“中国制造2025”战略举措的关键,推动着工业生产中智能化机器人快速发展,自动引导运输车(Automated Guided Vehicle,AGV)作为智能化机器人具有安全系数高、应用灵活等特点,使其在物流系统、智能巡逻、制造行业,得到了广泛的运用。路径规划和调度作为AGV应用中的经典研究方向,近年来
随着新世纪经济与科学技术的飞跃发展,也相续产生着许多形态各异的文化艺术作品。影视是一种新兴的文化形态,尤其动画影视在近年的飞速发展,许多国家试着将自己的文化精髓以动画影视艺术的方式去表现,逐渐形成了新世纪文化传播的一种主要方式。对我们藏族而言,已经迈出了藏语电影创作的步伐,藏语动画影视的创作处于初级阶段,所以不仅作品罕见,投入创作领域的专业人才也极其稀少。虽说藏族动画电影的发展较为滞后,但近年也出
为建设海洋强国,船舶导航领域的发展广受关注。目标检测在船舶导航领域发挥着重要作用,检测准确度和检测时长等指标在路线规划、有效避障等方面有着重要意义。传统目标检测方法多基于恒虚警率技术,但其应用在X波段导航雷达目标检测中,往往需要逐点进行检测。本文依托于国防科研项目“舰载X波段航海雷达反演海浪技术”,针对传统目标检测方法在数据量较大时检测时间较长、检测器性能无法保证的问题,基于大量X波段导航雷达海上