论文部分内容阅读
目的:探究高光谱成像技术在枸杞子有效成分含量预测、产地识别方面应用的可行性。建立枸杞子有效成分含量预测和产地识别模型,为枸杞子工业生产提供快速、无损、低成本的鉴别技术。从技术层面上,探究解决枸杞子市场流通中以次充好、产地混用等问题的方法。
方法:(1)查阅本草文献、科研论文、标准规范、相关专著等,通过归纳和总结进行文献研究。明确目前使用的枸杞子药材的基源种、道地产区以及主要成分等,通过对现有检测技术以及高光谱技术进行综述,为枸杞子识别奠定理论基础。(2)通过实地调查,获取枸杞子样品。利用超高效液相色谱串联三重四级杆质谱法测定枸杞子中维生素类、有机酸等化合物;蛋白质含量利用《GB5009.5-2016蛋白质》食品安全国家标准中第一法进行测定;枸杞多糖含量利用2015版《中华人民共和国药典》规定的紫外分光光度法检测。(3)利用MaxEnt模型,进行宁夏枸杞分布区划;利用SPSS,逐步回归、聚类分析、相关分析、主成分分析等统计方法,分析枸杞子中指标成分与环境因子之间的关系,并构建关系模型;利用ArcGIS软件,基于关系模型进行枸杞子中各指标成分含量的区划分析。(4)利用高光谱成像仪,获取枸杞子药材样品的光谱数据。(5)利用ENVI、Matlab软件,对高光谱数据进行主成分提取,特征波段选择,采用黑白板校正进行相对反射率输出,选择感兴趣区域的样品提取出平均值及标准差光谱数据、使用多元线性回归以及最小二乘支持向量机从多元散射校正、S-G平滑、标准正态变换等方法中选出最佳预处理方法,利用成分含量与反射率数据的相关性,筛选有效波段。分别利用特征波段、有效波段以及主成分降维因子建立最小二乘支持向量机模型,得到枸杞子中枸杞多糖、水溶性维生素、有机酸等5个成分的含量预测模型。(6)利用Matlab软件,在含量预测模型的基础上,使用偏最小二乘模型以及BP神经网络模型进行枸杞子产地识别模型的建立。
结果:(1)通过历代本草的研究结果可知药用枸杞的最终品种确定为宁夏枸杞(LyciumbarbarumL.)、道地产区为宁夏、用药部位分为根皮、实、叶三部分,而枸杞子的性味确定为甘平。宁夏枸杞主要种植地在《中国植物志》等文献资料中多记录在西北和中南部,尚没有关于东北地区人工种植宁夏枸杞的记载,通过本研究发现辽宁和吉林省也有宁夏枸杞的少量种植。(2)枸杞子的5大产区间具有明显的分布特征,在宁夏地区为高品质与中品质枸杞子区;内蒙古为低品质枸杞子为主;青海为中品质与低品质枸杞子;甘肃有少数区域分布高品质与中品质,大部分为低品质;新疆地区为高品质与低品质枸杞组成。(3)利用ENVI提取图像的主成分,通过特征向量筛选出光谱数据的特征波段为:573nm、909nm、1232nm、1243nm、1488nm。多元线性回归与最小二乘支持向量机的方法筛选出预处理的方法为标准正态变换。(4)以降维因子作为输入变量进行最小二乘支持向量机的建模结果如下,枸杞多糖含量预测模型为410-990nmSNV平均光谱数据,降维因子数目为5,MAPE为17.7798%。相同实验组条件下,有机酸与总黄酮的含量预测模型,降维因子数分别为27和18,MAPE分别为28.3539%和36.1831%。蛋白质的含量预测模型条件为950-2500nmSNV平均光谱数据,降维因子为18,MAPE值为11.9622%。维生素的含量预测模型条件为410-990nmSNV标准差光谱数据,降维因子为18,MAPE值为13.9095%。(5)特征波段的建模结果中,维生素含量模型MAPE与MSE值分别为12.4339%与0.0118。蛋白质含量模型的MAPE与MSE值分别为11.0127%和2.8301。枸杞多糖含量模型的MAPE与MSE值分别为11.7629%与3.3698。有机酸含量模型的MAPE与MSE值分别为43.6941%与0.5968。总黄酮含量模型的MAPE与MSE值分别为49.3254%与0.1462。(6)有效波段建模结果为,维生素含量模型MAPE与MSE值分别为16.0841与0.0127。蛋白质含量模型的MAPE与MSE值分别为12.9027%和2.7997。枸杞多糖含量模型的MAPE与MSE值分别为18.3443%与5.2101。总黄酮的MAPE与MSE值分别为29.9628%和0.0961,有机酸的MAPE与MSE值分别为27.3894%和0.2614。(7)利用偏最小二乘回归建立产地识别模型时,使用MSC、SNV、S-G平滑三种预处理方法同时设置不同的主成分因子数。结果显示在使用SNV预处理方法进行建模时得到的准确率最高。SNV数据在降维后预测准确度提升2%,准确率到达96%以上。BP神经网络的预测集准确率普遍在82%左右,5类产地的建模集预测准确率基本都在85%以上,测试集的预测准确率在80%以上。
结论:高光谱成像技术在枸杞子主要成分含量预测与产地识别中应用具有一定的可行性。高光谱成像技术在中药领域应用的新思路“药材样品—>成分含量<—>光谱特征—>含量预测模型—>预测含量”,“药材样品—>产地差异<—>光谱特征—>产地识别模型—>产地识别”。主要结论有:(1)通过历代本草的研究结果可知药用枸杞的最终品种确定为宁夏枸杞、道地产区为宁夏、用药部位分为根皮、实、叶三部分。(2)采样区域内枸杞子中枸杞多糖、蛋白质、维生素和柚皮苷的含量虽然存在较大的差异。但如果依据某一个或某几个成分的含量进行枸杞子区划研究,各个区域的差异性并不明显。因此,不能笼统的利用单一成分划分区域,枸杞子的品质区划研究需要综合多个指标进行整体评价,或根据枸杞子特定功能需求及对应成分区分各个产区。(3)高光谱数据与枸杞子中化学成分具有相关性,利用高光谱成像技术进行枸杞多糖含量预测时模型准确率达到88.2371%、水溶性维生素含量预测模型准确率达到87.5661%、蛋白质含量预测模型准确率达到88.9873%、总黄酮含量预测模型准确率达到70.0372%、有机酸含量预测模型准确率达到72.6106%。(4)通过偏最小二乘算法建立产地识别模型,识别率达到90%左右,BP神经网络的预测准确率达到80%以上。
方法:(1)查阅本草文献、科研论文、标准规范、相关专著等,通过归纳和总结进行文献研究。明确目前使用的枸杞子药材的基源种、道地产区以及主要成分等,通过对现有检测技术以及高光谱技术进行综述,为枸杞子识别奠定理论基础。(2)通过实地调查,获取枸杞子样品。利用超高效液相色谱串联三重四级杆质谱法测定枸杞子中维生素类、有机酸等化合物;蛋白质含量利用《GB5009.5-2016蛋白质》食品安全国家标准中第一法进行测定;枸杞多糖含量利用2015版《中华人民共和国药典》规定的紫外分光光度法检测。(3)利用MaxEnt模型,进行宁夏枸杞分布区划;利用SPSS,逐步回归、聚类分析、相关分析、主成分分析等统计方法,分析枸杞子中指标成分与环境因子之间的关系,并构建关系模型;利用ArcGIS软件,基于关系模型进行枸杞子中各指标成分含量的区划分析。(4)利用高光谱成像仪,获取枸杞子药材样品的光谱数据。(5)利用ENVI、Matlab软件,对高光谱数据进行主成分提取,特征波段选择,采用黑白板校正进行相对反射率输出,选择感兴趣区域的样品提取出平均值及标准差光谱数据、使用多元线性回归以及最小二乘支持向量机从多元散射校正、S-G平滑、标准正态变换等方法中选出最佳预处理方法,利用成分含量与反射率数据的相关性,筛选有效波段。分别利用特征波段、有效波段以及主成分降维因子建立最小二乘支持向量机模型,得到枸杞子中枸杞多糖、水溶性维生素、有机酸等5个成分的含量预测模型。(6)利用Matlab软件,在含量预测模型的基础上,使用偏最小二乘模型以及BP神经网络模型进行枸杞子产地识别模型的建立。
结果:(1)通过历代本草的研究结果可知药用枸杞的最终品种确定为宁夏枸杞(LyciumbarbarumL.)、道地产区为宁夏、用药部位分为根皮、实、叶三部分,而枸杞子的性味确定为甘平。宁夏枸杞主要种植地在《中国植物志》等文献资料中多记录在西北和中南部,尚没有关于东北地区人工种植宁夏枸杞的记载,通过本研究发现辽宁和吉林省也有宁夏枸杞的少量种植。(2)枸杞子的5大产区间具有明显的分布特征,在宁夏地区为高品质与中品质枸杞子区;内蒙古为低品质枸杞子为主;青海为中品质与低品质枸杞子;甘肃有少数区域分布高品质与中品质,大部分为低品质;新疆地区为高品质与低品质枸杞组成。(3)利用ENVI提取图像的主成分,通过特征向量筛选出光谱数据的特征波段为:573nm、909nm、1232nm、1243nm、1488nm。多元线性回归与最小二乘支持向量机的方法筛选出预处理的方法为标准正态变换。(4)以降维因子作为输入变量进行最小二乘支持向量机的建模结果如下,枸杞多糖含量预测模型为410-990nmSNV平均光谱数据,降维因子数目为5,MAPE为17.7798%。相同实验组条件下,有机酸与总黄酮的含量预测模型,降维因子数分别为27和18,MAPE分别为28.3539%和36.1831%。蛋白质的含量预测模型条件为950-2500nmSNV平均光谱数据,降维因子为18,MAPE值为11.9622%。维生素的含量预测模型条件为410-990nmSNV标准差光谱数据,降维因子为18,MAPE值为13.9095%。(5)特征波段的建模结果中,维生素含量模型MAPE与MSE值分别为12.4339%与0.0118。蛋白质含量模型的MAPE与MSE值分别为11.0127%和2.8301。枸杞多糖含量模型的MAPE与MSE值分别为11.7629%与3.3698。有机酸含量模型的MAPE与MSE值分别为43.6941%与0.5968。总黄酮含量模型的MAPE与MSE值分别为49.3254%与0.1462。(6)有效波段建模结果为,维生素含量模型MAPE与MSE值分别为16.0841与0.0127。蛋白质含量模型的MAPE与MSE值分别为12.9027%和2.7997。枸杞多糖含量模型的MAPE与MSE值分别为18.3443%与5.2101。总黄酮的MAPE与MSE值分别为29.9628%和0.0961,有机酸的MAPE与MSE值分别为27.3894%和0.2614。(7)利用偏最小二乘回归建立产地识别模型时,使用MSC、SNV、S-G平滑三种预处理方法同时设置不同的主成分因子数。结果显示在使用SNV预处理方法进行建模时得到的准确率最高。SNV数据在降维后预测准确度提升2%,准确率到达96%以上。BP神经网络的预测集准确率普遍在82%左右,5类产地的建模集预测准确率基本都在85%以上,测试集的预测准确率在80%以上。
结论:高光谱成像技术在枸杞子主要成分含量预测与产地识别中应用具有一定的可行性。高光谱成像技术在中药领域应用的新思路“药材样品—>成分含量<—>光谱特征—>含量预测模型—>预测含量”,“药材样品—>产地差异<—>光谱特征—>产地识别模型—>产地识别”。主要结论有:(1)通过历代本草的研究结果可知药用枸杞的最终品种确定为宁夏枸杞、道地产区为宁夏、用药部位分为根皮、实、叶三部分。(2)采样区域内枸杞子中枸杞多糖、蛋白质、维生素和柚皮苷的含量虽然存在较大的差异。但如果依据某一个或某几个成分的含量进行枸杞子区划研究,各个区域的差异性并不明显。因此,不能笼统的利用单一成分划分区域,枸杞子的品质区划研究需要综合多个指标进行整体评价,或根据枸杞子特定功能需求及对应成分区分各个产区。(3)高光谱数据与枸杞子中化学成分具有相关性,利用高光谱成像技术进行枸杞多糖含量预测时模型准确率达到88.2371%、水溶性维生素含量预测模型准确率达到87.5661%、蛋白质含量预测模型准确率达到88.9873%、总黄酮含量预测模型准确率达到70.0372%、有机酸含量预测模型准确率达到72.6106%。(4)通过偏最小二乘算法建立产地识别模型,识别率达到90%左右,BP神经网络的预测准确率达到80%以上。