论文部分内容阅读
棉花是一种重要的经济作物,在我国经济、政治和社会事物中占有举足轻重的地位。棉籽是棉花的主要副产品,用途十分广泛。据统计,平均每生产1 kg的棉花纤维,就会产生1.65 kg的棉籽。由于棉籽中含有对人畜有毒的棉酚及其衍生物,大量的棉籽营养物质未能被充分地开发利用。目前,棉籽及棉籽饼粕中的游离棉酚的检测主要有分光光度法和高效液相色谱法等,但这些传统方法存在所用化学试剂毒性较大、样品准备繁琐、分析时间长、检测成本高等问题。近红外光谱分析技术结合化学计量学多元校正方法,可以有效解决上述问题。本研究拟构建棉籽棉酚含量近红外校正模型,并通过变量选择方法优化变量空间,提高校正模型的稳健性和预测能力,为棉籽中棉酚含量的检测和棉花育种工作提供快速、有效地方法。主要研究结果如下: (1)利用多年份、多地点种植的棉籽材料,随机选取404份为试验样品。分别采集棉仁粉和整粒棉籽的近红外光谱数据。然后,利用高效液相色谱法准确测定棉籽中棉酚含量。在校正模型构建之前,采用变量标准化、Savitzky-Golay卷曲平滑和1阶微分等方法,对原始光谱数据进行预处理。经预处理后的光谱数据,运用蒙特卡罗无信息变量消除算法进行光谱变量选择,剔除了大量的无信息变量和冗余变量,降低光谱变量的共线性,提高校正模型预测稳健性和准确性,并在一定程度上克服了过拟合现象。在模型的构建过程中,采用了非线性的支持向量机(SVM)、最小二乘支持向量机(LS-SVM)和加权最小二乘支持向量机(WLS-SVM),对比传统的线性偏最小二乘法(PLS),以寻找并构建最优的棉仁粉和整粒棉籽棉酚含量的近红外校正模型。 (2)本研究构建的最优棉仁粉棉酚含量近红外校正模型,其决定系数R2=0.9331,剩余预测偏差RPD=3.8374,交叉验证均方根误差RMSECV=0.0744,预测均方根误差RMSEP=0.0422。此模型取得了较高的预测精度和较好的稳定性(R2>9.0000, RPD>3.0000),完全可以代替传统的棉酚测定方法。最优整粒棉籽棉酚含量近红外校正模型决定系数R2=0.8054,剩余预测偏差RPD=2.1692,交叉验证均方根误差RMSECV=0.1046,预测均方根误差RMSEP=0.0776。整粒棉籽棉酚含量校正模型与棉仁粉的校正模型相比,其预测性能较差,但是,仍然可以用于大量样品的筛选工作。 (3)利用构建的棉仁粉和整粒棉籽棉酚含量近红外校正模型,为中国农业科学院棉花研究所、南京农业大学等单位测定了3000余棉籽样品棉酚等指标含量。测定结果准确性高、适应范围广,完全可以代替传统的化学测定方法,为棉籽产品的综合利用和棉籽品质育种提供了强有力的技术支撑。