论文部分内容阅读
近红外光谱分析方法具有高效、快速、无污染、不破坏样品且成本低等优点,在许多领域均有广泛应用。但是,近红外光谱产生于分子振动光谱的倍频和合频吸收,主要记录含氢基团(C-H,O-H,N-H,S-H)的吸收信息,吸收较弱且谱峰重叠严重。因此,必须借助化学计量学方法对近红外光谱进行定性定量分析。本论文从变量筛选和建模两方面对近红外光谱定量分析进行研究,提出了基于特征投影图(LPG)的变量筛选方法、利用多模块偏最小二乘方法(MB-PLS)对近红外光谱进行定量分析,并将小波变换(WT)用于多模块分解。具体内容如下:
1.特征投影图(LPG)是在化学因子分析(CFA)中用于研究数据性质的方法。基于LPG中直线段代表选择性区域的思想,将LPG用于近红外光谱分析中的波长选择。首先假设校正光谱中直线段上的变量对模型的贡献相同。根据此假设,只选用LPG中拐点处的变量即可满足建模要求。利用两组烟草样品对所提方法进行测试,结果显示只选用少于20个变量即可建立简单的模型并可得到满意的预测结果。因此,基于LPG建立近红外光谱特征波长的筛选方法不失为一种合理有效的变量筛选工具。
2.改进了多模块偏最小二乘(MB-PLS)方法并用于定量分析谷物和烟草样品的近红外漫反射光谱。在该模型中,沿着波数方向将光谱平均划分为若干子模块,由于各组分在光谱的不同波段吸收强度不同,子模块所包含的信息亦有所差异,因此在MB-PLS建模中各子模块采用不同的因子数。与传统的PLS相比,每个子模块的相对重要性和贡献可以通过高级权重和使用不同的因子数加以调节。因此,MB-PLS的预测能力优于普通PLS,尤其是处理具有大量变量和大量样本的烟草数据。
3.提出了一种结合小波变换(DWT)的加权MB-PLS方法用于近红外光谱建模。在该方法中,首先利用DWT将光谱划分为若干子模块,再用高级权重和子模块权重计算各模块的相对重要性。其中,子模块的相对重要性是由交叉验证中产生的预测误差平方和(PRESS)计算所得。因此,该方法提供了一种合理划分MB-PLS中子模块的手段,且可调节子模块对预测模型的相对贡献。将两组烟草样品用于测试该方法的预测性能,计算结果显示与传统PLS和MB-PLS相比结合小波变换(DWT)的加权。MB-PLS方法可以给出更好的预测精度和模型可解释能力。