论文部分内容阅读
基于正定核的机器学习算法是统计学习理论最近的研究热点。正定核对应某一特征空间的内积,从而隐含地对输入空间实现非线性映射。基于正定核的学习算法以核诱导的再生核希尔伯特空间(RKHS)为假设空间,表示定理为监督学习算法的解提供了简单的表达形式。最近,RKHS中的一种正则化网络被Poggio和Smale称为学习理论的一个关键算法(简称KA)。KA用二次损失函数统一处理分类和回归,为区别起见,分别称为正则化最小二乘分类(RLSC)和正则化最小二乘回归(RLSR)。将二次损失函数用于分类被认为是学习理论在认识上的一大进步,并且根据Poggio等在2004年Nature上提出的算法稳定性理论,KA是有推广能力的。对RKHS中的非监督学习,核偏最小二乘(KPLS)和核独立分量分析(KICA)则是其中的典型代表,它们分别是有效的降维或盲源分离方法。然而,由于这些算法提出不久,在模型选择、提高算法性能和优化速度等方面还存在一些问题有待解决或提高。
论文从算法与应用两个方面研究基于正定核的监督、非监督机器学习方法,提出了一些用于模型选择、提高算法性能和优化速度的新算法。
在国内乳制品行业率先建立了一个高效消费者响应系统。较好地解决了其中的两个重要问题:以RLSR为基础,并在预测中集成行业背景知识,实现了销量的滚动预测;提出了使供应商期望收益最大的发货策略。