【摘 要】
:
缺失数据的处理是数据挖掘和学习分类系统中的重要问题之一.在传统的学习分类系统中,有两种处理缺失数据的方法:①通过统计已知数据预测缺失数据;②将缺失数据标记为"任意值
【机 构】
:
南京大学计算机软件新技术国家重点实验室,南京,210093
【出 处】
:
2005第一届中国分类技术与应用研讨会(CSCA)
论文部分内容阅读
缺失数据的处理是数据挖掘和学习分类系统中的重要问题之一.在传统的学习分类系统中,有两种处理缺失数据的方法:①通过统计已知数据预测缺失数据;②将缺失数据标记为"任意值匹配".提出一种基于增量梯度下降的缺失数据填充方法,其利用包含缺失数据的属性和其他完整属性之间的潜在关系,增量地、自适应调整梯度下降模型并用此模型来填充缺失数据.通过与传统的缺失数据处理方法对比实验,基于增量梯度下降的缺失数据填充方法在学习分类系统中显示出良好的性能。
其他文献
在串联质谱鉴定中,高通量的数据库搜索和相似性比对会产生大量的鉴定结果.如何对这些结果进行定量的有效性评估是目前蛋白质组学研究的一个关键问题.从模式分类的角度看,该问
利用1980、1990、2000年三期TM影像,应用遥感、地理信息系统技术和景观生态学相结合的方法研究了洞庭湖区景观镶嵌体的结构和形态特征.结果表明:洞庭湖区景观格局与动态特征
针对具体应用设计效果更优的分类器一直是模式识别领域重要的研究内容.对于不同分类器效果的评价,目前的主要途径是建立在识别率的比较上.识别率具有简洁直观的优点,但其受测
提出了一种基于多权值神经网络的问候语语音识别算法,并对不同数量样本下HMM和多权值神经元方法对连续问候语语音中问候语音节的建模能力进行比较,从比较结果的发展趋势看,随
扩展了传统的流水线回归神经网络(pipelinedrecurrentneuralnetworks,PRNN)的网络结构,使其适用于动态系统辨识,并提出一种基于最小二乘法的PRNN训练学习算法.通过动态系统辨
提出了手语识别的一种新方法:对手语词进行基于隐马尔可夫(HMM)和支持向量机(SVM)的二级识别.由于HMM适于处理连续时序信号,SVM适于处理小样本的分类问题;同时,HMM更多地表达
1临床资料我科自1990年4月~2001年12月遇到小儿鼻腔异物误诊为慢性鼻炎15例,年龄3~10岁,男10例,女5例。病程2个月~2年。异物种类:纸团5例、纽扣2例、花生米2例、棉片2例,橡皮2例,珠子1例、石子1例。患儿均有单侧鼻塞
如何能有效地保持原本学习过的知识,又能不断获取新知识?这是增量学习面临的难题.将集成学习算法移植应用于增量学习,建立了模块化增量学习模型,研究了BehaviorKnowledgeSpac
皮肤粘膜出血 :这是 HFRS最常见的出血部位。发热期可以发现有前胸和腋下皮肤呈点状或抓痕样出血点。软腭和咽后壁粘膜呈片状针尖样出血点。休克期和少尿期主要表现是前臂、
哮喘持续状态是指哮喘急性严重发作 ,经合理应用拟交感神经药物仍不能在 2 4小时内缓解 ,属于危重型哮喘 ,是引起哮喘病人死亡的主要原因。因此国内外均对此类病人的早期诊断