论文部分内容阅读
研究目的:从数据项之间关联关系的角度切入,探索一种新的耕地数据质量检错方法,以期更有效地提高耕地数据库的质量。研究方法:通过数据挖掘算法寻找耕地数据库中的关联关系,计算这些关联关系的发生频率,从中提取低频发生的关联关系作为检测规则(关联规则),最后利用这些关联规则识别耕地数据库中的错误记录(包含或符合关联规则的耕地数据记录为错误记录)。研究结果:(1)该方法有能力识别耕地数据库中的错误,可以做到有效提高耕地参评数据库的正确性;(2)经计算,与耕地领域现有的传统数据检错方法相比,同等条件下该方法可将检错效率