基于数据挖掘技术的印花税“资金账薄”品目欠税分类研究

被引量 : 0次 | 上传用户:hustsmes
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,全国税务系统基本实现了征管业务信息化,在这样的新形势下,国家税务总局明确提出了深入开展税收数据资源开发利用工作的要求。由此可见,积极利用现有的海量税收数据,开展数据分析和利用工作,已经成为一个热点和难点问题。本文正是在这样一个背景下,针对印花税“资金账簿”品目欠税分类情况进行了研究,主要工作有以下几方面。研究欠税算法业务逻辑,为欠税分类提供决策属性信息。针对税收数据存在连续型和离散型并存、属性度量不一致等特点,对数据进行了预处理,其中包括相关性分析、连续型属性离散化处理和属性约简等方面内容。针对相关性分析采用了Pearson相关系数算法,较好的解决了两两属性间相关性过高的问题;在实现连续型数据离散化的过程中,提出了一种基于遗传算法理论的连续型数据离散化方法,通过“优胜劣汰”的原则进行离散化处理,较好的实现了连续型属性离散化处理;针对海量税收数据下的多条件属性约简问题,根据各属性间存在相互依赖、重要度不同等特点,采用基于重要度的启发式粗糙集属性约简方法,实现了删除无关或冗余属性的约简过程,并经专家领域知识验证了该算法在属性约简中的有效性。针对欠税分类问题,使用决策树和贝叶斯分类算法进行了实验,并将根据数学模型生成的欠税情况与稽查选案工作进行了有机结合。
其他文献
保险合同解除问题作为保险法的重要内容,在此次《保险法》修订中进行较大规模的修改。修改后的关于保险合同解除的条文有很大的实质性改观,但是在某些条文当中,还是具有不足
在新课程标准下,如何提高初中数学的教学效果,打造数学高效课堂,成为广大初中数学教师关心的热门话题。根据本人的实践经验,可从运用语言艺术、培养数学应用意识、发挥学生主
中海石油炼化有限责任公司惠州炼化分公司2.0 Mt/a加氢精制装置以焦化汽柴油为原料,目的生产乙烯料石脑油和符合欧IV车用柴油标准(硫<50μg/g)的清洁柴油。该装置选用了抚顺
<正>口语交际表现性评价系统的建构是一个复杂的过程。口语交际不是简单的听话和说话,它不仅包括对信息的分析、综合、判断、推理、概括、归纳、创造等思维能力,还包括对双方
文章首先阐述了探索高中体育教学创新模式的必要性,继而分析了高中体育教学创新模式的几点对策措施,最后对全文进行了总结,以期能够对我国当前高中体育教学创新模式的有效开
<正>1.添枝加叶。"添枝加叶"本是形容叙述事情或转述别人的话时,为了夸张渲染,添上原来没有的内容。在高考历史选择题中,"添枝加叶"是指
期刊
提出电网控制中心安全预警和决策支持系统按时间、空间和对象等3个维度进行设计。在时间维上,将电网事故看做事件的发展过程,分析中考虑电网暂态、动态和稳态等状态变化;在空
截至2008年12月31日,我国上市公司已达1625家,随着证券市场的发展和完善,上市公司的数量将继续攀升。反映上市公司财务状况和经营成果的财务报告是否客观、公允,就需要注册会
伴随激光技术的不断发展,激光的应用已经遍及军事、科技以及国民生产的各个领域,如何对激光参数进行精确测量成为激光技术研究中的重点问题。评价和判别激光光束质量的重要参
<正>识字教学始终是低年级语文教学的重点,《全日制义务教育语文课程标准(实验稿)》中低年级识字量明显增加。我们认为"认写分开,多认少写"的识字策略是正确的,它可以有效地