论文部分内容阅读
目的探索空气污染对医院就诊影响的时间序列分析数据前处理方法。方法根据数据特征制定数据清理流程和数据清理规则,通过Excel软件编写函数或VBA程序实现气象数据、空气质量监测数据和医院门诊个案数据的快速清理和整合。结果本研究编写的代码可实现气象数据、空气质量监测数据和医院门诊个案数据的重复性检查、异常值检查、不规范数据快速清理、诊断拆分、ICD-10自动编码和统计报表的自动生成。结论该方法可以很好地解决时间序列分析所涉及的大数据人工清理效率低、准确性不高的问题,具有很强的实用性和通用性。