论文部分内容阅读
在科学数据处理中,数据采集是很重要,但却不被人重视的一环。IT行业的数据大多由软件系统自身产生,数据采集不是问题。但是在非IT行业的科学研究中,科学家们经常需要从社会生活或自然环境中收集数据,可能会缺乏自动化数据采集的手段,比如某些单位还在用纸质表格做数据收集,这就很难避免脏数据的存在,造成了日后数据整合和处理的困难。
随着智能手机的普及,基于移动平台的数据采集系统层出不穷。目前有很多从事ERP开发的企业专门为各公司和科研单位开发基于Android平台的数据采集器。但是以中科院内部为例,大部分单位的数据采集任务其实差别不大,如果每个单位都重复投入,不但开销大,也不利于数据的集中维护。特别是在云计算方兴未艾的今天,如果各个科研院所都自主建设IT基础平台,委实是一种浪费,完全可以把所有的数据采集服务整合到统一的平台上去。
为了让各科研单位能节省投入到数据采集上的费用,通过抽象数据采集者的需求,设计出一种数据定制模型。这种模型既包含内置的各种数据采集组件,允许用户通过配置来设置采集界面和采集逻辑。在内置组件不能满足要求时,也可以开发符合预定义接口的新组件,把它们插入到原系统中。系统无差别的对待新组件和原有组件。为用户提供了充足的扩展空间。
基于上述模型开发一套可定制数据采集系统,考虑到科研数据采集可能要在野外或其他无线网络覆盖的地方进行,系统被设计成分离式的,定制子系统提供配置信息给采集子系统,采集子系统运行在Android手机平台,有本地数据库,根据配置信息可以独立的进行数据采集,采集过程中无需连接服务器。手机端还提供一套离线地图服务框架,可以在无联网情况下提供基本的地图/位置服务。数据定制子系统运行在轻量级J2EE平台上,数据采集子系统运行在Android平台上,都是现在比较流行的平台,方便用户和二次开发者上手。
本系统目前还在重构和继续开发中,希望在今年七月能够在青海湖自然保护区野外调查中使用。