纸质文档的信息化加工过程管理与系统实现

被引量 : 0次 | 上传用户:w_mz2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术、计算机技术和信息技术的飞速发展,文档的信息组织模式已从卡片式的目录手工检索转换为数据库存储计算机检索。通过题录加工和全文扫描,建立了题录数据库和全文数据库,实现了题录信息的计算机检索和相关文本的自动链接。在对广州市标准化研究院的文档进行整理时,存在大量的纸质文档,这些文档的录入归档工作繁琐复杂、工作人员整理录入的效率非常低。对于这样大规模的文档录入和保存工作,采取信息化的手段进行文字识别来提高效率,是一件非常有意义的工作。对于在文档录入过程中的人员管理、进度管理、对纸质文档的识别、校对、转换、保存,对录入工作的协调等一系列相关问题的研究与系统设计实现,将是本文的研究内容。首先,本文对论文的研究背景、研究意义、研究现状进行分析,根据这些内容,提出了本论文的研究大纲。接下来对于开发B/S架构的管理信息系统(MIS)所采用的相关技术进行了介绍,分析了相关的技术与理论,包括JAVA的面相对象开发、JSP/Servlet技术、B/S与MVC架构和数据库相关理论。其次,对文档管理的作用及文档管理的趋势做了分析,并对比了纸质类型和数字化类型的文档管理的不同,得出了信息化管理文档管理的诸多优势,然后对纸质文档的信息化加工过程进行分析和流程优化,提出了流水线作业的方式。结合标准化研究院的文档录入进行分析研究,采用现场调研的方法获得用户需求,并结合软件工程的开发流程对需求进行分析,提出了对纸质文档录入的整个信息化流程:扫描→版面分析→OCR识别→校对→PDF文档生成→录入。再次,对纸质文档的信息化加工过程管理系统进行了详细的设计,包括系统的架构设计、功能点设计、数据库设计和用户界面设计。对系统实现中的关键技术进行了深入分析,主要包括:基于MODI的文字识别、PDF文件的制作、文件的批量上传、数据库操作和日志文件等。末章为系统的实现部分,简要介绍了系统开发所使用开发工具,并对系统的发布和部署方法进行了介绍,展示了本系统的几个主要功能运行实例。本文设计的纸质文档录入系统已在广州市标准化研究院内试用,并大幅度提高了文档录入的效率。本系统的设计和实现对有类似需求的部门和企业具有一定的借鉴意义。
其他文献
从2004年至今,为抑制对房地产产品的过度投资、投机和房价的过快上涨,国家在土地、金融等政策方面都进行了重大改革与调整,房地产开发企业运行的市场条件、竞争环境、开发机
操纵稳定性和舒适性是汽车很重要的两项性能。针对某型BRT铰接客车设计工作,本课题对其操纵稳定性和平顺性问题进行了初步研究。本文由系统仿真理论以及虚拟样机技术出发,根
目的对陕西省2018年分离的疑似布鲁氏菌进行种型鉴定,为布病防治提供科学依据。方法应用形态学鉴定、BCSP31、AMOS、16SrDNA-PCR及生化鉴定方法,对2018年全省收集的30株疑似
目的建立桂枝水煎液指纹图谱,为控制桂枝药材质量提供科学方法。方法色谱柱为Diamonsil C18(4.6mm×200mm,ID5μm),以乙腈为流动相A,0.04%冰醋酸水溶液为流动相B,梯度洗脱,流速1.0ml/m
为探明北运河流域(北京段)多层沉积物中PAHs(多环芳烃)的污染状况,利用活塞式底泥取样器于2014年11月采集了9处沉积物样品,取样深度为30~80 cm,每处样品根据其垂向介质特征大
中国高等教育正走在从扩大规模到提升质量的改革之路上。办学质量是高等学校的生命线,课程教学是高校的中心工作。笔者结合多年对高等教育专业课程和教材的研究,以哈尔滨工业大
[目的]观察心理护理干预在腰椎间盘突出症(lumbar disc herniation,LDH)患者围手术期中的应用效果。[方法]纳入手术治疗的LDH患者60例,随机分为试验组与对照组,对照组(n=30)
运用一种快速弱分类器训练算法和高速缓存策略来加速Adaboost算法的训练。集成学习算法Adaboost能够精确构建二分类器,运用二叉树型结构快速灵活地将纸币号码识别转化为一系
国庆假期,驱车入藏,走在逶迤绵长的青藏公路上,忽然想起两百年前带兵入藏平乱的福康安。提起福康安,大多数人不会有什么好印象。他是民间传说里,乾隆皇帝跟大臣的妻子生下的
首先利用统计原理检测出一幅图像的肤色区域,再通过哈达玛变换将这些区域从像素域变换到压缩域,最后通过改进和训练链码模板和角度模板来对候选肤色区域进行匹配和检测。实验