论文部分内容阅读
随着网络技术、计算机技术和信息技术的飞速发展,文档的信息组织模式已从卡片式的目录手工检索转换为数据库存储计算机检索。通过题录加工和全文扫描,建立了题录数据库和全文数据库,实现了题录信息的计算机检索和相关文本的自动链接。在对广州市标准化研究院的文档进行整理时,存在大量的纸质文档,这些文档的录入归档工作繁琐复杂、工作人员整理录入的效率非常低。对于这样大规模的文档录入和保存工作,采取信息化的手段进行文字识别来提高效率,是一件非常有意义的工作。对于在文档录入过程中的人员管理、进度管理、对纸质文档的识别、校对、转换、保存,对录入工作的协调等一系列相关问题的研究与系统设计实现,将是本文的研究内容。首先,本文对论文的研究背景、研究意义、研究现状进行分析,根据这些内容,提出了本论文的研究大纲。接下来对于开发B/S架构的管理信息系统(MIS)所采用的相关技术进行了介绍,分析了相关的技术与理论,包括JAVA的面相对象开发、JSP/Servlet技术、B/S与MVC架构和数据库相关理论。其次,对文档管理的作用及文档管理的趋势做了分析,并对比了纸质类型和数字化类型的文档管理的不同,得出了信息化管理文档管理的诸多优势,然后对纸质文档的信息化加工过程进行分析和流程优化,提出了流水线作业的方式。结合标准化研究院的文档录入进行分析研究,采用现场调研的方法获得用户需求,并结合软件工程的开发流程对需求进行分析,提出了对纸质文档录入的整个信息化流程:扫描→版面分析→OCR识别→校对→PDF文档生成→录入。再次,对纸质文档的信息化加工过程管理系统进行了详细的设计,包括系统的架构设计、功能点设计、数据库设计和用户界面设计。对系统实现中的关键技术进行了深入分析,主要包括:基于MODI的文字识别、PDF文件的制作、文件的批量上传、数据库操作和日志文件等。末章为系统的实现部分,简要介绍了系统开发所使用开发工具,并对系统的发布和部署方法进行了介绍,展示了本系统的几个主要功能运行实例。本文设计的纸质文档录入系统已在广州市标准化研究院内试用,并大幅度提高了文档录入的效率。本系统的设计和实现对有类似需求的部门和企业具有一定的借鉴意义。