WebOffice中文档格式化的研究

来源 :中国科学院软件研究所 | 被引量 : 0次 | 上传用户:wanshixian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于在线办公套件WebOffice的开发实践,论文对文档格式化的概念、模型、流程和系统框架结构进行研究,重点实现了文本断行与文档分页两个关键部分,取得了五个方面的主要成果:   第一,论文从文字处理系统的演化历程概括审视了文档格式化的发展现状,分析了客户端计算技术。针对WebOffice系统架构,提出WebOffice系统文档格式化需要解决的主要问题是:通过浏览器端计算,实现Web文档格式化。   第二,论文从逻辑结构模型和物理结构模型两个视角,分析了文档对象模型、盒子/胶水模型、文档布局三方面的内容。详细的阐述计算机系统对Web文档的组织形式理解,为文档格式化的研究奠定了基础。   第三,文档格式化是文档内容的格式化展现,涉及文档解析、字体解析、显示布局等方面,是较复杂的计算过程。论文在阐述WebOffice系统文字处理总体框架基础上,提出了文档格式化问题的关键是逻辑结构到物理结构的映射。进而将WebOffice文档的格式化流程归结为HTML解析和DOM元素计算、文档断行和文档分页、格式化输出和浏览器显示三个阶段。   第四,文本断行是文档格式化最基本的要求,也是文档格式化的精髓。为此,论文将文本断行问题抽象为可断行点定位和断行策略两个方面。ICU是实现了Unicode标准中的断行属性描述和文本边界界定的国际化开发开源的函数库。同时论文重点分析了断行策略中的逐行算法。在此基础上给出了文本断行的BreakIterator方案。此外,论文还给出了另外一种基于Swing组件的文本断行方案。两种方案各有所长,为WebOffice开发的不同时期所采用。   第五,文档分页是办公套件和其他字处理软件的主要区别,是WebOffice文档格式化研究的重点。论文将文档分页问题抽象为垂直方向上的文本断行,文本断行策略同样适合分页问题。论文在分析Java Swing组件的MVC设计模式基础上,从文档视图入手,提出了文档分页的解决方案。论文按照自顶向下顺序叙述了文档分页方案的实现细节。
其他文献
作为最经典和最成功的机器学习算法之一,Boosting自问世以来就一直被很多学者所关注。Boosting是能提高任意给定的学习算法的准确率的一类集成算法的总称。由于Boosting所显示
中间件系统、操作系统和数据库系统是计算机科学领域内的基础技术,很多应用系统都使用了中间件。消息中间件是中间件技术的发展热点,它利用高效可靠的消息传递机制将信息以消息
网络和通信技术的发展,使得VoIP(Voice over Internet Protocol)成为以软交换为核心的NGN(Next Generation Network,下一代网络)技术中的重点业务。它为电信业开发了更多的增
军用数据总线标准MIL-STD-1553B是国际广泛采用的一种集中控制、命令/响应、时分制的多路串行总线标准。因其具有可靠性及灵活性高的优势,被广泛应用于航空航天等军事领域中。
如何进行精确可靠的成本估算一直以来都是软件工程学术界和企业界普遍关注的问题。COCOMOⅡ模型(Constructive Cost ModelⅡ)是目前最优秀和著名的软件成本估算模型之一,在过
学位
短信增值业务是电信增值业务的重要内容和组成部分。在电信增值业务中扮演着重要的角色。在愈演愈烈的SP竞争中,大型SP已经积累了大批的专业的电信增值业务的技术人员。在此基
对于一个企业来说,质量是产品和服务的生命。质量受企业生产经营管理活动中多种因素的影响,是企业各项工作的综合反映。目前企业产品质量指标的检测大多是在产品生产出来后才进
本课题来源于为适应国家推广的“金税工程”要求,研发税控器系统软件的生产与产品定型检验的实践活动。税控器软件上层使用Borland C++6.0完成税控应用管理功能实现,底层使用Ke
云南省“三江并流”区域是世界生物多样性最丰富的地区之一,位居17个中国生物多样性保护“关键地区”的第一位;而且,“三江并流”植物数据类型复杂、与空间紧密相关,在空间数据仓
临机决策是一种常见而且重要的决策形式,本文以突发公共事件的应急决策为背景研究临机决策的基本原理及实现机制,其中重点研究如何基于语义网技术为面向突发意外事件的临机决策