【摘 要】
:
大规模的电子出版和大范围Web数据交换业务需要良好描述能力和处理能力的语言。为Internet和Web发展做出突出贡献的置标语言HTML由于其自身的缺陷已不能满足上述业务的发展需
论文部分内容阅读
大规模的电子出版和大范围Web数据交换业务需要良好描述能力和处理能力的语言。为Internet和Web发展做出突出贡献的置标语言HTML由于其自身的缺陷已不能满足上述业务的发展需要,为此W3C开发并发布了新一代置标语言XML。随后各公司和厂商便推出了能提供SAX和(或)DOM接口的XML解析器。SAX接口的解析器只能对文档内容按顺序处理,处理完后并不将数据保存在内存中,也不能修改文档内容,故不能对XML文档做随机存取,难以实现复杂的查询,使用范围小。DOM接口的解析器能够避免SAX的某些弊病,但它是一种内存密集型操作,它把XML的元素、属性、注释、处理指令等都作为一个节点对象进行处理,需要占用大量的内存。这对于一些含节点数多的大型XML文件,如果使用DOM接口的解析器进行处理,就要求有性能很高的计算机才能胜任,否则可能会大大地降低解析效率甚至造成解析失败。 随着计算机技术和网络技术的发展,以网络为基础的分布式并行计算环境以其较高的性能价格比和大范围、大数量异构机群并行成为新的高性能计算环境。而且XML文档和DOM接口本身具有的良好的并行结构。因此,本文基于分布式网络并行环境研究了对XML文档的并行处理方法。以Java为开发语言,利用Java的Socket技术实现网络通信,利用Java的多线程技术实现并行处理,设计实现了一个XML的并行解析器。XML文档的并行处理主要是数据的并行处理。我们研发了序言处理、字符编码方式识别、数据分割、并行解析器,并进行实验验证。实验结果表明本文设计的并行解析器具有较好的处理效果。
其他文献
科学计算可视化是发达国家二十世纪八十年代后期提出并发展起来的一门新兴技术。它将科学计算过程中及计算结果的数据转换为几何图形及图像信息在屏幕上显示出来并进行交互处
在分析了一般的并发面向对象模型所具有的特点和现有的凡种经典的并发面向对象模型的基础上,提出了基于MPI的并发面向对象模型.在该模型中,将并发对象与MPI的任务对应起来,利
该文探讨了数字水印的基本原理,深入研究了文字的编码与存储,数字水印的特性及算法.针对当前数字水印技术因无法记录过程痕迹而不能有效应用的问题,提出了数字水印不仅要具有
Fountain码是一类基于Tanner图的前向纠错码,采用随机编码思想、码率可灵活地进行控制,具有鲁棒性、高效性、对信道应变性强等优点。近年来,凭借着强大的技术优势,Fountain码已经
多年以来,为了满足利用有限的带宽来传输和存储语音的需求,语音压缩一直是学术界的一个热门领域.而对于受到信道带宽困扰的用户以及需要节约能量的蜂窝式无线电话和卫星连接,
网络磁盘阵列技术是在已经很成熟的集成式磁盘阵列技术的基础上添加网络通道,并通过三方通讯协议使命令和数据流分离,从而减轻服务器的负载,大幅度提高数据传输率.但是,它需
该文首先分析了无线信道并建立了无线OFDM系统信道模型,然后阐述了OFDM系统基本原理,而后着重研究了OFDM信道估计技术.信道估计方法大致可分为基于导频(训练序列)的信道估计
科技文献的准备是开展科研工作所必需的步骤和重要基础,目前的电子检索系统只是将根据关键词搜索出的文献按个别指标(如被引次数、发表时间等)进行简单排序,并不能为检索者提
该论文共分六章,主要内容如下:【第一章】对多主体系统和机器人技术的发展概况进厅描述,对机器人足球进行介绍,对该论文的工作进行综述.【第二章】概括了作者对四腿机器人的
在文章中,首先对当前流行的网络计费系统做了比较系统的分析.然后,从实际应用的角度给出用户登录身份验证模块的设计.该模块的重点内容是强制用户在访问外网前,必须先正确登