● 随机读取功能: 处理模型应当让开发人员可以人工或者使用xpath浏览某种层次结构;
● 高性能: 性能应当远高于dom与sax,而性能应当是“切实可靠的”,这意味着性能评测必须包括用于构建层次结构的时间;
● 内存使用少: 为了让处理模型适用于一系列广泛的场合及文件大小,它必须呈现xml的全部结构,同时内存使用数量最少.
为了满足这些目标而设计的vtd-xml是下一代开放源代码xml处理模型,与dom与sax相比,它作了根本.全面的改进.vtd-xml进行优化的一个重要方面就是非提取式标记化(non-extractive tokenization).在内部,vtd-xml把原封不动.未解码的xml消息保存在内存中,完全根据名为虚拟标记描述符(vtd)的二进制编码规范来呈现标记.vtd记录是64位整数,它用xml对标记长度.标记的起始偏移.类型与嵌套深度进行了编码.
关于vtd-xml,最初提出的基本目的是基于专用硬件来移植xml处理,从而使网络交换机与路由器能够高速处理xml内容.这种专用硬件具体采用现场可编程门阵列(fpga)或者专用集成电路(asic).后来,vtd-xml项目队伍决定开放vtd-xml的源代码,2004年5月推出了初期版本: 版本0.5,用java来实现.自该版本以后,vtd-xml经历了好几轮的改进,因而大大成熟.在版本0.8中,c语言版本vtd-xml与java版本vtd-xml一同发布.版本1.0引入了内置的xpath支持功能,于2005年10月发布.最新版本: 版本1.5采用了经过改写的解析引擎,该引擎模块化程度更高.性能更强.
该版本另外还引入了名为缓冲器重用(buffer reuse)的一项特性.基本思想是,如果位于网络连接后面的xml应用需要重复处理许多进来的xml文档,应用实际上重复使用在第一次处理过程中分配的内存缓冲器.换句话说,缓冲器分配一次,可以使用多次.vtd-xml所特有的这项特性完全消除了xml处理引起的对象创建及废料收集成本(占dom与sax开销的50%到80%).vtd-xml项目网站包括最新软件下载及vtd-xml的详细技术介绍.... 下一页