xmltextreader:XMLTextReader和XmlDocument读取XML文件的比较疯狂代码！

=t18> 看到网上

片文章

自己式了

下

果然 XMLTextReader速度要快！

在.NET框架

.XML名称空间中包含

XMLTextReader类不需要对系统资源要求很高

就能从XML文件中快速读取数据

使用XMLTextReader类能够从XML文件中读取数据

并且将其转换为HTML格式在浏览器中输出

　　读本文的前

读者需要了解

些基本知识:XML、HTML、C#编程语言

以及.NET尤其是ASP.NET框架

些知识

　　微软公司

.NET框架为开发者提供了许多开发

便利

随着XML

重要性不断增长

开发者们都期待着有

整套功能强大

XML工具被开发出来

.NET框架没有辜负我们

这番期望

在

.XML 名称空间中组织进了以下几个用于XML

类:

　　XMLTextReader------提供以快速、单向、无缓冲

方式存取XML数据

(单向意味着你只能从前往后读取XML文件

而不能逆向读取)

　　XMLValidatingReader------和XMLTextReader类

起使用

提供验证DTD、XDR和XSD架构

能力

　　XMLDocument------遵循W3C文档对象模型规范标准

级和 2级标准

实现XML数据随机

、有缓存Cache

存取

级水平包含了DOM

最基本

部分

而 2级水平增加多种改进

包括增加了对名称空间和级连状图表(CSS)

支持

　　XMLTextWriter------生成遵循 W3C XML 1.0 规范标准

XML文件

　　本文主要讲述

是第

个类XMLTextReader

这个类设计

目

就是从XML文件中快速

读取数据

而对系统资源(主要包括内存和处理器时间)不做很高

要求

在父级

控制下

它通过每次只处理

个节点

方式对XML文件进行逐步操作

实现这种工作过程

在XML文件

每个节点中

父级

能决定该节点

类型

它

属性和数据(如果有

话)

以及其他有关该节点

信息

基于这些信息

父级

可以选择是处理这个节点还是忽略该节点

信息

以满足各种应用

请求

需要

这被称为抽取式(pull)处理模型

父级

发出请求并且从XML文件中抽取各个节点

然后根据需要处理它或者是不处理它

　　我们可以把XMLTextReader类和XML简单应用

接口

即SAX相比

后者是在编程人员中非常流行

另

种读取XML数据

技术

XMLTextReader 和SAX有

点很相似

它们都不需要占用很多

系统资源

就能迅速

从XML文件读取数据

但是

和XMLTextReader

抽取式模型迥然区别

SAX使用

是推入式模型:XML处理器通过 “事件”告知主机应用

哪些节点数据是可以获得

那些不能获得；根据需要

主机

则作出相应

反应或置的不理

换句话说

数据

传送方向是从SAX处理

中推入到主机

员们势必会在抽取式和推入式处理模型谁更有优势

问题上争论

番

但是大家都不可否认

是

两种模型都能很好

进行工作

.NET 框架不支持SAX

但是你能使用现存

SAX工具, 例如 MSXML分析器

用于你

.NET

　　XMLTextReader 类有

些构造

来适应各种各样

情况

比如从

个已经存在

数据流或统

资源定位网址读取数据

最常见

是

你或许想从

个文件读取XML数据

那么也就有

个相应

构造

来为此服务

这里有

个例子(我

所有代码例子都使用

是C#语言

如果你喜欢使用VISUAL BASIC语言

它们转换起来很容易)

XMLTextReader myReader;
myReader = New XMLTextReader(\"c:\\data\\sales.XML\")

　　创建

个称为Read

思路方法

循环

这个思路方法

返回值总是为真

直到到达文件

底部时

返回值才变为假

换句话说, 循环在文件

开始时启动并且读入所有

节点,

次读入

个节点, 直到到达文件

结尾:

While (myReader.Read

) {
...
// 在这里处理每个节点.
...
}

　　每次成功

Read

的后

XMLTextReader例子化

包含了目前节点(即刚刚从文件中读取

那个节点)

信息

我们可以从XMLTextReader

成员中获得上述信息

就像表格1中描述

样；并通过NodeType属性判断出当前节点

类型

在节点类型

基础上

代码可以读取节点数据

检查它是否有属性

到底是忽略它还是根据

需要进行相应

操作和处理

　　当使用NodeType属性时

理解节点如何联系到XML单元是非常重要

例如, 看下列 XML元素:

＜city＞Chongqing＜/city＞

　　XMLtextReader 把这个元素看作 3 个节点

顺序如下:

　　1．＜city＞标签被读为类型 XMLNodeType.Element 节点

元素

名字“city”可从 XMLTextReader

Name属性中获得

　　2．文本数据“Chongqing”被读为类型为XMLNodeType.Text

节点

数据“Chongqing ” 可从XMLTextReader

Value属性中取得

　　3．＜/city＞标签被读为类型为XMLNodeType.EndElement 节点

同样

元素

名称“city”可从XMLTextReader

Name属性中获得

　　这是 3 种重要

节点类型

其它

类型在.NET

介绍说明文档中有详细介绍说明

请大家参阅相关资料

　　如果XMLTextReader遇到

个

, 例如出现违反XML句法

情况

它抛出

个

.XML.XMLException类型

异常

使用这个类

代码应该总是被保护 ( 在Try……Catch块中)

就像你以后在演示

中看到

样

　　本文只是

篇相当简单

介绍XMLTextReader 类

文章

XMLTextReader类有相当多

成员

在这里不可能

述及

当读入XML数据时

XMLTextReader能提供相当强

灵活性

即便如此

我仍然进行了大量

论述

以保证读者能编制

来实现现实世界中经常要求完成

任务

也就是从

个XML文件读取数据然后以HTML

格式输出

从而实现在浏览器中

显示

　　这个ASP.NET

(脚本)在服务器上运行并产生

个HTML页面返回浏览器

这段脚本

在代码段 1 给出

它用来工作使用

XML 数据文件在代码段 2给出

你能看到这个 XML 文件包含

份表示联系关系

列表；

目标即是将这个列表显示出来

为了更容易我们观察

这些列表已经被格式化了

　　运行

:

　　1．将代码段1存为XMLTextReader.ASPx文件

将代码段2存为XMLData.XML文件

　　2．把这两个文件都放在

个已经安装好.NET 框架

网络服务器

虚拟文件夹中

　　3．打开 Internet Explorer 并且浏览这个ASPx文件

例如

在

个局域网服务器上, URL 将是

http://localhost/xmltextreader.ASPx ;

工作

大部分都由XMLDisplay 类来做,尤其是被ProcessXML

思路方法完成

它每次读取

个节点XML数据

对于感兴趣

元素

节点数据和后跟冒号

节点名将和相应

HTML格式化标签

起写入输出结果中

在这阶段

“输出结果”由

个HTML文本暂时储存在其中

StringBuilder对象构成

　　ProcessXML

思路方法是从LoadDocument

思路方法

这个思路方法执行

任务是产生

个XMLTextReader例子化

并在

ProcessXML的前装载XML文件

它同时也处理异常

随后产生

信息并在浏览器中显示出来

最终该思路方法返回

个

串

这个

串或者包含产生

HTML内容

或者如果异常发生

话就包含出错信息

执行以Page_Load

开始

当浏览器请求浏览这个页面时

这

步会自动执行

这里

代码例子化了XMLDisplay 类并

它

LoadDocument

思路方法

如果

切运行正常

话

格式化

HTML形式

返回值将被拷贝到页面

个＜div＞标签中

生成

HTML文档被送回到浏览器中并显示出来

　　其他

.NET 框架

类

比如XMLDocument类在读取XML数据方面表现如何呢？XMLDocument 类和XMLTextReader 类区别

它在存储器中创建整个XML文档

节点树

这样就可以随机

获得XML数据(和XMLTextReader 类获得数据

线性方式正好相反)

并且在修改XML文件

数据和结构时

具有非常完美

灵活性

另外,XMLDocument允许执行XSLT 转变

不过

这些额外

功能是以运行速度

降低和系统资源

更多占用为代价

　　代码段1:XmlTextReader.aspx

＜%@ Import Namespace=\"

.Xml\" %＞

＜script language=\"C#\" runat=server＞

public

XmlDisplay
file://这个类读入并处理XML文件

{

public

LoadDocument(String XmlFileName) {
XmlTextReader xmlReader = null;
StringBuilder html =

StringBuilder

;
try {
file://创建XMLTextReader

例子

xmlReader =

XmlTextReader(XmlFileName);
// 处理XML文件
html.Append(ProcessXml(xmlReader));
}
catch (XmlException ex){
html.Append(\"发生

个XML异常:\" +
ex.

);
}
catch (Exception ex){
html.Append(\"发生

个普通异常:\" +
ex.

);
}
finally
{

(xmlReader != null)
xmlReader.Close

;
}

html.

;
}

private

ProcessXml(XmlTextReader xmlReader)
{
StringBuilder temp =

StringBuilder

;

file://这个思路方法读入XML文件并生成输出

HTML文档

while ( xmlReader.Read

)
{
// 处理

个元素节点

起始

(xmlReader.NodeType

XmlNodeType.Element)
{
file://忽略＜people＞和＜person＞元素

((xmlReader.Name != \"person\") && (xmlReader.Name != \"people\"))
{
file://如果是

个＜category＞元素

开始

个新

段落

( xmlReader.Name

\"category\" )
temp.Append(\"＜p＞\");
file://添加元素名到输出中
temp.Append( xmlReader.Name + \": \" );
}
}
// 处理文本节点

(xmlReader.NodeType

XmlNodeType.Text)
temp.Append(xmlReader.Value + \"
\");
file://处理元素节点

结尾

(xmlReader.NodeType

XmlNodeType.EndElement)
{
file://如果是＜email＞节点

添加结束段落

标记

( xmlReader.Name

\"email\" )
temp.Append(\"＜/p＞\");
}
}//结束while循环

temp.

;

} file://结束ProcessXML思路方法

} file://结束XmlDisplay类

private void Page_Load(Object sender, EventArgs e){
file://创建XmlDisplay类

例子
XmlDisplay XmlDisplayDemo =

XmlDisplay

;
output.InnerHtml = XmlDisplayDemo.LoadDocument(Server.MapPath(\"XMLData.xml\"));
}
＜/script＞
＜html＞
＜head＞
＜/head＞
＜body＞
＜h2＞演示XmlTextReader类＜/h2＞
＜div id=\"output\" runat=\"server\"/＞
＜/body＞
＜/html＞

1

void Main(

args)
2 {
3 DateTime d1 =DateTime.Now;
4 XmlDocumentTest

;
5 DateTime d2 =DateTime.Now;
6 TimeSpan ts =d2-d1 ;
7
8 Console.WriteLine(ts.TotalMilliseconds) ;
9 Console.Read

;
10
11 }
12
13
14 public

XmlFileName = \"../../XML/1.xml\";
15
16 private

void XmlTextReaderTest

17 {
18 XmlTextReader reader =

XmlTextReader(XmlFileName);
19 while (reader.Read

)
20 {
21 bool exit =false;

22 switch(reader.NodeType)
23 {
24

XmlNodeType.Element :
25

;
26

XmlNodeType.Text :
27

(reader.Value

\"last\")
28 {
29 exit=true;
30 }
31

;
32

XmlNodeType.EndElement :
33

;
34 default:
35

;
36 }
37

(exit)
38 {
39

;
40
41 }
42
43 }
44 }
45
46 private

void XmlDocumentTest

47 {
48 XmlDocument xd =

XmlDocument

;
49 xd.Load(XmlFileName) ;
50 XmlNode node = xd.SelectSingleNode(\"/people/person[category=\'last\']\");
51 Console.Write(node.Name) ;
52 }

结果发现第

个耗时:
结果发现第 2个耗时:

xmltextreader:XMLTextReader和XmlDocument读取XML文件的比较

延伸阅读

最新评论

发表评论

赞助商广告

随机更新

热门标注

最近更新

最新标注