Java 解析XML~~系列二

Hello world
  现在我们明白了基本的SAX原理,我们可以着手做一点稍微有用的:从我们的XML样本文档中解析出值来,实现经典的hello world程序。
  首先,将每个感兴趣的元素印射到Java,我们在startElement 事件处重置我们的数据缓存。然后,当startElement已经发生,而endElement事件还没有时,我们把characters事件对应的所有字符收集起来。最后,到endElement事件出现时,我们将收集到的字符保存到一个Java对象的对应属性中。
  以下是我们的hello world例子所用到的样本数据:
  <?xml version="1.0"?>
  <simple date="7/7/2000" >
   <name> Bob </name>
   <location> New York </location>
  </simple>
  还有例子的XML解析代码清单:
  import org.xml.sax.*;
  import org.xml.sax.helpers.*;
  import java.io.*;
  public class Example2 extends DefaultHandler {
   // 用于保存寻获数据的本地变量
   public String name = "";
   public String location = "";
   // 用于收集来自”characters” SAX事件的数据的缓存。
   private CharArrayWriter contents = new CharArrayWriter();
   // 重载DefaultHandler类以拦截SAX事件的方法。
   //
   // 头于所有有效事件的详细内容,参见org.xml.sax.ContentHandler。
   //
   public void startElement( String namespaceURI,
   String localName,
   String qName,
   Attributes attr ) throws SAXException {
   contents.reset();
   }
   public void endElement( String namespaceURI,
   String localName,
   String qName ) throws SAXException {
   if ( localName.equals( "name" ) ) {
   name = contents.toString();
   }
   if ( localName.equals( "location" ) ) {
   location = contents.toString();
   }
   }
   public void characters( char[] ch, int start, int length )
   throws SAXException {
   contents.write( ch, start, length );
   }
   public static void main( String[] argv ){
   System.out.println( "Example2:" );
   try {
   // 创建SAX 2解析器...
   XMLReader xr = XMLReaderFactory.createXMLReader();
   // 安装ContentHandler...
   Example2 ex2 = new Example2();
   xr.setContentHandler( ex2 );
   // 解析文件...
   xr.parse( new InputSource(
   new FileReader( "Example2.xml" )) );
   // Say hello...
   System.out.println( "Hello World from " + ex2.name
   + " in " + ex2.location );
   }catch ( Exception e ) {
   e.printStackTrace();
   }
   }
  }
  我们的hello world例子输出如下:
  Example2:
  Hello World from Bob in New York
  这并非所有hello world程序中最简单的一个。同样,在这个例子代码中有几处并不完美。
  第一,这个代码显示了事件驱动的代码的一些不足。当事件驱动的程序不是要对一个事件而是要对一类事件做出响应时,事情就很棘手了。以上述代码为例,我们在寻找以名字及在XML样本文档中出现的位置为标志的一类事件。
  标签内的内容出现于characters SAX事件中;标签本身则位于startElement和endElement事件之间。我利用在startElement中不断清空的contents缓存来处理它们。结束标签的出现意味着数据以被收集,将它保存到正确的本地变量中。这本身不错,但是它却假定了没有两个Java对象使用的是同样的标签——这个假设不总是对的。我们稍后要处理这个问题。
  这个例程另一个有意思的特点是contents缓存的使用——一个SAX小窍门。你也可以直接在characters SAX事件中创建一个字符串以取代这种将字符拷贝进缓存的办法。但这也意味着忽视有关characters()的SAX文档中指出的XML解析器可能多次调用characters()方法这一事实。这可能导致收集数据时遇到两个标签之间数据过大或输入到XML解析器的流缓存在两个标签之间断开而引起数据丢失。此外重用一个缓存比起不断创建新的对象要高效得多。
  创建我们的第一个Java对象映射
  现在我们以经做完了hello world,让我们来试一个更加有用的将一个XML文档印射到Java对象的例子。这个例子与hello world相似,但是还要将数据映射到一个对象中并且有一个调用者——这是在以后的例子中很常用的模型。不向构造函数和Factory方法,在解析结束前SAX解析器中的对象都是无效的。对于这点异样,一个干净利索的办法是在进行映射对象的对象中为已被成功映射出来的对象创建一个访问控制方法(译注:亦即作为一个字段)。如此,你就创建进行映射的类,赋给它一个XMLReader,解析XML,然后调用访问控制方法获取映射到的对象的引用。一个替代方案是提供一个set方法,在解析之前就将待解析的容纳数据的对象赋给进行解析的对象。
  先看一下例三的XML样本文档:
  <?xml version="1.0"?>
  <customer>
   <FirstName> Bob </FirstName>
   <LastName> Hustead </LastName>
   <CustId> abc.123 </CustId>
  </customer>
  接下来,我们看一个将被来自我们的XML文档的数据映射出来的简单类:
  package common;
  import java.io.*;
  // Customer是一个包含一名虚拟顾客的属性的简单类。
  // 它有一个简单的方法把自已打印到一个打印流。
  public class Customer {
   // Customer成员变量
   public String firstName = "";
   public String lastName = "";
   public String custId = "";
   public void print( PrintStream out ) {
   out.println( "Customer: " );
   out.println( " First Name -> " + firstName );
   out.println( " Last Name -> " + lastName );
   out.println( " Customer Id -> " + custId );
   }
  }
  这是例三中进行解析的类的代码:
  import org.xml.sax.*;
  import org.xml.sax.helpers.*;
  import java.io.*;
  import common.*;
  public class Example3 extends DefaultHandler {
   // 用于收集customer的XML数据的本地Customer变量
   private Customer cust = new Customer();
   // 用于从"characters" SAX事件中收集数据的缓存。
   private CharArrayWriter contents = new CharArrayWriter();
   // 重载DefaultHandler类以拦截SAX事件的方法。
   //
   // 头于所有有效事件的详细内容,参见org.xml.sax.ContentHandler。
   //
   public void startElement( String namespaceURI,
   String localName,
   String qName,
   Attributes attr ) throws SAXException {
   contents.reset();
   }
   public void endElement( String namespaceURI,
   String localName,
   String qName ) throws SAXException {
   if ( localName.equals( "FirstName" ) ) {
   cust.firstName = contents.toString();
   }
   if ( localName.equals( "LastName" ) ) {
   cust.lastName = contents.toString();
   }
   if ( localName.equals( "CustId" ) ) {
   cust.custId = contents.toString();
   }
   }
   public void characters( char[] ch, int start, int length )
   throws SAXException {
   contents.write( ch, start, length );
   }
   public Customer getCustomer() {
   return cust;
   }
   public static void main( String[] argv ){
   System.out.println( "Example3:" );
   try {
   // 创建SAX 2解析器...
   XMLReader xr = XMLReaderFactory.createXMLReader();
   // 安装ContentHandler...
   Example3 ex3 = new Example3();
   xr.setContentHandler( ex3 );
   // 解析文件...
   xr.parse( new InputSource(
   new FileReader( "Example3.xml" )) );
   // 将customer显示到标准输出...
   Customer cust = ex3.getCustomer();
   cust.print( System.out );
   }catch ( Exception e ) {
   e.printStackTrace();
   }
   }
  }
  以下是我们的Customer对象产生的输出,显示出来自我们的XML文档的数据:
  Example3:
  Customer:
   First Name -> Bob
   Last Name -> Hustead
   Customer Id -> abc.123
Tags: 

延伸阅读

最新评论

发表评论