Java 中的 XML 节点到字符串

2022-09-01 02:33:41

我遇到了这个Java函数,用于将XML节点转换为Java字符串表示形式:

private String nodeToString(Node node) {
    StringWriter sw = new StringWriter();
    try {
        Transformer t = TransformerFactory.newInstance().newTransformer();
        t.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes");
        t.setOutputProperty(OutputKeys.INDENT, "yes");
        t.transform(new DOMSource(node), new StreamResult(sw));
    } catch (TransformerException te) {
        System.out.println("nodeToString Transformer Exception");
    }
    return sw.toString();
}

它看起来很简单,因为它希望输出字符串没有任何XML声明,并且必须包含缩进。

但我想知道实际输出应该如何,假设我有一个XML节点:

<p><media type="audio" id="au008093" rights="wbowned">
<title>Bee buzz</title>
</media>Most other kinds of bees live alone instead of in a colony. These bees make
tunnels in wood or in the ground. The queen makes her own nest.</p>

我是否可以假设应用上述转换后生成的字符串是:

"media type="audio" id="au008093" rights="wbowned" title Bee buzz title /media"

我想自己测试它,但我不知道如何以这个函数实际想要的方式表示这个XML节点。

我有点困惑,并提前感谢慷慨的帮助。


答案 1

所有重要的事情都已经说完了。我试图编译以下代码。


import java.io.ByteArrayInputStream;
import java.io.InputStream;
import java.io.StringWriter;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.OutputKeys;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

import org.w3c.dom.Document;
import org.w3c.dom.Node;

public class Test {

  public static void main(String[] args) throws Exception {

    String s = 
      "<p>" +
      "  <media type=\"audio\" id=\"au008093\" rights=\"wbowned\">" +
      "    <title>Bee buzz</title>" +
      "  " +
      "  Most other kinds of bees live alone instead of in a colony." +
      "  These bees make tunnels in wood or in the ground." +
      "  The queen makes her own nest." +
      "</p>";
    InputStream is = new ByteArrayInputStream(s.getBytes());

    DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
    DocumentBuilder db = dbf.newDocumentBuilder();
    Document d = db.parse(is);

    Node rootElement = d.getDocumentElement();
    System.out.println(nodeToString(rootElement));

  }

  private static String nodeToString(Node node) {
    StringWriter sw = new StringWriter();
    try {
      Transformer t = TransformerFactory.newInstance().newTransformer();
      t.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes");
      t.setOutputProperty(OutputKeys.INDENT, "yes");
      t.transform(new DOMSource(node), new StreamResult(sw));
    } catch (TransformerException te) {
      System.out.println("nodeToString Transformer Exception");
    }
    return sw.toString();
  }

}

它产生了以下输出:


<p>  <media id="au008093" rights="wbowned" type="audio">    <title>Bee buzz</title>  </media>  Most other kinds of bees live alone instead of in a colony.  These bees make tunnels in wood or in the ground.  The queen makes her own nest.</p>

您可以自己进一步调整它。祝你好运!


答案 2

您在 DOM 树中有一个 XML 请求。
例如,您打开了一个 XML 文件,并在 DOM 解析器中传递了它。
因此,在内存中创建一个包含 XML 的 DOM 树。
现在,您只能通过遍历 DOM 树来访问 XML 信息。
但是,如果需要,可以使用转换来表示 DOM 树的 XML 信息的字符串表示形式。
发生这种情况是因为无法直接从 DOM 树中获取字符串表示形式。
因此,例如,如果传入的是 XML 文档的根元素,则结果是包含原始 XML 数据的字符串。
标签仍将存在。即,您将拥有有效的XML表示形式。只有这次是在字符串变量中。Node nodenodeToString

例如:

  DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
  DocumentBuilder parser = factory.newDocumentBuilder();
  Document xmlDoc = parser.parse(file);//file has the xml
  String xml = nodeToString(xmlDoc.getDocumentElement());//pass in the root
  //xml has the xml info. E.g no xml declaration. Add it
  xml = "<?xml version=\"1.0\" encoding=\"UTF-8\" ?> + xml;//bad to append this way...
  System.out.println("XML is:"+xml);

免責聲明:甚至没有尝试编译代码。希望您了解自己需要做什么


推荐