XML не се анализира със символ Escape

Опитвам се да напиша прост анализатор на SAX, получавам входните данни от отговор на уеб услуга и той включва екраниращи знаци ‹ и › Когато се опитвам да го анализирам с моя код, получавам Препратката не е разрешена в пролог. Грешка, където, сякаш променям екраниращите знаци на нормален символ ‹ и >, той се анализира без никакви проблеми, предполагам, че пропускам нещо много просто тук... може ли някой да помогне?

import java.io.ByteArrayInputStream;
import java.io.FileReader;
import java.io.InputStream;

import org.xml.sax.XMLReader;
import org.xml.sax.Attributes;
import org.xml.sax.InputSource;
import org.xml.sax.helpers.XMLReaderFactory;
import org.xml.sax.helpers.DefaultHandler;

public class Test extends DefaultHandler {

    public static void main(String args[]) throws Exception {
        XMLReader xr = XMLReaderFactory.createXMLReader();
        Test handler = new Test();
        xr.setContentHandler(handler);
        xr.setErrorHandler(handler);

        String xml_string = "<rootnode><a>hello</a><b>world</b></rootnode>";
        InputStream xmlStream = new ByteArrayInputStream(xml_string.getBytes("UTF-8"));
        xr.parse(new InputSource(xmlStream));
    }

    public Test() {
        super();
    }

    ////////////////////////////////////////////////////////////////////
    // Event handlers.
    ////////////////////////////////////////////////////////////////////

    public void startDocument() {
        System.out.println("Start document");
    }

    public void endDocument() {
        System.out.println("End document");
    }

    public void startElement(String uri, String name, String qName, Attributes atts) {
        if ("".equals(uri))
            System.out.println("Start element: " + qName);
        else
            System.out.println("Start element: {" + uri + "}" + name);
    }

    public void endElement(String uri, String name, String qName) {
        if ("".equals(uri))
            System.out.println("End element: " + qName);
        else
            System.out.println("End element:   {" + uri + "}" + name);
    }

    public void characters(char ch[], int start, int length) {
        System.out.print("Characters:    \"");
        for (int i = start; i < start + length; i++) {
            switch (ch[i]) {
            case '\\':
                System.out.print("\\\\");
                break;
            case '"':
                System.out.print("\\\"");
                break;
            case '\n':
                System.out.print("\\n");
                break;
            case '\r':
                System.out.print("\\r");
                break;
            case '\t':
                System.out.print("\\t");
                break;
            default:
                System.out.print(ch[i]);
                break;
            }
        }
        System.out.print("\"\n");
    }
}

person Snehan Solomon    schedule 18.11.2011    source източник


Отговори (2)


Не трябва да използвате екраниращи знаци във вашия xmlstring. Трябва да използвате < и > за xml таговете. Избягвайте ги само когато трябва да включите ‹ или > като част от съдържанието на атрибут/елемент, а не самия таг на елемента.

person Chris    schedule 18.11.2011

За нормални тагове трябва да използвате ‹ и > като ‹ root >...‹ / root >. Само в реален текст ‹ и > трябва да бъдат екранирани в & lt; и & gt ;.

person Joop Eggen    schedule 18.11.2011