XML-Instanzen beginnen immer mit einer sogenannten "Processing Instruction", kurz PI.
<?xml version="1.0"?>Wenn ein XML Parser auf das Fragezeichen stößt, so weiß er, daß es sich hierbei um eine PI handelt und führt den folgenden Inhalt aus. In diesem Fall erwartet er eine XML-Instanz, die den Regeln der Version 1 der Empfehlung des W3C gehorcht.
<?xml version="1.0" encoding="ISO-8859-1" standalone="yes"?>Mit encoding erfährt der Parser, daß das nachfolgende Datenmaterial in der ISO-8859-1 codiert ist, also dem Zeichensatz des (u.a.) europäischen Sprachraums. Mit standalone wird dem Browser mitgeteilt, ob er für diese XML-Instanz noch eine Document Typ Definition (DTD) erwarten soll ("no") oder nicht ("yes").
XML-Instanzen müssen wohlgeformt sein, d.h. bei unsauber verschachtelten Tags ist eine XML-Instanz nicht mehr wohlgeformt:
Beispiel: falsch <?xml version="1.0"?> <Adressbuch> <eintrag> <name> Hans Meier </name> <email> hmeier@meier.com </eintrag> </email/> </Adressbuch> richtig <?xml version="1.0"?> <Adressbuch> <eintrag> <name> Hans Meier </name> <email> hmeier@meier.com </email> </eintrag> </Adressbuch>
Darüber hinaus gelten für Wohlgeformtheit noch weitere Bedingungen. So schreibt die Recommendation auch vor, daß alle Elemente der XML-Instanz von einem klammernden sog. root-Element, umschlossen werden. Außerdem müssen bspw. alle Attributwerte in einfachen oder doppelten Anführungszeichen stehen.
Alle weiteren Beschränkungen der Wohlgeformtheit finden sich in der Recommendation der XML-Version 1.0.
Valide XML-Instanzen müssen wohlgeformt sein, und darüber hinaus von einer DTD abgeleitet sein und allen Deklarationen des Inhaltsmodells, die in der DTD definiert wurden, entsprechen. Validierende Parser machen also einen Abgleich der XML-Instanz mit der dazugehörigen DTD.
Alle weiteren Beschränkungen der Validität finden sich in der Recommendation der XML-Version 1.0.