Einführung in XML Teil II

Die Trennung von Struktur, Inhalt und Layout

Das Grundprinzip von Markierungssprachen basiert auf der Trennung von Inhalt, Struktur und Layout von Dokumenten. Nimmt man ein beliebiges Dokument und analysiert es, so kann man vieles herauslesen:

Zum Einen findet sich dabei Textmaterial, welches in verschiedenen Erscheinungsformen auftritt: mal fett, mal kursiv und mal gesperrt gesetzt. Diese Ebene eines Dokuments kann man mit dem Begriff Layout verdeutlichen.

Es können sich aber in einem Dokument auch Bilder finden oder Tabellen - oder es finden sich multimediale Elemente, die ein herkömmliches Textdokument nicht abbilden kann, wie bspw. Filme oder Soundsequenzen. Das Zusammenspiel dieser Komponenten eines Dokuments kann als Struktur verstanden werden.

Und da der Begriff Dokument in erster Linie von einem Textdokument abstammt, trifft diese Bezeichnung auch nicht das, was Auszeichnungssprachen eigentlich an Datenmodellierung leisten können, denn "Dokumente sind ..[..].. mehr als nur Text." Daher spricht man bei XML-Dateien, die einer sogenannten Document Type Definition (DTD) gehorchen auch nicht von XML-Dokumenten, sondern von XML-Instanzen.

Und als dritter Punkt: es lassen sich in solchen Dokumenten oder Instanzen auch Elemente finden, deren semantische Logik sich in Beziehung setzen läßt zu den umgebenden Elementen oder zu anderen Elementen in anderen Instanzen.

Hier spricht man von semantischen Elementen.
Ein Beispiel:

	<GEBURTSDATUM> 12.01.1965 </GEBURTSDATUM>

Die Trennung in diese Grundbegriffe ist eine der elementarsten Vorgehensweisen in der Technologie der Markierungssprachen.

Noch genauer gefasst müßte man hier noch die Daten bzw. den Inhalt als separaten Teil der Instanz erfassen, die Daten im oberen Beispiel wären: 12.01.1965

Hier wird auch ein weiterer großer Vorteil von XML deutlich: zwar gibt es schon portable, auf den Austausch ausgerichtete Dateiformate wie bspw. PDF, aber in keinem anderen Dateiformat erfolgt eine so derart strikte Trennung der Grundelemente einer Instanz, wie eben in XML.

"Daß XML das universale Format für alle möglichen Anwendungen wird, ist nicht abzusehen. Eine Firma, wie der DTP-Experte Quark verfügt nicht umsonst über ein internes Dateiformat, dessen Einzelheiten draußen im Land nicht bekannt sind. Zu XML zu wechseln käme in diesem Fall möglicherweise wirtschaftlichem Ruin gleich." (Henning Behme in "i'X" 02/99)

Die eigentliche Codierung von XML-Instanzen und die Datenmodellierung in DTDs berücksichtigt dabei das Layout aber grundsätzlich nicht.

Bei SGML wurde dafür die Sprache Document Semanctic Style Specification Language (DSSSL) konzipiert, bei XML sind es Cascading Style Sheets (CSS) oder die eXtensible Style Language (XSL), die für das Layout eingesetzt werden.

 

Copyright & Kontakt
jcpohl@gmx.de
© www.jcpohl.de 1999/2000