|
DTD |
|
|
DTD:
DTDs (http://www.w3.org/TR/2004/REC-xml11-20040204/) sind formale Spezifikationen aller in einem Dokumenttyp erlaubten Strukturen. Man spricht auch von einer formalen Grammatik, in der die Bezeichnungen der in Dokumenteninstanzen zulässigen Tags und deren Verschachtelung definiert sind. Unter Instanzen wiederum versteht man Dokumente, deren Inhalte mit den Tags einer bestimmten DTD ausgezeichnet sind. Eine DTD beschreibt den strukturellen Aufbau und die logischen Elemente einer Klasse von Dokumenten, genannt Dokumenttyp. Sie ist in der Extended Backus Naur Syntax geschrieben. Die formale Grammatik von XML 1.0 ist unter der Verwendung der Extended Backus-Naur-Form (EBNF) festgelegt (HOLZNER 2001). Ein Schema ist hingegen eine XML-Datei und kann damit von beliebiger XML Software be- und verarbeitet werden (siehe auch http://www.heise.de/ix/artikel/1997/06/106/ ). Jedes Dokument, dessen Inhalt mit den Tags einer bestimmten DTD ausgezeichnet ist, wird als deren Instanz bezeichnet. Um die Instanzen von XML und SGML unterscheiden zu können, wird immer die processing instruction (<?XML VERSION=3D"1.0">) vorangestellt. In der Diskussion um XML wird zwischen wohlgeformten (well formed) und gültigen (valid) Dokumentinstanzen unterschieden. Erstere enthalten Tags, die den grundlegenden Regeln von XML entsprechen, letztere zusätzlich die DTD, zu der sie gültig sind. Gültige Dokumente dürfen keines der Inhaltsmodelle ihrer DTD verletzen. Damit nicht in jedem gültigen Dokument die DTD angegeben werden muß, kann sie auch von einer externen Stelle inkludiert werden. In einem XML Dokument kann nur eine externe DTD (<!DOCTYPE BUCH SYSTEM "http://www.wast2000.de/buch.dtd">) angegeben werden (s. XML Bible S. 286). Eine interne und eine externe DTD dürfen aber angegeben werden. Will man Elemente einsetzen, die in mehr als einer DTD deklariert sind müssen externe Parameterentitäten eingesetzt werden. DTDs und Datenformate (aus: members.aol.com/xmldoku/#6)Unter einem Datenformat versteht man die Gesamtheit der Richtlinien, die für das Organisieren von Daten innerhalb einer Datei gelten. Der Begriff 'Datenformat' wird weitgehend identisch mit 'Datei-Format' verwendet.Wenn man anschaut, was durch eine Dokument-Typ-Definition geliefert wird, stellt man fest, daß es sich um etwas sehr Ähnliches handelt. Die DTD legt fest, wie in einer Datei des entsprechenden Typs die Daten organisiert werden. Es kann die Frage aufkommen, warum bei der Arbeit mit Web-Dokumenten XML-Datenformate verwendet werden sollen. Daß mit Text-Auszeichnungen (Markup) gearbeitet wird, gibt es nicht nur im Rahmen von SGML und XML. Jede Textverarbeitung verwendet Auszeichnungen. Wenn man beim Arbeiten mit einem Dokument angibt, daß eine bestimmte Zeichenfolge im Fettdruck erscheinen soll, setzt das Textverarbeitung intern eine entsprechende Markierung. Warum also verwendet man im Internet nicht Datenformate, die sich anderswo schon längst bewährt haben, etwa das Rich Text Format (RTF) oder das Datenformat von Winword? Antwort 1: Ein Datenformat, das zu einem Standard-Datenformat im Internet werden will, sollte zwei wichtige Bedingungen erfüllen: Es sollte plattformübergreifend zur Verfügung stehen, und nicht im Besitz einer einzelnen Firma sein. RTF und das Winword-Format erfüllen diese Bedingungen nicht. Antwort 2: Im Umfeld der XML-Spezifikation enstehen eine Reihe von interessanten anderen Standards (zum Beispiel für das Verknüpfen von Dokumenten und für den Zugriff auf den sogenannten Dokument-Baum). Jedes Datenformat, das auf der Grundlage von XML definiert wird, befindet sich somit von Anfang an in einem Umfeld, in dem es eine Reihe von nützlichen Zusatz-Standards gibt. Kompatibilität und Datenaustausch bereiten weniger Sorgen als bei anderen proprietären Lösungen. Viele Standard-Software-Produkte, etwa die einzelnen Programme der gängigen Office-Suiten (Textverarbeitung, Tabellenkalkulation, ...) können schon mit XML-Datenformaten umgehen.
holzner, s. (2001): Inside XML. München: Markt + Technik Verlag. 1213 S. |