XML, XHTML: Was ist das, was kann das?

 

XML, HTML -> XHTML

XML hat mit dem Web eigentlich wenig zu tun: XML hat sich in den letzten Jahren als universelles und allgemeines Austauschformat für Daten etabliert. Egal ob Audio-Playlists, Adresslisten oder Lagerbestände; XML kommt der Art, wie moderne Programme Daten verwalten sehr entgegen, deswegen lassen sich sehr leicht Export- und Import-Funktionen programmieren.
XHTML ist eine besondere Form von XML, die - abgeleitet von HTML - speziell für das Web definiert wurde. HTML und XML (und damit XHTML) haben gemeinsame Wurzeln und sind deswegen ohnehin sehr ähnlich.

XHTML ist also der kleinste gemeinsame Nenner von XML und HTML: Die Auszeichnungen stammen von HTML, die strenge Struktur von XML.

Die wesentlichen Unterschiede: HTML kennt sehr viele Ausnahmen/Abkürzungen und muss vom Browser sehr fehlertolerant behandelt werden. Bei XHTML wurden die Schrauben wieder angezogen: Fehler werden nicht toleriert und es gibt weniger und neue Ausnahmen.

Was bedeutet das jetzt:

XHTML ist ein reduziertes HTML und kann deswegen das selbe oder weniger wie HTML. XHTML kann also nichts, was HTML nicht auch kann. Der eigentliche - und wesentliche - Unterschied ist: HTML kann "schlampig" sein, XHTML nicht. Eine XHTML-Seite muss richtig geschrieben sein und muss richtig dargestellt werden.
Ein Browser, der HTML halbwegs darstellen kann, kann prinzipbedingt auch XHTML halbwegs darstellen, er muss nicht besonders XHTML-fähig sein. Aber: Wenn er speziell XHTML unterstützt, stellt er sie vielleicht anders dar.

 

zurück

Und was bedeutet XHTML für Suchmaschinen?

Da ein Suchmaschinen-Spider eine Seite nicht darstellen muss, sind ihm die Regeln zur Darstellung egal. Er kann daher ohne Probleme die Seite nach den HTML-Regeln analysieren. Dazu muss er nicht einmal die DTD (Typ-Definition) kennen, er kann XHTML und HTML über den selben Kamm scheren. Von daher macht es keinerlei Unterschied. Es könnte sein, dass XHTML dereinst anders geparst wird, im Indexer ist aber wieder kein Unterschied.
Bleibt noch die Frage, ob eine Suchmaschine annehmen kann, dass eine XHTML-Seite irgendwie "höherwertig" wäre. Für diese Annahme gibt es keine ernst zu nehmenden Gründe.

Was man so hört zum Thema XHTML (XML):

XHTML wird sauberer dargestellt!
Unsinn: XHTML wird genauso dargestellt wie ordentliches HTML. Dabei ist mit "ordentlich" nicht unbedingt "valide" gemeint: Eine valide Seite kann völlig falsch dargestellt werden, eine nicht-valide Seite hingegen völlig richtig. Eine fehlerhafte HTML-Seite wird "irgendwie" dargestellt, eine fehlerhafte XHTML-Seite uU. gar nicht. Unterschiede in der Darstellung ergeben sich nicht aus der Darstellung von (X)HTML, sondern von CSS.

Mit XHTML wird Inhalt und Struktur getrennt!
Die Trennung von Inhalt und Struktur ist ein Grundprinzip von HTML – von 1 bis X. Aufgrund der sorglosen Verwendung von WYSIWYG-Editoren und der einfachen Möglichkeit, komplexe Formatanweisungen direkt in den Code zu schreiben, hat HTML einen etwas schlechten Ruf bekommen. Diese Möglichkeiten sind in XHTML stark eingeschränkt und werden deswegen in Richtung schlampiges CSS ausgelagert. Am Prinzip ändert das nichts.

XHTML ist barrierefrei!
Diese Aussage ist Grund genug für eine Abschussgenehmigung. XHTML ist natürlich weniger oder maximal genauso barrierefrei wie HTML, weil Geräte/Software erst umgestellt werden müssen.

Seiten mit XHTML können auch auf mobilen Endgeräten( PDAs oder Handy) betrachtet werden.
Es wird wohl noch ein Weilchen dauern, bis man sich Handys mit 17" Schirm ans Ohr hält, womöglich wird das nie passieren. Und selbst dann würde es normales HTML auch tun. Dass auch Google keine XHTML-Ergebnisseiten hat, zeigt, wie groß der Bedarf ist. Gab's da nicht mal WAP dafür? – egal, vergessen.

XHTML kann auch von völlig anderen Geräten interpretiert werden.
Was auch immer "völlig andere Geräte" sind: Hier wird schlichtweg die oben erwähnte universelle Verwendbarkeit von XML ins Spiel gebracht. Natürlich kann ein Bestückungsmanipulator seine Daten als XML bekommen, ob er dazu auf meine Website zugreift? – Ich bezweifle es.

XHTML ist einfach die Zukunft!
Derzeit kommt so ziemliX niX ohne X aus: XP, MX, Xbox, Xtra. XML und XHTML also voll im Trend. Aber vielleicht hat ja Adobe den längeren Atem und XHTML wird schon demnächst von CSHTML und CSML abgelöst. Mit CSS hat Adobe ja schon mal den Fuß in die Tür gesteckt. ;-)

Kategorie: /