Eines der Buzzwords des letzten Jahres ist „Microformats“. Microformats sind ein Ansatz mit den Mitteln der verbreiteten Standards Inhalte im Internet mit semantischen Metadaten anzureichern. Aber was steckt dahinter? Und sind Microformats dafür geeignet?Die Basis von Internetseiten ist HTML, einer „textbasierte Auszeichnungssprache“ – Das heisst, dass verschiedene Elemente eines Textes (Absätze, Überschriften verschiedener Ebenen, Bilder, Links, ..) gesondert markiert werden. Die Inhalte werden damit zur Zeit bestenfalls strukturiert.
Wie diese Elemente aussehen, wird per CSS festgelegt. So gehört zu einer HTML-Datei auch immer eine CSS-Datei. Hier stehen Schriftgrößen und Farben, welche Inhalte wo angezeigt werden sollen usw.
Welchen Sinn ein Dokument hat, kann nur der menschliche Betrachter erkennen: Handelt es sich um einen Blogeintrag oder ein Forum, ist das eine Adresse oder ein Bild in einer Galerie? Ein Computer kann soetwas nicht so einfach erkennen – Die Semantik nun im Allgemeinen befasst sich mit Sinn und Bedeutung von Sprache beziehungsweise sprachlichen Zeichen. Und es gibt verschiedene Ansätze den Computer das Erkennen von semantischen Zusammenhängen in Internetdokumenten zu erleichtern. Ein Ansatz sind Microformats.
Microformats basieren auf einer Community-Initiative – Ein paar HTML-Begeisterte haben sich Gedanken dazu gemacht, wie man mit den bestehenden Mitteln von HTML ein wenig Semantik ins Web bringen kann. Sie sind auf die Idee gekommen, dass das einfach dadurch geht, indem sie bestimmte Klassen festlegen, mit denen Inhalte ausgezeichnet werden.
In der Praxis sieht das so aus, dass man nicht nur markiert, dass der folgende Absatz eine Adresse ist – dafür gibt es nämlich das natives HTML-Tag „address“. Es wird zum Beispiel der Vorname von einem span-Tag umschlossen. Und dieses span-Tag bekommt die Klasse „given-name“. Beim Nachnamen dann das gleiche mit der Klasse „family-name“.
Ein Programm, dass sich die so ausgezeichnete Seite anschaut, kann anhand dieser Klassen erkennen, welches der Vor- und welches der Nachname ist und diese Daten dann korrekt zum Beispiel in ein Adressbuch übernehmen. Es ist auch möglich sich zu dem Adressbuch-Eintrag die Internet-Adresse zu merken. Das Adressbuch kann dann regelmäßig nachschauen, ob sich die Daten vielleicht geändert haben.
Es gibt nun schon Microformats für ganz verschiedene Bereiche. Am bekanntesten sind wohl hCard für Kontaktdaten und hCalendar für Termine. Daneben wird noch über ca. 50 weitere Formate diskutiert: Geocoordinaten, Zitate, Familienverhältnisse …
Nun gibt es bisher wenig Programme, die etwas mit diesen Daten anfangen können. In den Standard-Browsern sind solche Funktionen noch gar nicht enthalten – Zum Beispiel im FireFox 3 sollen aber Microformate unterstützt werden. Es handelt sich dabei also noch ein wenig um Zukunftsmusik. Trotzdem erfährt diese Initiative erstaunlichen Zuspruch.
Erstaunlich ist vor allem, dass es sich um eine Community-Initiative handelt. Microformats sind keine offizielle W3C-Spezifikation. Das W3C hat sich in die Diskussion noch überhaupt nicht eingemischt – Sehr zum Unbehagen einer W3C Mitarbeiter.
Das Problem ist vermutlich, dass das W3C schon wesentlich weitergehende Lösungen zum semantischen Web spezifiziert hat. Diese sind aber offenbar zu kompliziert und gehen den Microformats-Jüngern offenbar zu weit. Microformats sind ein pragmatischer Ansatz, um spezielle Anwendungsfälle einfach lösen zu können. Und dafür sind sie auf jeden Fall auch gut.
In seinem Blog beschreibt Sebastian Küpers aber auch „Die 5 Nachteile von Microformats“: Die kleine Semantik – Microformats gehen ein wenig an dem vorbei, was Semantik eigentlich erreichen will: Zusammenhänge herstellen. Es ist nur möglich zu sagen welche Art Daten man vor sich hat und welche zusammen gehören. Nicht aber, in welchem Zusammenhang sie stehen.
Die 80/20 Regel – Microformats sind nur für bestimmt Fälle (80%) leicht umzusetzen (20% Aufwand)
Mangelnde Skalierbarkeit – Für die anderen Fälle gibt es aber keine Lösung
Die Verknüpfung mit XHTML – Nach Sebastians Meinung ist es wohl ein Nachteil von xHTML allgemein, dass beim Parsen leichter zu Fehlern kommt. Im Gegensatz zum Parsen von normalem HTML ist der Browser hier nicht so großzügig.
Humans first, maschines second – Mit diesem Motto bleiben Microformats hinter den Möglichkeiten zurück, die das semantische Web bringen kann.
Ich möchte dieser Liste noch 2 Punkte hinzufügen:
1. Microformats sind nicht mehrsprachig. Bei Klassennamen mag das okay sein, wenn die Englisch sind – die sieht ja keiner. Telefonnummer aber zum Beispiel werden im sichtbaren Text als „work“ oder „home“ markiert. Das kann man dann natürlich per CSS wieder unsichtbar machen. Aber zum einen würden Screenreader das dann trotzdem vorlesen, zum anderen wäre das Overkill. Womit ich zu meinem 2. Punkt kommen:
2. Mircoformats blähen das Markup mehr als nötig auf. Dadurch, dass die Erfinder der Microformats darauf bestehen, dass nur auf bestehendes xHTML zurückgegriffen werden soll, entstehen einige umständliche Konstrukte, die das Markup weiter aufblähen, als es nötig sein sollte.
Mich erinnert dieser Ansatz an die Zeit, als Webdesigner HTML-Tabellen mißbraucht haben, um Inhalte auf Internetseiten zu positionieren. Dafür waren sie nie gedacht.
Sebastians Fazit ist allerdings, und da möchte ich mich an diesem Punkt anschließen, dass Microformate trotzdem toll sind und weiterhin gefördert und implementiert werden sollten!
Microformats bringen die Menschen dazu, sich mit dem semantischen Web auseinanderzusetzen. Für einfache Dinge, wie Kontaktdaten und Termine sind sie auch eine Möglichkeit den Benutzern einen zusätzlichen Nutzen zu bieten. Sie sind einfach pragmatisch. Sie werden aber auch den Einen oder Anderen vor Probleme stellen, die mit Microformats nicht zu lösen sind und schaffen damit mehr Aufmerksamkeit für die Spezifikationen des W3C.
Sebastian Küpers hat in seinem PodCast ein Interview mit einem Experten für Computersemantik angekündigt, auf das ich schon sehr gespannt bin.
Links:
microformats.org
Microformats – Ein Einleitung
Microformats für Anfänger
Microformats für Fortgeschrittene
GiN: Microformats
Technikwürze: Microformats
Schreibe einen Kommentar