startseite | archiv | bilder | bookmarks | short urls | rss reader |

Micro­for­matsYet ano­ther Hype?

 
Da sprießt doch was!

Montag, 29. Januar 2007

Eines der Buz­zwords des letz­ten Jah­res ist „Micro­for­mats“. Micro­for­mats sind ein Ansatz mit den Mit­teln der ver­brei­te­ten Stan­dards Inhalte im Inter­net mit seman­ti­schen Meta­da­ten anzu­rei­chern. Aber was steckt dahin­ter? Und sind Micro­for­mats dafür geeignet?

Die Basis von Inter­net­sei­ten ist HTML, einer „text­ba­sierte Auszeichnungssprache“ — Das heisst, dass ver­schie­dene Ele­mente eines Tex­tes (Absätze, Über­schrif­ten ver­schie­de­ner Ebe­nen, Bil­der, Links, ..) geson­dert mar­kiert wer­den. Die Inhalte wer­den damit zur Zeit bes­ten­falls struk­tu­riert.

Wie diese Ele­mente aus­se­hen, wird per CSS fest­ge­legt. So gehört zu einer HTML–Datei auch immer eine CSS–Datei. Hier ste­hen Schrift­grö­ßen und Far­ben, wel­che Inhalte wo ange­zeigt wer­den sol­len usw.

Wel­chen Sinn ein Doku­ment hat, kann nur der mensch­li­che Betrach­ter erken­nen: Han­delt es sich um einen Blog­ein­trag oder ein Forum, ist das eine Adresse oder ein Bild in einer Gale­rie? Ein Com­pu­ter kann soet­was nicht so ein­fach erken­nen — Die Seman­tik nun im All­ge­mei­nen befasst sich mit Sinn und Bedeu­tung von Spra­che bezie­hungs­weise sprach­li­chen Zei­chen. Und es gibt ver­schie­dene Ansätze den Com­pu­ter das Erken­nen von seman­ti­schen Zusam­men­hän­gen in Inter­net­do­ku­men­ten zu erleich­tern. Ein Ansatz sind Micro­for­mats.

Micro­for­mats basie­ren auf einer Community-​Initiative — Ein paar HTML–Begeis­terte haben sich Gedan­ken dazu gemacht, wie man mit den beste­hen­den Mit­teln von HTML ein wenig Seman­tik ins Web brin­gen kann. Sie sind auf die Idee gekom­men, dass das ein­fach dadurch geht, indem sie bestimmte Klas­sen fest­le­gen, mit denen Inhalte aus­ge­zeich­net wer­den.

In der Pra­xis sieht das so aus, dass man nicht nur mar­kiert, dass der fol­gende Absatz eine Adresse ist — dafür gibt es näm­lich das nati­ves HTML–Tag „address“. Es wird zum Bei­spiel der Vor­name von einem span-​Tag umschlos­sen. Und die­ses span-​Tag bekommt die Klasse „given-​name“. Beim Nach­na­men dann das glei­che mit der Klasse „family-​name“.

Ein Pro­gramm, dass sich die so aus­ge­zeich­nete Seite anschaut, kann anhand die­ser Klas­sen erken­nen, wel­ches der Vor– und wel­ches der Nach­name ist und diese Daten dann kor­rekt zum Bei­spiel in ein Adress­buch über­neh­men. Es ist auch mög­lich sich zu dem Adressbuch-​Eintrag die Internet-​Adresse zu mer­ken. Das Adress­buch kann dann regel­mä­ßig nach­schauen, ob sich die Daten viel­leicht geän­dert haben.

Es gibt nun schon Micro­for­mats für ganz ver­schie­dene Berei­che. Am bekann­tes­ten sind wohl hCard für Kon­takt­da­ten und hCa­len­dar für Ter­mine. Dane­ben wird noch über ca. 50 wei­tere For­mate dis­ku­tiert: Geo­co­or­di­na­ten, Zitate, Fami­li­en­ver­hält­nisse …

Nun gibt es bis­her wenig Pro­gramme, die etwas mit die­sen Daten anfan­gen kön­nen. In den Standard-​Browsern sind sol­che Funk­tio­nen noch gar nicht ent­hal­ten — Zum Bei­spiel im Fire­Fox 3 sol­len aber Micro­for­mate unter­stützt wer­den. Es han­delt sich dabei also noch ein wenig um Zukunfts­mu­sik. Trotz­dem erfährt diese Initia­tive erstaun­li­chen Zuspruch.

Erstaun­lich ist vor allem, dass es sich um eine Community-​Initiative han­delt. Micro­for­mats sind keine offi­zi­elle W3C–Spe­zi­fi­ka­tion. Das W3C hat sich in die Dis­kus­sion noch über­haupt nicht ein­ge­mischt — Sehr zum Unbe­ha­gen einer W3C Mit­ar­bei­ter.

Das Pro­blem ist ver­mut­lich, dass das W3C schon wesent­lich wei­ter­ge­hende Lösun­gen zum seman­ti­schen Web spe­zi­fi­ziert hat. Diese sind aber offen­bar zu kom­pli­ziert und gehen den Microformats-​Jüngern offen­bar zu weit. Micro­for­mats sind ein prag­ma­ti­scher Ansatz, um spe­zi­elle Anwen­dungs­fälle ein­fach lösen zu kön­nen. Und dafür sind sie auf jeden Fall auch gut.

In sei­nem Blog beschreibt Sebas­tian Küpers aber auch „Die 5 Nach­teile von Micro­for­mats“: Die kleine Seman­tik — Micro­for­mats gehen ein wenig an dem vor­bei, was Seman­tik eigent­lich errei­chen will: Zusam­men­hänge her­stel­len. Es ist nur mög­lich zu sagen wel­che Art Daten man vor sich hat und wel­che zusam­men gehö­ren. Nicht aber, in wel­chem Zusam­men­hang sie ste­hen.

Die 8020 Regel — Micro­for­mats sind nur für bestimmt Fälle (80%) leicht umzu­set­zen (20% Auf­wand)

Man­gelnde Ska­lier­bar­keit — Für die ande­ren Fälle gibt es aber keine Lösung

Die Ver­knüp­fung mit XHTML — Nach Sebas­ti­ans Mei­nung ist es wohl ein Nach­teil von xHTML all­ge­mein, dass beim Par­sen leich­ter zu Feh­lern kommt. Im Gegen­satz zum Par­sen von nor­ma­lem HTML ist der Brow­ser hier nicht so groß­zü­gig.

Humans first, mas­chi­nes second — Mit die­sem Motto blei­ben Micro­for­mats hin­ter den Mög­lich­kei­ten zurück, die das seman­ti­sche Web brin­gen kann.

Ich möchte die­ser Liste noch 2 Punkte hin­zu­fü­gen:
1. Micro­for­mats sind nicht mehr­spra­chig. Bei Klas­sen­na­men mag das okay sein, wenn die Eng­lisch sind — die sieht ja kei­ner. Tele­fon­num­mer aber zum Bei­spiel wer­den im sicht­ba­ren Text als „work“ oder „home“ mar­kiert. Das kann man dann natür­lich per CSS wie­der unsicht­bar machen. Aber zum einen wür­den Screen­re­a­der das dann trotz­dem vor­le­sen, zum ande­ren wäre das Over­kill. Womit ich zu mei­nem 2. Punkt kom­men:
2. Mir­co­for­mats blä­hen das Markup mehr als nötig auf. Dadurch, dass die Erfin­der der Micro­for­mats dar­auf beste­hen, dass nur auf beste­hen­des xHTML zurück­ge­grif­fen wer­den soll, ent­ste­hen einige umständ­li­che Kon­strukte, die das Markup wei­ter auf­blä­hen, als es nötig sein sollte.

Mich erin­nert die­ser Ansatz an die Zeit, als Web­de­si­gner HTML–Tabel­len miß­braucht haben, um Inhalte auf Inter­net­sei­ten zu posi­tio­nie­ren. Dafür waren sie nie gedacht.

Sebas­ti­ans Fazit ist aller­dings, und da möchte ich mich an die­sem Punkt anschlie­ßen, dass Micro­for­mate trotz­dem toll sind und wei­ter­hin geför­dert und imple­men­tiert wer­den soll­ten!

Micro­for­mats brin­gen die Men­schen dazu, sich mit dem seman­ti­schen Web aus­ein­an­der­zu­set­zen. Für ein­fa­che Dinge, wie Kon­takt­da­ten und Ter­mine sind sie auch eine Mög­lich­keit den Benut­zern einen zusätz­li­chen Nut­zen zu bie­ten. Sie sind ein­fach prag­ma­tisch. Sie wer­den aber auch den Einen oder Ande­ren vor Pro­bleme stel­len, die mit Micro­for­mats nicht zu lösen sind und schaf­fen damit mehr Auf­merk­sam­keit für die Spe­zi­fi­ka­tio­nen des W3C.

Sebas­tian Küpers hat in sei­nem Pod­Cast ein Inter­view mit einem Exper­ten für Com­pu­ter­se­man­tik ange­kün­digt, auf das ich schon sehr gespannt bin.

Links:
micro​for​mats​.org
Micro­for­mats — Ein Ein­lei­tung
Micro­for­mats für Anfän­ger
Micro­for­mats für Fort­ge­schrit­tene
GiN: Micro­for­mats
Tech­nik­würze: Micro­for­mats

Kommentare

  • Microformats

    gravatar
    Pfefferle

    08. Aug 2007

    Hallo Stef­fen,

    der W3C hat Micro­for­mats schon eine ganze Weile wahr­ge­nom­men…

    http://​www​.w3​.org/​2​0​0​6​/​0​3​/​hcard

    und GRDDL ist ja prak­tisch nur für sol­che For­mate wie Micro­for­mats ent­wi­ckelt wor­den:

    http://​www​.w3​.org/​2​0​0​4​/​0​1​/​r​d​x​h​/spec

    ornament

Einen Kommentar hinzufügen





Trackback

Trackback URL für diesen Artikel

  • Twitter / Facebook
  • Twitter
  • Facebook
  • RSS
  • RSS

 

Werbefreies Blog

Steffen Voß | Steinstraße 5 | 24118 Kiel
Tel.: +49 431 88 88 683
E-Mail: kontakt@kaffeeringe.de
Skype: steffenvoss
Jabber: kaffeeringe@jabber.ccc.de
ICQ: 447639251