Es ist einfach unglaublich, wo man überall Spam bekommen kann, wenn man eine Internetseite betreibt: Im Forum, in den Kommentaren – es gibt Spam-Benutzerregistrierungen und im Gästebuch gibt es ohnehin Spam. Eine Sache, die man dagegen tun kann (mal abgesehen von offline gehen) sind Captchas. Captchas werden verwendet, um zu entscheiden, ob das Gegenüber ein Mensch oder eine Maschine ist. Entweder muss der Benutzer eine Frage beantworten oder eine Buchstaben/Zahlen Kombination aus einem Bild erkennen und eingeben.
Der Nachteil von Captchas ist, dass sie nicht barrierefrei sind und zum Beispiel fehlsichtige Menschen ausschließen können. Darüberhinaus sind inzwischen Spam-Skripte in der Lage via OCR Captchas zu erkennen. So bleibt am Ende der Mensch ausgesperrt und die Maschine hat genug Zeit auch 100x zu probieren, ob sie nicht mal eine Kombination erkennt.
Aber wenn schon Captcha, dann jedenfalls sinnvoll: reCaptcha hat sich einen Dienst überlegt, der die Fähigkeit von Menschen, schwer lesbare Wörter zu erkennen, für eine gute Sache nutzt: Die Buchstaben-Kombinationen bei deren Captchs sind nicht zufällig, sondern stammen aus gescannten Büchern. Es sind Wörter, die die ORC-Software nicht erkennen konnte.
Aber wie weiß reCaptcha nun, ob man das richtige Wort eingegeben hat? Es gibt zwei Wörter: Eines ist bekannt, das andere nicht. Wird das bekannte Wort richtig eingegeben, gilt der Test als bestanden und reCaptcha nimmt an, dass auch das andere Wort korrekt ist. Durch mehrfaches Einblenden bei verschiedenen Benutzern, wird die Richtigkeit verifiziert.
Die Wörter stammen vom Internet Archiv, welches jedes Jahr 12.000 Bücher scannt. So ähnlich wie bei Seti@home oder Folding@home werden bei reCaptcha freie Ressourcen genutzt – in diesem Fall allerdings nicht technische Ressourcen sondern menschliche.
Ist es nicht beruhigend, dass es immer noch Dinge gibt, die der Mensch noch besser kann als der Computer?
Links:
reCaptcha
Captcha, Wikipedia
via Read/WriteWeb
Schreibe einen Kommentar