Panda hin und Panda her. Kaum ein anderes possierliches Tierchen hat den SEO-Markt in letzter Zeit so aufgerollt. Die Rede ist inzwischen von “inhatlicher Qualität” einer Website oder sagen wir mal pauschal deren Qualität für den Nutzer. Die Messbarkeit der Qualität zweifle ich allerdings doch etwas an. Sicherlich kann man Absprungraten messen, wobei man diese eigentlich noch ins Verhältnis zum Seitenzweck und Nutzer setzen muss. Ein Beispiel:
Der Suchende landet bei Wikipedia; findet genau das was er sucht; holt sich die Information und kehrt wieder zur Google-Suche zurück, da er nun das nächste Thema sucht. Zwar erfolgt der Bounce recht schnell, aber auch nur weil der Nutzer genau das gefunden hat wonach er suchte.
Noch eines:
Wohl die meisten User haben Google als Startseite eingerichtet, d.h. jedes neue Fenster und jeder neue Tab rufen Google auf und sind damit ein Bounce. Kann wohl auch nicht sein.
Ad Hoc würden mit noch so 10 + X Scenarien einfallen, die zwar für den User idealst laufen aber für Google ein Bounce sind. Was bleibt Google anderes übrig als den Seiteninhalt zu analysien. Zwei Methoden stechen heraus:
DC Erkennung
Google ist was DC angeht sehr gut, allerdings wurde Google inzwischen auch von der Masse eingeholt. Es gibt wohl nahezu keine gebräuchliche Sprache mehr in der DC nicht schon alleine durch die Vielfalt der Nutzer entsteht. Bleiben wir bei Deutsch und Englisch. Die Wahrscheinlichkeit, dass zwei oder mehr Menschen Texte schreiben die sich gleichen steigt mit jedem Dokument im Netz. So scheint es zumindest mir, dass Google hier den Gashahn etwas zurückgenommen hat.
inhaltliche Analyse des Texte
In Zeiten von LSO und Co (bitte diesen Reim auf der Zunge zergehen lassen), hört es sich doch erstmal sinnvoll an den Inhalt bzw. die Brauchbarkeit eines Textes verstehen zu wollen. Nur leider ist das mathematisch nicht so einfach. Das ein oder andere Patent wurde auch schon geschrieben, aber anyway: wie sieht es denn jetzt aus? Gehen wir mal den Ansatz, dass man gerne das nutzt, was man glaubt schon zu können. Im Fall Google dürfte es sich dabei um den Übersetzer Translate handeln. Kaum ein anderes Google-Tool beschäftigt sich so tief mit Texten. Daraus ziehe ich den Schluß: je besser Translate um so eher versteht Google die Qualität eines Textes zu ermitteln. Dann machen wir doch mal eine einfache Übung und übersetzen:
Das Abendessen wurde vom Ober pünktlichst am Tisch serviert. Leider stieß er dabei den Suppenteller um und verbrühte sich den Knöchel.
ins Englische übersetzt von Google:
Dinner was served punctually at the top of the table. Unfortunately, he came across to the soup plate and scalded her ankle.
und zurück ins Deutsche:
Das Abendessen war pünktlich an der Spitze des Tisches serviert. Leider stieß er auf den Suppenteller und verbrüht sich den Knöchel.
Google hat uns beim Übersetzen gleich mal ein Subjekt geklaut und die Sache mit den Präpositionen bedarf auch noch etwas Übung.
FAZIT:
Es wird wohl noch viele Jahre brauchen bis eine Maschine in der Lage ist halbwegs den Sinn und Inhalt eines Textes zu verstehen. Genau so lustig wie die Übersetzung ist, genau so wird auch das Verständnis des Inhaltes sein.