Google, um gegen Spam zurückzuschlagen
Dies ist ein Gastbeitrag von Lior Levin.
Der größte Spam-Kämpfer von Google, Matt Cutts, hat kürzlich einen ausführlichen Blog-Eintrag über den Zustand von Googles Kampf mit Spammern veröffentlicht.
In der Post sagte Cutts, dass Spam im Google-Index zwar weniger als halb so hoch war wie vor fünf Jahren, dass Spam in den letzten Monaten jedoch im Google-Index angestiegen ist und bei bestimmten Suchanfragen deutlicher geworden ist.
Laut Cutts ist diese Änderung nicht nur auf die Tatsache zurückzuführen, dass es mehr Spammer als jemals versucht, ihren Weg zu einem höheren Suchmaschinen-Ranking zu betrügen, sondern weil Google kürzlich Caffeine-Update hat die Suchmaschine mehr Inhalt als je zuvor indizieren, einschließlich Spam.
Er skizzierte jedoch Googles Plan, diesen Aufwärtstrend zu bekämpfen und zu verhindern, dass er zu einem ernsteren Problem wird. Im Einzelnen skizzierte er drei Änderungen an Google, von denen er hofft, dass sie die Qualität der Google-Ergebnisse verbessern und das Sucherlebnis für alle verbessern werden.
Die erste Änderung, die Google kürzlich gestartet hat, richtet sich an Spammer selbst und ist ein " neugestalteter Klassifikator auf Dokumentebene ", der Spam-Inhalte besser auf einer einzelnen Seite erkennt. Dies beinhaltet Dinge wie wiederholte Wörter im Text sowie bestimmte Arten von Kommentaren.
Die zweite Verbesserung, die derzeit evaluiert wird, ist eine algorithmische Änderung, die auf Websites ausgerichtet ist, die Inhalte von anderen Seiten kopieren, normalerweise ohne Erlaubnis. Diese Websites kopieren häufig große Inhaltsblöcke mit sehr wenig Originalmaterial, aber sie ranken manchmal sehr gut, auch vor den Websites, die den Inhalt ursprünglich produziert haben.
Es ist jedoch die dritte und letzte Änderung, die am meisten diskutiert hat. Laut Cutts sucht Google nach Möglichkeiten, das Ranking von so genannten "Content-Farmen" oder Websites, die große Mengen an Content kostengünstig produzieren, zu reduzieren, und zwar in der Regel durch Vertragsarbeit, die oft von fragwürdiger Qualität ist. Dazu gehören Unternehmen wie Demand Media, die eHow, Livestrong sowie andere Standorte betreiben.
Laut Cutts hat Google im Jahr 2010 zwei Änderungen vorgenommen, um die Auswirkungen dieser Content-Farmen zu reduzieren, aber ich verstehe, dass die Leute noch stärkere Maßnahmen fordern. Die Websites wurden jedoch kontrovers diskutiert, da sie, obwohl sie oft qualitativ minderwertig sind, nicht als herkömmlicher Web-Spam betrachtet werden.
Angesichts der Tatsache, dass Demand Media gerade einen Börsengang hatte, der einen Wert von 1, 5 Milliarden US-Dollar aufwies, ist es leicht einzusehen, wie viel Wert das Unternehmen durch seinen Inhalt "Landwirtschaft" erzielen konnte. Was bleibt, ist, ob Google in der Lage sein wird, seine Prävalenz in den Ergebnissen zu ersticken, insbesondere bei Long-Tail-Suchanfragen, auf die es abzielt.
Es ist jedoch klar, dass Google selbst nach einem Jahrzehnt in der Branche immer noch mit Inhaltsqualitätsproblemen in seinem Index ringt und Schwierigkeiten hat, Spammer, Scraper und Content-Farmer in Schach zu halten.
Obwohl es in den letzten zehn Jahren definitiv Fortschritte gemacht hat, gibt es immer noch eine Menge zu tun, und Google macht sich daran.
Alles, was wir tun können, ist, sich zurückzulehnen, zuzusehen, was passiert, und zu hoffen, dass legitime, qualitativ hochwertige Websites nicht versehentlich in den Mix eingeholt werden.