Dazed and confused

28. August 2007 – Ich benötige mal alle hier Mitlesenden als Stimmungsbarometer:

Thorsten Gieseler hat mich heute noch einmal auf das Thema Duplicate Content gelenkt.

Es geht darum, dass Google keine doppelten Sachen in seinen Suchergebnissen haben möchte, sondern eine möglichst unterschiedliche Auswahl von Seiten. Dazu hat Google eine Technologie lizensiert, die doppelte Inhalte identifiziert und vor Anzeige der Suchergebnisse ausfiltert. Es geht also nicht um einen Rauswurf aus dem Index, auch nicht um eine Bestrafung im PageRank, sondern lediglich um die Vermeidung von Dubletten. Wobei Google bei der Frage Was ist Duplicate Content? gerade in Bezug auf Social-Media-Angebote relativ vage bleibt, leider.

Syndicate carefully

Nun, im Webmaster Help Center schreibt Google zum Thema Syndicate carefully, syndizierte Artikel sollten immer ihr Original verlinken, Google sei so in der Lage, die für den Nutzer passendsten Suchtreffer auszuwerfen:

"If you syndicate your content on other sites, Google will always show the version we think is most appropriate for users in each given search, which may or may not be the version you'd prefer. However, it is helpful to ensure that each site on which your content is syndicated includes a link back to your original article."

Weiter schreiben sie, man könne die syndizierenden Seiten auch bitten, die syndizierten Inhalte ins robots.txt Exclusion-File aufzunehmen und so vor den Crawlern der Suchmaschinen zu verbergen:

"You can also ask those who use your syndicated material to block the version on their sites with robots.txt."

Widersprüche

Da ich diese beiden Aussagen widersprüchlich fand, hab ich also nachgeschaut, was denn andere, viel größere Sites als Rivva so machen: Digg, StumbleUpon, reddit, YiGG, Webnews exkludieren nicht via robots.txt, Wikio und Blogscout schon. Als Unterscheidungskriterium sehe ich, dass Erstgenannte den Original-Content mit einem gewissen Mehrwert anreichern (Nutzerkommentare etc.), den sie dann in Werbeerträge ummünzen.

Mit Rivva hab ich mir u.a. das Ziel gesetzt, Artikel miteinander zu vernetzen, die nicht untereinander verlinkt sind. Die gesamte Entwicklung in Richtung verwandter Stories und Gruppierung ähnlicher Themen geht in diese Richtung. Wenn ich all die "hinteren" Seiten vor den Suchmaschinen wegsperre, verzichte ich auf 33% meines Traffics sowie auf eine mögliche spätere Monetarisierung des Service.

Rivva ist ohne die Blogs, die auf spannende Themen aufmerksam machen, jedoch keinen Penny wert (entwickelte Technologie mal ausgenommen). Ihr bestimmt das Bild von Rivva. Daher jetzt die Frage an Euch:

Was sollen wir machen?

Es geht um Eure Inhalte. Und nicht nur um Rivva, sondern prinzipiell um alle Social-News-Seiten, Aggregatoren, Planets usw.

In der Regel ist Google, wie gesagt, in der Lage, das Original vom Exzerpt zu unterscheiden. Ich hab zumindest nicht viele Gegenbeispiele gefunden und in allen solchen Fällen rangierte das entsprechende Blog in den Google-Ergebnissen ohnehin schon nicht weit vorn.

Bitte gebt mir ein Meinungsbild – ich möchte diese Entscheidung nicht über Eure Köpfe hinweg treffen.

Hier noch mal die drei schon eingestreuten Links zum Thema:

Die Diskussion ist eröffnet … (bitte weitersagen!)