Rivva-Logo

Blog  ·  Über Rivva  ·  Impressum
 
 

Ich benötige mal alle hier Mitlesenden als Stimmungsbarometer:

Thorsten Gieseler hat mich heute noch einmal auf das Thema Duplicate Content gelenkt.

Es geht darum, dass Google keine doppelten Sachen in seinen Suchergebnissen haben möchte, sondern eine möglichst unterschiedliche Auswahl von Seiten. Dazu hat Google eine Technologie lizensiert, die doppelte Inhalte identifiziert und vor Anzeige der Suchergebnisse ausfiltert. Es geht also nicht um einen Rauswurf aus dem Index, auch nicht um eine Bestrafung im PageRank, sondern lediglich um die Vermeidung von Dubletten. Wobei Google bei der Frage Was ist Duplicate Content? gerade in Bezug auf Social-Media-Angebote relativ vage bleibt, leider.

Syndicate carefully

Nun, im Webmaster Help Center schreibt Google zum Thema Syndicate carefully, syndizierte Artikel sollten immer ihr Original verlinken, Google sei so in der Lage, die für den Nutzer passendsten Suchtreffer auszuwerfen:

"If you syndicate your content on other sites, Google will always show the version we think is most appropriate for users in each given search, which may or may not be the version you'd prefer. However, it is helpful to ensure that each site on which your content is syndicated includes a link back to your original article."

Weiter schreiben sie, man könne die syndizierenden Seiten auch bitten, die syndizierten Inhalte ins robots.txt Exclusion-File aufzunehmen und so vor den Crawlern der Suchmaschinen zu verbergen:

"You can also ask those who use your syndicated material to block the version on their sites with robots.txt."

Widersprüche

Da ich diese beiden Aussagen widersprüchlich fand, hab ich also nachgeschaut, was denn andere, viel größere Sites als Rivva so machen: Digg, StumbleUpon, reddit, YiGG, Webnews exkludieren nicht via robots.txt, Wikio und Blogscout schon. Als Unterscheidungskriterium sehe ich, dass Erstgenannte den Original-Content mit einem gewissen Mehrwert anreichern (Nutzerkommentare etc.), den sie dann in Werbeerträge ummünzen.

Mit Rivva hab ich mir u.a. das Ziel gesetzt, Artikel miteinander zu vernetzen, die nicht untereinander verlinkt sind. Die gesamte Entwicklung in Richtung verwandter Stories und Gruppierung ähnlicher Themen geht in diese Richtung. Wenn ich all die "hinteren" Seiten vor den Suchmaschinen wegsperre, verzichte ich auf 33% meines Traffics sowie auf eine mögliche spätere Monetarisierung des Service.

Rivva ist ohne die Blogs, die auf spannende Themen aufmerksam machen, jedoch keinen Penny wert (entwickelte Technologie mal ausgenommen). Ihr bestimmt das Bild von Rivva. Daher jetzt die Frage an Euch:

Was sollen wir machen?

Es geht um Eure Inhalte. Und nicht nur um Rivva, sondern prinzipiell um alle Social-News-Seiten, Aggregatoren, Planets usw.

In der Regel ist Google, wie gesagt, in der Lage, das Original vom Exzerpt zu unterscheiden. Ich hab zumindest nicht viele Gegenbeispiele gefunden und in allen solchen Fällen rangierte das entsprechende Blog in den Google-Ergebnissen ohnehin schon nicht weit vorn.

Bitte gebt mir ein Meinungsbild – ich möchte diese Entscheidung nicht über Eure Köpfe hinweg treffen.

Hier noch mal die drei schon eingestreuten Links zum Thema:

Die Diskussion ist eröffnet … (bitte weitersagen!)

 

Google nimmt die relvantere Seite. Hat Rivva einen höheren Pagerank als ich, wird Rivva angezeigt und mein Original ausgeblendet. Ja und.

Es geht darum Inhalte zu präsentieren. Außerdem bringen Rivva-Erwähungen den Miniblocks wie meinem mit Sicherheit Traffic, auch wenn ich zu meiner Schande gestehe da nie nachgesehen zu haben.

 

Hallo Namensvetter,

wie Du sicher weißt ist es schwierig hier verlässliche Aussagen zu treffen, da sich ja (wie oben schon steht) Google teilweise sehr in Schweigen hüllt. Grundsätzlich ist DC (Duplicate Content) immer dann ein Problem wenn etwas 1:1 übereinstimmt. Bisher gab es meines Wissens primär dann Probleme (Strafen), wenn sich komplette Websites gleichen.

Was Jochen sagt stimmt natürlich - wobei hier Pagerank nicht mit dem grünen Balken gleichzusetzen ist. Ist Rivva aber (aus diversen Gründen) "stärker" bzw. ist die Unterseite von Rivva stärker als meine, dann wird Rivva wohl vor mir ranken. Entspricht diese Unterseite von Rivva nun 1:1 meiner Unterseite könnte es evtl. auch zu Abstrafungen führen. Ob Google hier bereits die Entstehungszeit der Seiten oder nur die Stärke der Seite mit einbezieht ist unklar.

Ich würde auf jeden Fall empfehlen a) die Inhalte zu kürzen - auch um den Leser zum jeweiligen Blog zu schicken b) Die jeweilge Unterseite mit weiteren Inhalten anzureichern (ähliche Beiträge, Kommentare, etc)

Digg, Yigg, GameBuzz und seine Clones kennen das Problem übrigens nicht, da sie i.d.R. keinen Text 1:1 übernehmen. Die User die hier News melden schreiben eigenen Text.

 

kenne das problem, da alle posts bei mir ccl sind - und teils ganze artikel übernommen werden von anderen (teils bei google höher gerankten) sites. gekürzte inhalte erschiene auch mir sinnvoller (ohne bei dieser frage technischer insider zu sein...)

 

In erster Linie sollen doch die Beiträge der Autoren und Rivva für den Leser gemacht sein und nicht für Google und co. Google versteht unter DC in der Regel eine 1:1-Kopie, wobei die Aussagen sehr schwammig sind. Trotzdem meine ich, dass man in erster Linie immer den Leser im Auge behalten soll, der soll und möchte den besten Artikel zum Suchbegriff finden.

Insofern denke ich, dass Rivva mit geändertem Content dienen sollte, zum Beispiel durch Erweiterungen im Vorfeld oder Ende des Artikels (Kommentare des Artikels, Diskussionen aus der Blogosphäre, etc.).

Ebenso ist die excerpt-Lösung sicher ein guter Ansatz und den Leser zum jeweiligen Artikel zu schicken. Das ist doch auch die Aufgabe, dachte ich jedenfalls, von Rivva.

 

Auch aus meiner Sicht stellt sich das Problem eher als keins da: Zum einen zeigt Rivva ohnehin nur eine gekürzte Version des jeweiligen Beitrags, zum anderen ist dieser direkt mit selbigem verlinkt. Google wird sicherlich in der Lage sein, auf dieses Basis das "Orignal" zu identifizieren. Auf den meisten Blogs wird jeder Artikel ohnehin mehrfach dargestellt: Auf der Startseite, in den chronologischen Archiven, in den Tag/Kategorien Ansichten etc. Im Gegensatz dazu werden die Inhalte auf Rivva bereits in der jetzigen Form mit sinnvollem Content und Kontext angereichert.

 

Meines Wissens nach ist es für google auch entscheidend, wann etwas indiziert wird. Deshalb sind schon etliche Probleme mit Yigg aufgetreten, wenn man das automatische Wordpress-Plugin nutzt, weil Yigg als stärkere Seite viel früher indiziert wird. Vielleicht kannst du da ansetzen, dass du wichtige Artikel zeitverzögert einstellst. Wichtige Artikel sind ja nicht nur für 4 Stunden wichtig. Wenn du also den Blogs ein wenig mehr Zeit einräumst, als erstes indiziert zu werden, dann werden die hoffentlich kein Problem mit DC bekommen, wie es dann bei dir aussieht, weiß ich nicht, dass muss man sehen.

 

Ich habe durchaus Verständnis dafür, daß eine Einschränkung z.B. durch die robots.txt schwer fällt, weil sie Auswirkungen auf die zukünftige Monetarisierung haben wird. Nur: Rivva lebt von Fremdinhalten und deswegen sollte auch der Schutz der Originalbeiträge Vorrang haben. Was Google da im einzelnen macht weiß niemand so ganz genau und auch ich habe schon erlebt, daß in den Suchergebnissen ein von mir gesetzer Trackback auftauchte - mein Artikel jedoch nicht. Das sind schlecht nachzuvollziehende Einzelfälle, doch kann es (lt. Google) auch tatsächlich passieren, daß eine ganze Domain vom Index ausgeschlossen wird. Ist das tatsächlich einmal der Fall, spricht sich das schnell herum, hat Rivva eine schlechte PR, jede Menge Beschwerden und weniger Besucher.

Wer besucht Rivva regelmäßig, wer sind die Stammgäste? Ich denke, es werden Blogger sein. Und darauf sollte m.E. das Hauptaugenmerk liegen.

Die einzig richtige Lösung lautet "noindex,follow" für alle Artikel. Denn wenn Google richtig erkannt hat, welches der Originalbeitrag ist, wird auch nur dieser im Index bleiben. Diese Lösung kommt den Bloggern (Stammlesern) entgegen und entspricht den Richtlinien von Google.

Beste Grüße Thorsten

 

Mir persönlich reicht es so, dass eben nur der Anfang des Artikels dargestellt wird und es dazu einen Link auf das Original gibt (follow natürlich). Problematisch finde ich es erst dann, wenn mindestens eines dieser beiden Elemente wegfällt. Also voller Artikel (Urheberrecht) oder nofollow-Link (mit fremdem Inhalt schmücken und nicht mal dafür danken). Der Link hilft ja auch gerade dabei, dem Original eine höhere Autorität zu geben als dem Teaser auf Rivva (oder wo auch immer).

 

So wie es jetzt ist, sollte der Link von Rivva eher positiv sein, da er aus einem passenden redaktionellen Umfeld stammt. Ich kann mir nicht vorstellen, dass diese Unterseiten für Google duplicate content sind. Denn Zitieren und Verlinken sollte ja wohl gerade noch erlaubt sein...

Gut möglich natürlich, dass die Rivva-Übersichtsseite zum Thema gelegentlich einmal vor den einzelnen Blogbeiträgen zu finden ist. Aber das ist doch egal, solange ich wiederum auf dieser Seite verlinkt bin. Vielleicht landet auf diese Weise manches Blog einmal indirekt über Rivva bei Google ganz vorn, das sonst nie so weit vorn zu finden wäre.

Kurzum sehe ich persönlich gar nicht das Problem. Ich sehe eher eine Menge Vorteile gerade für kleinere Blogs.

 

So wie Rivva momentan gestrickt ist (nur Auszug, Diskussion), dürfte es doch eigentlich kein Problem mit Duplicate Content geben. Wie Oliver angemerkt hat, sollte das Blogs selbst mehr beschäftigen.

 

Die "Abstrafung" durch Google bei doppeltem Inhalt geht mir grad mal am A... vorbei. Meine Seiten gibt es sowieso doppelt: Einmal als html 4.01 Version, und einmal mit identischem Inhalt als xhtml 1.1 Version. Wenn Google meint, das bestrafen zu müssen, von mir aus. Was die Verlinkung der Artikel hier bei Rivva angeht: Excerpt mit Link zum Original wäre gut. Ebenso Mehrwert, vor Allem in Form von Links zu ähnlichen Beiträgen anderer Domains. Damit dürfte das Doublettenproblem ziemlich vom Tisch sein. Die Links zu den Originalen sollten aber nicht mit nofollow gesetzt werden, denn der Sinn der Rivva Seiten ist ja grade, auf die Originale zu verweisen. Was man machen könnte, aber nicht unbeding muß, ist, die Rivva-Seiten mit noindex vor Google zu schützen. Dann werden die Rivva Seiten nicht indiziert, aber die Links zu den Originalen werden trotzdem verfolgt, und diese ggf. indiziert.

 

ja aber ist trotzdem blöd. bei mir hatte jmd inhalte von meinem artikelverzeichnis kopiert und ins netz gejagt. dafür wird man selbst dann abgestraft und in den listings weiter hinten eingereit obwohl man nicht mal etwas dafür kann.

 
Kommentare geschlossen.