Duplicate Content – unnütz für den User, schlecht fürs Ranking

Es ist schlecht für das SEO und Ballast für Ihr Ranking: Gemeint ist Duplicate Content (zu Deutsch „doppelter Inhalt“). Das sind identische oder sehr ähnliche Inhalte, die auf einer oder mehrere Webseiten zu finden sind – oder nicht mehr zu finden sind, weil Google diese abstraft. Sie bieten dem Nutzer keinerlei Mehrwert.

Das genaue Gegenteil ist Unique Content (zu Deutsch „einzigartiger Inhalt“). Diese Inhalte sind auf keiner anderen Webseite vorhanden, demzufolge einzigartig, individuell und bieten einen tatsächlichen Nutzen. Es ist Grund-Voraussetzung für Webseiten, um ihre Indexierung zu gewährleisten, ein gutes Ranking zu erreichen und Suchmaschinenoptimierung nicht verpuffen zu lassen. Wie Sie Duplicate Content vermeiden, erfahren Sie hier.

Ab wann es Duplicate Content ist

Wann genau Inhalte zu Duplicate Content werden, ist reine Spekulation. Es gibt keine genaue Prozentangabe, ab der Google Dopplungen erkennt. Die Frage, die viel leichter zu beantworten ist, ab wann es kein Duplicate Content ist: Wenn er zu 100% einzigartig ist – das ist sicher. Aber so einfach ist es dann doch nicht.

Duplicate Content entsteht oft nicht einmal absichtlich, ausgenommen natürlich es handelt sich um simplen Content-Diebstahl. Diese Dopplungen entstehen sehr häufig intern auf der eigenen Domain, statt extern auf fremden Webseiten.

Interner Duplicate Content

Der interne Duplicate Content ist innerhalb der eigenen Webseite zu finden. Eine schlechte Strukturierung der eigenen Domain und fehlerhafte interne Verlinkungen sind meistens der Auslöser dafür.

Doppelte Inhalte ist vor allem dann vermeidbar, wenn Inhalte einfach mehrmals in verschiedenen Kategorien ihrer Webseite verwendet werden. Beispielsweise als Eintrag auf der Startseite, in Ihrem Newsfeed und gleichzeitig im Blog.

Besonders Online-Shops haben in diesem Bereich mit internen doppelten Inhalten zu kämpfen und sind das Resultat eines fehlerbehafteten Content Management Systems. Weitere Quellen doppelter Inhalte sind:

Tag-, Filter- und Suchergebnisseiten
Kategorie-Seiten
Produkteinzelseiten, die in unterschiedlichen Kategorien zu finden sind
Pagination, wenn der Verweis auf die Komplettansicht fehlt

Kein Duplicate Content ist es, wenn Sie die gleichen Inhalte in unterschiedlichen Sprachen anbieten oder kleinere Textpassagen zitieren – solange das im Quellcode mit „hreflang“ bzw. „blockquote“ gekennzeichnet wird.

Haben Sie für Deutschland, Österreich und Schweiz jeweils eigene Seiten mit denselben Inhalten, sollten Sie hier ebenfalls nicht die „hreflang“-Kennzeichnung vergessen.

Externer Duplicate Content

Das noch größere Problem ist externer Duplicate Content, vor allem wenn dieser im Gegensatz zu den meisten Fällen nicht in der eigenen Verantwortung liegt. Content-Diebstahl ist nicht nur für Ihre Google-Positionierung, sondern auch rein rechtlich gesehen problematisch.

Google wird Ihre Inhalte bereits als externen Duplicate Content bewerten, sobald diese unabsichtlich unter verschiedenen Domains und Subdomains zu finden sind: Zum Beispiel unter „https://“ oder „http://“, mit oder ohne „www“.

Was ist nun die relevante Seite? Google jedenfalls kann sich nicht entscheiden, sodass bei beiden Webseiten kein gutes Ranking erreicht wird. Weitere typische Fälle externen doppelten Inhalts sind:

Unveränderte Artikelbeschreibungen von Herstellerseiten
Inhalte durch das RSS-Feed
Weiterverbreitung unveränderter Pressemitteilungen

Sonderfall Near Duplicate Content

Einen besonderen Fall stellen noch Inhalte dar, die doppelten Inhalten sehr nahe kommen. Near Duplicate Content sind Inhalte, die beim Kopieren leicht abgeändert wurden.

Hierzu zählen auch Inhalte, die unverändert übernommen wurden, sich aber im Boilerplate Content (Navigations-Menü, Impressum, etc.) unterscheiden. Auch sich oft wiederholende Textbausteine und Teaser können von der Suchmaschine als Duplicate Content erkannt werden und fallen in diese Kategorie.

Wie Google Duplicate Content erkennt

Wie erkennt Google Duplicate Content? Wie wird der rechtmäßige Urheber erkannt? Wie erkennt die KI Content-Diebstahl?

Googles Bot crawlt alle auffindbaren Domains und sucht dabei nach ähnlichen oder kopierten Textstellen. Welche Inhalte für die Nutzer am relevantesten und damit kein Duplicate Content sind, entscheidet die Suchmaschine anhand wichtiger Faktoren. Diese sind:

Das Alter,
Die Qualität,
Die Relevanz des Contents.

Der Google-Konzern lässt sich zwar nicht in die Karten schauen, inzwischen geht die Mehrzahl an SEO-Spezialisten dennoch davon aus, dass ausschließlich der Zeitpunkt der Indexierung des Contents maßgeblich für die Bestimmung dessen Alters ist. Gerade bei neueren Websites kann das hinsichtlich doppelter Inhalte zu Problemen führen.

Führen viele externe Links auf eine Webseite, ist der Googlebot häufiger bei diesen zu Besuch. Sowas kann Ihnen also viel Ärger bereiten, wenn plötzlich die Fälschung als Original erkannt wird – nur weil der Webcrawler der Meinung war, eine andere Seite als Erstes besuchen zu müssen.

Sie können dieses Problem ganz einfach umgehen, indem Sie mit dem Teilen Ihrer Inhalte erst dann beginnen, wenn der Content indexiert wurde.

Googles Problem mit Duplicate Content

Selbst Googles Ressourcen sind begrenzt. Die KI geht davon aus, dass Duplicate Content keinen Mehrwert für den Nutzer liefert. Nach Feststellung vieler doppelter Inhalte auf einer Domain spart sich der Webcrawler die vollständige Indexierung dieser Webseiten.

Falls die Inhalte doch noch indexiert werden, ist für Google im Falle doppelter Inhalte nicht klar, welche der Unterseiten auf der gleichen Domain relevanter sind. Diese Seiten stehen daher in gegenseitiger Konkurrenz, wodurch es zur Keyword-Kannibalisierung kommt.

Das ist insofern ungewöhnlich, weil das sonst nur bei gleichem Keyword-Fokus mehrerer Ihrer Seiten passieren würde. Duplicate Content hat also den gleichen Effekt wie eine schlechte Optimierung der Keywords.

Damit es zu konkreten Gegenmaßnahmen kommt, muss noch einiges mehr passieren. Nur in den allerseltensten Fällen wird vom Googlebot eine böswillige Absicht hinter Duplicate Content vermutet – was so ja auch zutrifft. Trotzdem hat die KI kein Interesse daran, unnötige Informationen über doppelte Inhalte zu sammeln, die dem User keinen Nutzen bringt.

Wann Google zu Strafen greift

Interner Duplicate Content hat viele Nachteile, die hauptsächlich auf Probleme bei der Indexierung zurückzuführen sind. Diese sorgen vor allem für Schwankungen im Sichtbarkeitsindex und Ranking der betroffenen Seiten.

Richtig haarig dagegen kann es bei externem Duplicate Content werden. Wenn es sich um tatsächlichen Content-Diebstahl handelt, droht eine richtige Abstrafung seitens Google. Die entsprechenden Domains kommen auf die Blacklist und finden sich dort in guter Gesellschaft von Scraper Sites, Content Spinning und Brückenseiten wieder.

Was gegen Duplicate Content unternommen werden kann

Fahren Sie von Anfang an eine gute Content-Strategie, richten diese stets auf einzigartige Inhalte aus, kommt es nur selten zu diesen Problemen. Duplicate Content entsteht zumeist nur bei einer Vernachlässigung von SEO.

Sollten Sie bereits eine Domain besitzen, die prallgefüllt mit Content ist, ist eine regelmäßige Überprüfung auf doppelte Inhalte zu empfehlen.

Technisches SEO

Wenn Sie Duplicate Content verhindern möchten, kommen Sie an technischen Optimierungen ihrer Webseite nicht vorbei. So können Sie interne Fehler aufspüren, die zu doppelten Inhalten geführt haben. Es gibt fünf wesentliche Möglichkeiten, die so in den Google-Richtlinien vorzufinden sind. Das sind:

URL-Struktur:

Die unterschiedlichen Inhalte sollten jeweils nur unter einer URL auffindbar sein. Eine Strukturierung nach diesem Schema gelingt Ihnen am besten dann, wenn der Content thematisch eindeutig ist. Ähnliche Inhalte sollten demnach auf einer Seite zusammengefasst werden.

Canonical Tag:

Canonical Tags signalisieren Google, dass die darin verlinkte Seite das Original ist und die Quelle der gerade . Nicht nur werden dann doppelte Inhalte vom Crawler nicht als solche behandelt. Sondern auch die Eigenschaften werden auf das Original übertragen.

link rel=“canonical“ href=”https://beispiel-xy.de/unterseite.html”

Diesen Tag setzen Sie im Quellcode Ihrer Seite in eckigen Klammern, um in der Kopie auf das Original zu verweisen.

Robots Meta Tag:

Um den Googlebot daran zu hindern, doppelte Inhalte auf ihrer Seite auszuwerten, können Sie im Header-Abschnitt des Quellcodes einen weiteren Tag (in eckigen Klammern) hinterlassen.

meta name=“robots“ content=“noindex,follow“

Dieser Robots-Meta-Tag sendet mit den Befehlen noindex und follow Signale an den Crawler, dass er die entsprechende Seite nicht indexieren soll. Den Verlinkungen auf der Seite soll er aber weiterhin folgen.

301-Weiterleitungen:

Erreichen Nutzer mit unterschiedlichen URLs ihre Domain, können Sie mit der 301-Weiterleitung eine Bündelung aller Zugriffe auf die URL ihrer Wahl erreichen. Hierzu braucht es den Zugriff auf die .htaccess-Datei ihrer Webseite, die sie mit Hilfe von Modifikationen umschreiben können. Der Eintrag, mit dem dann die Domain ohne die Eingabe von www auf die richtige Domain mit www umleitet, lautet dann:

RewriteEngine On

RewriteCond %{HTTP_HOST} ^beispiel-xy.de

RewriteRule (.*) http://www.beispiel-xy.de/$1 [R=301,L]

Hreflang Tag:

Wie bereits erwähnt, ist die Kennzeichnung mittels hreflang überwiegend dann zur Vermeidung von Duplicate Content erforderlich, wenn verschiedene Versionen einer Webseite in Ländern mit gleicher Sprache angeboten werden. Ansonsten ist dieser Befehl wichtig, damit die richtigen Lokalisierungen in den jeweiligen Ländern angezeigt werden.

link rel=“alternate“ href=“/beispiel.de/seite.html“ hreflang=“de-CH“ /

Damit findet der Nutzer die Domain in seiner Landessprache. In diesem Fall sind es die Schweizer, die Ihre Webseite auf Deutsch finden würden.

Unique Content

Es ist die einfachste Lösung, Duplicate Content aus dem Weg zu gehen. Unique Content ist genau auf die Suchintention des Nutzers ausgelegt, bietet ihm einen einmaligen Mehrwert und ist so noch nicht vorhanden. Wer den Usern das größte Expertenwissen zur Schau stellt, hat beste Chancen auf ein gutes Ranking.

Für Unique Content brauchen Sie ihren ganz eigenen Schreibstil und nur einen Funken Kreativität. Schreiben Sie einen Text zu einem bestimmten Thema, nutzen Sie nicht nur eine Quelle. Das verleitet dazu, in gleiche Denkmuster zu fallen, ähnlich zu argumentieren und den Text identisch aufzubauen.

Die Recherche für ihren Content findet also bestenfalls nicht nur Online statt, sondern genauso Offline. Sie können Fachbücher verwenden, mit denen sie das Expertenwissen, das sie mit Ihren Inhalten ansammeln wollen, gegenüber der Konkurrenz ausweiten. Schreiben Sie aus der Sicht des Users und sammeln somit alles Wissenswerte rund um die Fragen und Probleme, die ihn beschäftigen.

Tools für (bzw. gegen) Duplicate Content

Damit Ihre Domain nicht doch unabsichtlich ein Hort doppelter Inhalte wird, gibt es hierfür eigens entwickelte Tools. Bei der internen Überprüfung der Webseite ist Siteliner (Link: http://www.siteliner.com/) behilflich. Nach der Analyse sehen Sie anhand genauer Prozentangaben, wie viele doppelt vertretene Inhalte auf Ihrer Seite sind – wie auch der Anteil an einzigartigen Inhalten.

Das Tool ist bei der Analyse von insgesamt 250 Seiten in 30 Tagen kostenlos – wollen Sie mehr als diese Kapazität nutzen, werden Kosten fällig.

Ähnlich hilfreich ist Copyscape (Link: https://www.copyscape.com/). Neben internem Content werden auch externe Seiten überprüft. Auf einen Blick finden Sie heraus, ob es Überschneidungen mit Inhalten anderer Webseiten gibt. Das ist insbesondere für Unternehmen hilfreich, die mehrere Domains unterhalten. Anhand der Auflistung finden Sie den doppelt verwendeten Content und gelangen mit wenigen Klicks selbst zu diesen Inhalten

Ist die Plagiatsprüfung Ihr Ziel, nutzen Sie das Tool von Webconfs (https://www.webconfs.com/seo-tools/similar-page-checker/). Wenn Sie bereits mit Copyscape identische Inhalte auf der Webseite eines anderen gefunden haben, können Sie im Anschluss mit diesem Tool die fragliche Seite mit ihrer Domain vergleichen. Das Ergebnis wird entweder Ihren Verdacht bestätigen oder dementieren. Ob Sie dann mit dem Besitzer der Webseite in Kontakt treten wollen, ist ausschließlich Ihre Entscheidung.

Fazit: Kundennutzen + gutes SEO = Einzigartiger Inhalt

Es ist das A und O guter Suchmaschinenoptimierung. Alleine die ständige Überprüfung ihrer Webseite sollte Duplicate Content dauerhaft verhindern. Sie werden bei sorgfältiger Arbeit, gutem SEO und dem immerwährenden Fokus auf den Mehrwert der Nutzer nie Gefahr laufen, doppelte Inhalte zu produzieren. Nur mit einzigartigen Inhalten wird ein gutes Ranking erreicht.