Netzum Sorglos

Mit einem Canonical Tag das Problem doppelter Inhalte behandeln

Der Canonical Tag (auch Canonical URL oder Canonical Link genannt) ist eine Angabe im Quellcode einer Website, um im Falle von ähnlichen oder gleichen Seiten die Hauptseite anzugeben, die Suchmaschinen in den Index aufnehmen sollen.

Was ist ein Canonical Tag?

Technisch ist es ein Link-Element im <head> einer Website:
<link rel="canonical" href="https://www.netzum-sorglos.de/kontakt.html" />

Gibt es von Inhalten einer Website Duplikate, wird mit dem Tag festgelegt, welche Seite davon als Original und welche als Kopie zu verstehen ist. Der Canonical Tag ist also eine Angabe pro Unterseite, die Google und anderen Suchmaschinen mitteilt, welche URL der Hauptlink ist – also die Originalseite, die in den Index aufgenommen werden soll.

Das ist vor allem sinnvoll, bei

  • sehr ähnlichen Unterseiten zu einem Thema
  • mehreren URLs, die auf die gleiche Seite verweisen
    • zum Beispiel über http/https, mit und ohne "www" Subdomain, mehreren Schreibweisen der Domain
    • besonders bei CMS oder Shops kann es vorkommen, dass mehrere Wege zu einer Unterseite führen und unterschiedliche URLs erzeugt werden (zum Beispiel über Kategorie, über Schlagwort, über Breadcrumb)
    • mit dynamischen URLs eines CMS (wie /index.php?option=com_content&view=article&id=6 in Joomla!)
    • bei URLs mit Query Strings (zum Beispiel bei Besuchern, die über Google Ads Anzeigen aus die Seite kommen findet sich folgende Angabe: ?gclid=EAIaI...)

Der Canonical Link ist ein Weg, um das Problem mit doppelten Inhalten zu vermeiden. Bei doppeltem oder sehr ähnlichem Inhalt machen sich die Unterseiten ansonsten gegenseitig Konkurrenz und die Suchmaschine "weiß" nicht, welche Seite sie in den Index aufnehmen soll.

Außerdem verteilt sich die Linkkraft, wenn Sie für die Unterseiten Backlinks haben.

Ein weiterer Nachteil ist, dass die Suchmaschine die Seite auswählt — und möglicherweise diejenige nimmt, die man selbst nicht genommen hätte.

Im schlimmsten Fall kann doppelter Inhalt zum Ausschluss aus dem Index führen.

Das alles sind gute Gründe, doppelte Inhalte auf der Seite zu vermeiden beziehungsweise sie technisch korrekt auszuzeichnen.

Exkurs: Habe ich auf meiner Seite Probleme mit doppelten Inhalt?

Um herauszufinden, ob und wo es auf einer Website Probleme mit doppeltem Inhalt gibt, stehen zwei kostenfreie Tools zur Verfügung:

Google Search Console

In der Search Console gibt es zwei Funktionen, mit denen man doppeltem Inhalt auf die Spur kommt:

Unter dem Menüpunkt Index ⇒ Seiten sind indexierte und nicht indexierte Seiten aufgeführt. Sind bei den nicht indexierten welche dabei, die als Duplikat ausgeschlossen sind? Dann lohnt es sich hier im Detail zu schauen.

Google Search Console - ausgeschlossene Seiten

Ein anderer Weg ist unter Leistung ⇒ Seiten. Nutzen Sie dort den Filter Suchanfrage mit Keyword. Erscheinen mehrere Seiten zu dem Keyword oder ist es eindeutig?

Google Search Console - Suchanfrage mit Keyword

SEO-Tools verwenden

SEO-Tools helfen ebenfalls, doppelte Inhalte aufzuspüren, zum Beispiel Sistrix, unter https://www.sistrix.de/smart als kostenfreies Tool.

Neben vielen wertvollen Tipps rund um die Website gibt es explizite Hinweise zum Beispiel Inhalt unter mehr als einer URL erreichbar oder Identische H1 auf mehreren Seiten die helfen, doppelten Inhalten auf die Spur zu kommen.

Technische Lösungen für doppelten Inhalt

Es wäre am besten, doppelten Inhalt zu vermeiden. Geht dies inhaltlich oder technisch nicht, bieten sich drei Möglichkeiten an, damit umzugehen.

  1. Canoncial Tag
  2. Seiten auf noindex setzen (Meta-Angabe robots)
  3. mit Weiterleitungen arbeiten

Google empfiehlt die Verwendung eines Canonical Tags. Die Angabe noindex soll die Indexierung verhindern. Es ist dabei aber zum Beispiel so, dass die Linkkraft nicht weiter gegeben wird.

Eine andere Möglichkeit stellen Weiterleitungen dar. Für technisch bedingten doppelten Inhalt (eine Unterseite über mehrere URLs erreichbar) ist dies eine mögliche Lösung. Bei inhaltlich ähnlichen Seiten nicht — denn hierdurch sieht der Besucher die ursprünglich aufgerufene Seite tatsächlich nicht mehr.

Häufige Fehler

Bei der Verwendung von Canonical Tags kommt es immer wieder zu Fehlern. Die häufigsten Fehler sind:

  • Die Canoncial wird für eine Sprachvariante verwendet. Dafür gibt es eine eigene Angabe über hreflang (<link rel="alternate" hreflang="en-EN" href="URL eingeben"/>)
  • Die Canonical wird auf einer Seite mit noindex angegeben
  • Die Angabe ist im Inhalt, nicht im Kopfbereich angeben
  • Das Ziel ist nicht erreichbar (404)
  • Die Zieladresse ist relativ, nicht absolut angegeben
  • Es ist mehr als ein Canonical Tag gesetzt

Wie kommt die Angabe in die Website?

Bei klassischen Websites schreiben Sie die Angabe direkt in den Code.

Wenn Sie eine Website mit einem Content-Management verwenden, suchen Sie nach einem Plugin. Bei Wordpress bieten es umfangreiche SEO-Tools oft mit an, zum Beispiel Yoast. Für Joomla! haben wir von Netzum Sorglos selbst ein Canoncial Plugin entwickelt.

Noch Fragen? Wir beraten Sie gerne!

Veröffentlicht: Tags: WebdesignSEO Permalink