Noindex- oder Nofollow-Seiten ausschließen
Seiten, die per Meta-Tag (meta name=”robots” content=”noindex, nofollow”) oder über die robots.txt von der Indexierung ausgeschlossen sind, dürfen nicht in der Sitemap auftauchen. Wenn du Google sagst: „Diese Seite bitte ignorieren“, dann darf sie nicht gleichzeitig in der Sitemap stehen – sonst ist Google verwirrt.
Korrekte URL-Struktur und Protokolle
Alle URLs in der Sitemap sollten mit dem korrekten Protokoll (https://) und der vollständigen Domain angegeben werden. Relative Pfade oder doppelte URLs sind zu vermeiden. Jede Adresse in der Sitemap muss komplett und eindeutig sein – so wie eine vollständige Postanschrift.
Pfad zur Sitemap bekannt geben
Der Pfad zur sitemap.xml muss in der robots.txt eingetragen werden – Sitemap: https://www.domain.tld/sitemap.xml
Zusätzlich sollte die Sitemap in der Google Search Console (und ggf. bei Bing Webmaster Tools) hinterlegt werden. Du musst Google zeigen, wo dein Inhaltsverzeichnis liegt – quasi als Wegbeschreibung zur Sitemap.