Sitemap URL Extraktor | URLs schnell extrahieren

Der Sitemap URL Extraktor extrahiert alle URLs aus einer XML-Sitemap. Geben Sie die Sitemap-URL ein und erhalten Sie eine vollständige Linkliste. Nützlich für SEO-Analysen, Content-Audits und Website-Überprüfungen.

Im Browser Aktualisiert 05/2026

Fügen Sie die vollständige URL einer XML-Sitemap oder eines Sitemap-Index ein — zum Beispiel https://example.com/sitemap.xml
Nützlich, wenn die Sitemap hinter einem Login liegt, in einem Intranet gehostet wird oder Sie eine lokale Kopie gespeichert haben.
https://
Wir holen die robots.txt der Domain und listen jede gefundene Sitemap:-Direktive auf. Klicken Sie dann auf eine, um deren URLs zu extrahieren.
Datenschutz: Dieses Tool unterstützt sowohl reguläre Sitemaps als auch Sitemap-Index-Dateien. Nichts, was Sie übermitteln, wird auf unseren Servern gespeichert — die Ergebnisse verschwinden, sobald Sie den Tab schließen.

Hauptfunktionen

  • Drei Eingabemodi: Sitemap-URL einfügen, rohes XML einfügen oder Sitemaps automatisch aus der robots.txt einer Domain ermitteln
  • Rekursive Sitemap-Index-Erweiterung — bis zu 50 Unter-Sitemaps mit einem Klick abrufen und alle URLs in einer einzigen Liste zusammenführen
  • Metadaten pro URL: lastmod, changefreq und priority werden aus dem XML extrahiert, sofern vorhanden
  • Live-Filter (Teilstring oder /regex/) plus sechs Sortiermodi (A→Z, Z→A, längste, kürzeste, neuester Lastmod, Standard)
  • Deduplizierung mit einem Klick, wenn dieselbe URL in mehreren Unter-Sitemaps erscheint
  • Statistiken auf einen Blick: Gesamt-URLs, eindeutige Domains, Aufschlüsselung nach Dateierweiterung, Lastmod-Datumsbereich
  • Ergebnis als TXT (eine URL pro Zeile), CSV (mit allen Metadatenspalten) oder JSON herunterladen
  • Vollständige Liste, nur die sichtbar gefilterte Liste oder eine einzelne URL mit einem Klick kopieren
  • Bewältigt riesige Sitemaps (50.000+ URLs) dank serverseitigem Parsing und einer virtualisierten Ergebnistabelle
  • Kostenlos, ohne Anmeldung, ohne Konto, ohne Protokollierung — nützlich für SEO-Audits, Migrationen, Scraping-Vorbereitung und Wettbewerbsforschung

Häufige Anwendungsfälle

  • SEO-Audits — schnell jede URL inventarisieren, die eine Site Suchmaschinen offenbart
  • Site-Migrationen — die vollständige URL-Liste für das Mapping von Weiterleitungen vor dem Relaunch auf neuer Domain oder neuem CMS erzeugen
  • Wettbewerbsanalyse — eine öffentliche Sitemap scannen, um Inhaltsumfang, Kategorien und Update-Kadenz eines Mitbewerbers zu verstehen
  • Crawl-Vorbereitung — URLs in Screaming Frog, Sitebulb, eigene Python-Scraper oder beliebige HTTP-Prüftools einspeisen
  • Audit der internen Verlinkung — die URL-Liste mit einer Content-Audit-Tabelle kombinieren, um verwaiste Seiten zu finden
  • Content-Lückenanalyse — Ihre Sitemap mit der eines Mitbewerbers abgleichen, um Themenlücken zu entdecken
  • QA bei einer neuen Veröffentlichung — prüfen, ob Ihr CMS nach einem Deploy die erwartete Sitemap erzeugt
  • Lastmod-Inventar — veraltete Seiten erkennen, indem nach der Spalte lastmod sortiert und Einträge identifiziert werden, die seit Jahren nicht aktualisiert wurden
  • Massen-Indexierungsanfragen — als CSV exportieren und URLs gebündelt an das IndexNow-Protokoll oder einen URL-Inspection-Workflow in der Google Search Console übermitteln
  • Compliance und Barrierefreiheit — eine Master-URL-Liste für regelmäßige Barrierefreiheits- (WCAG) oder Datenschutzprüfungen erstellen

Verwendung

  1. Wählen Sie einen Tab. Aus URL ist der häufigste Weg: fügen Sie eine beliebige öffentliche Sitemap-Adresse ein (die meisten Sites veröffentlichen eine unter /sitemap.xml).
  2. Aktivieren Sie optional Auch Unter-Sitemaps abrufen, wenn Sie vermuten, dass die URL eine Index-Datei ist — das Tool folgt dann jedem untergeordneten Sitemap und führt alle URLs zusammen.
  3. Wenn Ihre Sitemap privat ist oder Sie sie als Datei haben, wechseln Sie zum Tab XML einfügen und fügen Sie den Inhalt direkt ein.
  4. Sie wissen nicht, wo die Sitemap liegt? Verwenden Sie den Tab Über robots.txt finden und geben Sie einfach die Domain ein — wir listen jede in robots.txt deklarierte Sitemap:-Direktive auf.
  5. Klicken Sie auf URLs extrahieren. Die Ergebnistabelle erscheint mit einem Statistikfeld darüber, das Gesamt-URLs, eindeutige Domains, Aufschlüsselung nach Dateierweiterung und Lastmod-Bereich anzeigt.
  6. Verwenden Sie das Filterfeld, um nur URLs zu behalten, die einer Teilzeichenkette (z. B. /blog/) oder einem regulären Ausdruck (z. B. /^https:\/\/.+\.pdf$/) entsprechen.
  7. Sortieren Sie die Liste mit dem Dropdown — nützlich, um veraltete Seiten anhand von lastmod zu erkennen oder die längsten/kürzesten URLs zu finden.
  8. Aktivieren Sie Duplikate entfernen, wenn kombinierte Unter-Sitemaps Duplikate enthielten.
  9. Verwenden Sie die Schaltflächen Alle kopieren, TXT, CSV oder JSON. CSV behält die Spalten lastmod, changefreq und priority bei.

Nutze dieses Tool von deinem KI-Agenten aus

Kostenlose JSON-API und Model Context Protocol (MCP)-Server. Keine Anmeldung, kein API-Schlüssel, CORS offen. Für Claude, ChatGPT, Cursor, Skripte und Frontend-Apps konzipiert.

curl -X POST https://mate.tools/api/v1/sitemap-extract.php \
  -H "Content-Type: application/json" \
  -d '{"url":"https://example.com/sitemap.xml"}'
import urllib.request, json

req = urllib.request.Request(
    "https://mate.tools/api/v1/sitemap-extract.php",
    data=json.dumps({"url":"https://example.com/sitemap.xml"}).encode(),
    headers={"Content-Type": "application/json"},
)
with urllib.request.urlopen(req) as r:
    print(json.load(r))
const r = await fetch("https://mate.tools/api/v1/sitemap-extract.php", {
    method: "POST",
    headers: { "Content-Type": "application/json" },
    body: JSON.stringify({"url":"https://example.com/sitemap.xml"}),
});
console.log(await r.json());

Hinzufügen zu claude_desktop_config.json (Claude Desktop), ~/.cursor/mcp.json (Cursor) oder einem anderen MCP-kompatiblen Client:

{
  "mcpServers": {
    "mate-tools": {
      "command": "npx",
      "args": ["-y", "@mate-tools/mcp-server"]
    }
  }
}
API-Dokumentation OpenAPI 3.1 npm 60 Anf./min · 600 Anf./Stunde · max. 1 MB Body

Häufig gestellte Fragen

Eine XML-Sitemap ist eine Datei, die alle URLs auflistet, die eine Website Suchmaschinen bekannt machen möchte. Die meisten Sites veröffentlichen ihre unter https://example.com/sitemap.xml oder geben sie in der robots.txt an. Verwenden Sie den Tab Über robots.txt finden, wenn Sie unsicher sind.

Ein Sitemap-Index ist eine Sitemap, die auf andere Sitemaps verweist — große Sites verteilen ihre URLs auf viele Dateien. Dieses Tool erkennt beides. Wenn Sie einen Index übermitteln, können Sie entweder die Liste der untergeordneten Sitemaps zurückerhalten oder Auch Unter-Sitemaps abrufen aktivieren, um sie alle zu einer kombinierten URL-Liste zu erweitern (aus Sicherheitsgründen auf 50 Unter-Sitemaps begrenzt).

Es gibt keine harte Obergrenze, aber sehr große Sitemaps (>100.000 URLs) können im Browser langsam zu rendern sein. Der XML-Parser selbst läuft serverseitig und bewältigt riesige Dateien problemlos — der langsame Teil ist nur das Rendern der Ergebnistabelle.

Wenn im XML vorhanden, lesen wir <lastmod>, <changefreq> und <priority> für jede URL. Die Ergebnistabelle zeigt lastmod und die CSV-/JSON-Downloads enthalten alle drei Spalten. Sitemap-Index-Einträge zeigen ihre lastmod ebenfalls, sofern angegeben.

Ja — geben Sie eine beliebige Teilzeichenkette (Groß-/Kleinschreibung wird ignoriert) in das Filterfeld ein oder umrahmen Sie einen regulären Ausdruck mit Schrägstrichen (z. B. /\.pdf$/). Der Ergebniszähler sowie Kopier- und Download-Aktionen berücksichtigen alle den aktiven Filter, sodass Sie genau den Ausschnitt extrahieren können, der Sie interessiert.

Dieses Tool ruft Sitemaps anonym über HTTPS ab, daher sind passwortgeschützte, IP-beschränkte oder Staging-Sitemaps nicht direkt erreichbar. Öffnen Sie die Datei in Ihrem Browser, kopieren Sie das XML und verwenden Sie den Tab XML einfügen.

Aktivieren Sie den Schalter Duplikate entfernen in der Ergebnis-Symbolleiste. Wenn sich Unter-Sitemaps überschneiden (häufig bei mehrsprachigen Sites, die dieselbe kanonische URL über mehrere Sprach-Sitemaps neu veröffentlichen), ist dies unerlässlich.

Ja. Sitemaps sind öffentliche Dateien, daher ist die Sitemap jeder öffentlich zugänglichen Site für die Analyse freigegeben. Es ist eine hervorragende Möglichkeit, Inhaltskategorien, -tiefe und Aktualisierungsfrequenz eines Mitbewerbers zu kartieren.

Nein. Jede Anfrage wird im Speicher verarbeitet und verworfen, sobald die Seite gerendert ist. Nichts wird protokolliert, in eine Warteschlange gestellt oder persistiert. Laden Sie die Seite neu und die vorherige Extraktion ist weg.

TXT (eine URL pro Zeile) eignet sich am besten zum Weiterleiten an Kommandozeilentools oder zum Einfügen in Formulare. CSV öffnet sich direkt in Excel/Sheets und erhält lastmod, changefreq und priority. JSON ist am freundlichsten für Skripte (Python, Node usw.) und macht den Roundtrip perfekt.