Sitemap URL Extractor | Haal snel URL's op

De Sitemap URL Extractor haalt eenvoudig URL's uit een XML-sitemap. Voer de sitemap-URL in en ontvang een lijst van alle links. Geschikt voor SEO-analyse en website-audits.

Wat is een sitemap-URL-extractor?

Een sitemap-URL-extractor leest een XML-sitemap en haalt elke pagina-URL eruit die erin staat, zodat je de volledige lijst kunt kopiëren of downloaden. Het is handig voor SEO-audits, migraties en het crawlen van de pagina's van een site.
In je browser Bijgewerkt 05/2026

Plak de volledige URL van een XML-sitemap of sitemap-index — bijvoorbeeld https://example.com/sitemap.xml
Handig wanneer de sitemap achter een login zit, op een intranet wordt gehost of u een lokale kopie hebt opgeslagen.
https://
We halen de robots.txt van het domein op en tonen elke Sitemap:-richtlijn die we vinden. Klik daarna op een ervan om de URLs te extraheren.
Privacy: Deze tool ondersteunt zowel reguliere sitemaps als sitemap-indexbestanden. Niets wat u indient wordt opgeslagen op onze servers — resultaten verdwijnen wanneer u het tabblad sluit.

Belangrijkste kenmerken

  • Drie invoermethodes: een sitemap-URL plakken, ruwe XML plakken of automatisch sitemaps ontdekken via de robots.txt van een domein
  • Recursieve uitbreiding van sitemap-indexen — haal in één klik tot 50 onderliggende sitemaps op en voeg alle URLs samen tot één lijst
  • Metadata per URL: lastmod, changefreq en priority worden uit de XML geëxtraheerd indien aanwezig
  • Live filter (deeltekst of /regex/) plus zes sorteermodi (A→Z, Z→A, langste, kortste, nieuwste lastmod, standaard)
  • Deduplicatie met één klik wanneer dezelfde URL in meerdere sub-sitemaps voorkomt
  • Statistieken in één oogopslag: totaal aantal URLs, unieke domeinen, verdeling van bestandsextensies, lastmod-datumbereik
  • Download het resultaat als TXT (één URL per regel), CSV (met alle metadatakolommen) of JSON
  • Kopieer de volledige lijst, alleen de zichtbare gefilterde lijst of een enkele URL met één klik
  • Verwerkt enorme sitemaps (50.000+ URLs) dankzij server-side parsing en een gevirtualiseerde resultaattabel
  • Gratis, geen registratie, geen account, geen logging — handig voor SEO-audits, migraties, scraping-voorbereiding en concurrentieonderzoek

Veelvoorkomende gebruiksscenario's

  • SEO-audits — inventariseer snel elke URL die een site aan zoekmachines toont
  • Sitemigraties — produceer de volledige URL-lijst voor redirect-mapping voordat u opnieuw lanceert op een nieuw domein of CMS
  • Concurrentieonderzoek — scan een openbare sitemap om de contentvoetafdruk, categorieën en updatefrequentie van een concurrent te begrijpen
  • Crawl-voorbereiding — voer URLs in Screaming Frog, Sitebulb, aangepaste Python-scrapers of een willekeurige HTTP-controletool
  • Audits van interne links — combineer de URL-lijst met een content-audit-spreadsheet om weespagina's te vinden
  • Analyse van content-gaps — vergelijk uw sitemap met die van een concurrent om onderwerphiaten te ontdekken
  • QA op een nieuwe release — controleer of uw CMS na een deploy de verwachte sitemap produceert
  • Lastmod-inventaris — spoor verouderde pagina's op door op de lastmod-kolom te sorteren en items te identificeren die al jaren niet zijn bijgewerkt
  • Bulk-indexeringsverzoeken — exporteer naar CSV en dien URLs in batches in via het IndexNow-protocol of een Google Search Console URL-inspectieworkflow
  • Compliance en toegankelijkheid — produceer een hoofd-URL-lijst voor periodieke toegankelijkheids- (WCAG) of privacycontroles

Hoe te gebruiken

  1. Kies een tabblad. Vanaf URL is de meest gebruikte route: plak een openbaar sitemapadres (de meeste sites publiceren er een op /sitemap.xml).
  2. Schakel optioneel Ook sub-sitemaps ophalen in als u vermoedt dat de URL een indexbestand is — de tool volgt elke onderliggende sitemap en voegt alle URLs samen.
  3. Als uw sitemap privé is of u die als bestand hebt, schakel dan over naar het tabblad XML plakken en plak de inhoud direct.
  4. Weet u niet waar de sitemap staat? Gebruik het tabblad Zoeken via robots.txt en voer alleen het domein in — we tonen elke Sitemap:-richtlijn die in robots.txt is opgegeven.
  5. Klik op URLs extraheren. De resultaattabel verschijnt met een statistiekenpaneel erboven dat het totale aantal URLs, unieke domeinen, verdeling van bestandsextensies en lastmod-bereik toont.
  6. Gebruik het filtervak om alleen URLs te behouden die overeenkomen met een deeltekst (bijv. /blog/) of een reguliere expressie (bijv. /^https:\/\/.+\.pdf$/).
  7. Sorteer de lijst met de dropdown — handig om verouderde pagina's op lastmod te vinden of de langste/kortste URLs te lokaliseren.
  8. Schakel Dedupliceren in als gecombineerde sub-sitemaps duplicaten bevatten.
  9. Gebruik de knoppen Alles kopiëren, TXT, CSV of JSON. CSV behoudt de kolommen lastmod, changefreq en priority.

Gebruik deze tool vanuit je AI-agent

Gratis JSON-API en Model Context Protocol (MCP)-server. Geen registratie, geen API-sleutel, CORS open. Ontworpen voor Claude, ChatGPT, Cursor, scripts en frontend-apps.

curl -X POST https://mate.tools/api/v1/sitemap-extract.php \
  -H "Content-Type: application/json" \
  -d '{"url":"https://example.com/sitemap.xml"}'
import urllib.request, json

req = urllib.request.Request(
    "https://mate.tools/api/v1/sitemap-extract.php",
    data=json.dumps({"url":"https://example.com/sitemap.xml"}).encode(),
    headers={"Content-Type": "application/json"},
)
with urllib.request.urlopen(req) as r:
    print(json.load(r))
const r = await fetch("https://mate.tools/api/v1/sitemap-extract.php", {
    method: "POST",
    headers: { "Content-Type": "application/json" },
    body: JSON.stringify({"url":"https://example.com/sitemap.xml"}),
});
console.log(await r.json());

Voeg toe aan claude_desktop_config.json (Claude Desktop), ~/.cursor/mcp.json (Cursor) of een andere MCP-compatibele client:

{
  "mcpServers": {
    "mate-tools": {
      "command": "npx",
      "args": ["-y", "@mate-tools/mcp-server"]
    }
  }
}
API-documentatie OpenAPI 3.1 npm 60 verz./min · 600 verz./uur · max 1 MB body

Veelgestelde vragen

Een XML-sitemap is een bestand dat elke URL vermeldt waarvan een website wil dat zoekmachines deze kennen. De meeste sites publiceren die op https://example.com/sitemap.xml of vermelden hem in robots.txt. Gebruik het tabblad Zoeken via robots.txt als u het niet zeker weet.

Een sitemap-index is een sitemap die naar andere sitemaps verwijst — grote sites verdelen hun URLs over meerdere bestanden. Deze tool detecteert beide. Als u een index indient, kunt u de lijst met onderliggende sitemaps terugkrijgen of Ook sub-sitemaps ophalen aanvinken om ze allemaal uit te breiden tot één gecombineerde URL-lijst (voor de zekerheid begrensd op 50 sub-sitemaps).

Er is geen harde limiet, maar zeer grote sitemaps (>100.000 URLs) kunnen traag renderen in de browser. De XML-parser zelf draait server-side en verwerkt enorme bestanden moeiteloos — alleen het renderen van de resultaattabel is traag.

Indien aanwezig in de XML lezen we <lastmod>, <changefreq> en <priority> voor elke URL. De resultaattabel toont lastmod, en de CSV/JSON-downloads bevatten alle drie kolommen. Sitemap-indexvermeldingen tonen ook hun lastmod indien meegegeven.

Ja — typ een willekeurige deeltekst (hoofdletterongevoelig) in het filtervak, of zet een reguliere expressie tussen schuine strepen (bijv. /\.pdf$/). De resultaatteller, kopieer- en downloadacties respecteren allemaal het actieve filter, zodat u alleen het deel kunt extraheren dat u nodig hebt.

Deze tool haalt sitemaps anoniem op via HTTPS, dus met wachtwoord beveiligde, IP-beperkte of staging-sitemaps zijn niet rechtstreeks bereikbaar. Open het bestand in uw browser, kopieer de XML en gebruik het tabblad XML plakken.

Schakel de Dedupliceren-knop in op de resultaatwerkbalk. Wanneer sub-sitemaps elkaar overlappen (gebruikelijk op meertalige sites die dezelfde canonieke URL opnieuw publiceren in taalsitemaps), is dit essentieel.

Ja. Sitemaps zijn openbare bestanden, dus de sitemap van elke openbaar toegankelijke site is geschikt voor analyse. Het is een uitstekende manier om de contentcategorieën, diepte en updatefrequentie van een concurrent in kaart te brengen.

Nee. Elk verzoek wordt in het geheugen verwerkt en weggegooid zodra de pagina is gerenderd. Niets wordt gelogd, in de wachtrij gezet of bewaard. Herlaad de pagina en de vorige extractie is weg.

TXT (één URL per regel) is het beste voor commandoregeltools of plak-in-formulier-workflows. CSV opent direct in Excel/Sheets en behoudt lastmod, changefreq en priority. JSON is het vriendelijkst voor scripts (Python, Node, enz.) en is perfect rondreis-bestendig.