Estrattore URL Sitemap | Estrai URL in pochi secondi
Estrai rapidamente gli URL da un file sitemap XML. Inserisci l'URL della sitemap per ottenere un elenco di link, utile per analisi SEO e audit. Ottimizza la tua strategia digitale con questo strumento.
Privacy: Questo strumento supporta sia le sitemap regolari sia i file indice di sitemap. Nulla di ciò che invii viene memorizzato sui nostri server: i risultati spariscono quando chiudi la scheda.
Caratteristiche principali
- Tre modalità di input: incollare un URL di sitemap, incollare XML grezzo o rilevare automaticamente le sitemap dal robots.txt di un dominio
- Espansione ricorsiva dell'indice di sitemap — recupera fino a 50 sotto-sitemap con un clic e unisci tutti gli URL in un'unica lista
- Metadati per URL: lastmod, changefreq e priority estratti dall'XML quando presenti
- Filtro live (sottostringa o /regex/) più sei modalità di ordinamento (A→Z, Z→A, più lungo, più corto, lastmod più recente, predefinito)
- Deduplica con un clic quando lo stesso URL appare in più sotto-sitemap
- Statistiche a colpo d'occhio: URL totali, domini unici, suddivisione per estensione di file, intervallo di date lastmod
- Scarica il risultato come TXT (un URL per riga), CSV (con tutte le colonne dei metadati) o JSON
- Copia l'intera lista, solo la lista filtrata visibile o un singolo URL con un clic
- Gestisce sitemap enormi (50.000+ URL) grazie al parsing lato server e a una tabella dei risultati virtualizzata
- Gratuito, senza registrazione, senza account, senza log — utile per audit SEO, migrazioni, preparazione di scraping e ricerca sui competitor
Casi d'uso comuni
- Audit SEO — inventaria rapidamente ogni URL che un sito espone ai motori di ricerca
- Migrazioni di sito — produci la lista completa di URL per la mappatura dei reindirizzamenti prima del rilancio su un nuovo dominio o CMS
- Ricerca sui competitor — analizza una sitemap pubblica per comprendere l'impronta di contenuti, le categorie e la cadenza di aggiornamento di un concorrente
- Preparazione del crawl — alimenta gli URL in Screaming Frog, Sitebulb, scraper Python personalizzati o qualsiasi strumento di verifica HTTP
- Audit di linking interno — abbina la lista degli URL a un foglio di audit dei contenuti per trovare pagine orfane
- Analisi delle lacune di contenuto — confronta la tua sitemap con quella di un competitor per scoprire argomenti mancanti
- QA su una nuova release — verifica che il tuo CMS produca la sitemap attesa dopo un deploy
- Inventario lastmod — individua le pagine obsolete ordinando per la colonna lastmod e identificando le voci non aggiornate da anni
- Richieste di indicizzazione di massa — esporta in CSV e invia URL a lotti al protocollo IndexNow o a un flusso di ispezione URL in Google Search Console
- Compliance e accessibilità — produci una lista master di URL per revisioni periodiche di accessibilità (WCAG) o privacy
Come usarlo
- Scegli una scheda. Da URL è il percorso più comune: incolla un qualsiasi indirizzo pubblico di sitemap (la maggior parte dei siti ne pubblica uno su
/sitemap.xml). - Attiva opzionalmente Recupera anche le sotto-sitemap se sospetti che l'URL sia un file indice — lo strumento seguirà ogni sitemap figlia e unirà tutti gli URL.
- Se la tua sitemap è privata o ce l'hai come file, passa alla scheda Incolla XML e incolla il contenuto direttamente.
- Non sai dove si trova la sitemap? Usa la scheda Trova tramite robots.txt e inserisci solo il dominio — elencheremo ogni direttiva Sitemap: dichiarata in robots.txt.
- Clicca su Estrai URL. Appare la tabella dei risultati con un pannello statistiche sopra che mostra URL totali, domini unici, suddivisione per estensione e intervallo lastmod.
- Usa la casella di filtro per mantenere solo gli URL che corrispondono a una sottostringa (es.
/blog/) o a un'espressione regolare (es./^https:\/\/.+\.pdf$/). - Ordina la lista con il menu a discesa — utile per individuare pagine obsolete in base a lastmod o trovare gli URL più lunghi/corti.
- Attiva Rimuovi duplicati se l'unione delle sotto-sitemap ha incluso duplicati.
- Usa i pulsanti Copia tutto, TXT, CSV o JSON. Il CSV preserva le colonne lastmod, changefreq e priority.
Usa questo strumento dal tuo agente IA
API JSON e server Model Context Protocol (MCP) gratuiti. Nessuna registrazione, nessuna chiave API, CORS aperto. Pensato per Claude, ChatGPT, Cursor, script e applicazioni frontend.
curl -X POST https://mate.tools/api/v1/sitemap-extract.php \
-H "Content-Type: application/json" \
-d '{"url":"https://example.com/sitemap.xml"}' import urllib.request, json
req = urllib.request.Request(
"https://mate.tools/api/v1/sitemap-extract.php",
data=json.dumps({"url":"https://example.com/sitemap.xml"}).encode(),
headers={"Content-Type": "application/json"},
)
with urllib.request.urlopen(req) as r:
print(json.load(r)) const r = await fetch("https://mate.tools/api/v1/sitemap-extract.php", {
method: "POST",
headers: { "Content-Type": "application/json" },
body: JSON.stringify({"url":"https://example.com/sitemap.xml"}),
});
console.log(await r.json()); Aggiungi a claude_desktop_config.json (Claude Desktop), ~/.cursor/mcp.json (Cursor) o qualsiasi altro client compatibile con MCP:
{
"mcpServers": {
"mate-tools": {
"command": "npx",
"args": ["-y", "@mate-tools/mcp-server"]
}
}
} Domande frequenti
Una sitemap XML è un file che elenca ogni URL che un sito web vuole far conoscere ai motori di ricerca. La maggior parte dei siti la pubblica su
https://example.com/sitemap.xml o la dichiara in robots.txt. Usa la scheda Trova tramite robots.txt se non sei sicuro.Un indice di sitemap è una sitemap che punta ad altre sitemap — i siti grandi distribuiscono i loro URL su molti file. Questo strumento rileva entrambi. Se invii un indice, puoi ottenere la lista delle sitemap figlie oppure spuntare Recupera anche le sotto-sitemap per espanderle tutte in una lista combinata di URL (limitata a 50 sotto-sitemap per sicurezza).
Non c'è un limite rigido, ma sitemap molto grandi (>100.000 URL) possono essere lente da renderizzare nel browser. Il parser XML stesso è lato server e gestisce facilmente file enormi — la parte lenta è solo il rendering della tabella dei risultati.
Quando presenti nell'XML, leggiamo
<lastmod>, <changefreq> e <priority> per ogni URL. La tabella dei risultati mostra lastmod e i download CSV/JSON includono tutte e tre le colonne. Anche le voci dell'indice di sitemap espongono il loro lastmod quando fornito.Sì — digita una qualsiasi sottostringa (senza distinzione tra maiuscole e minuscole) nella casella di filtro, oppure racchiudi un'espressione regolare tra slash (es.
/\.pdf$/). Il contatore dei risultati e le azioni di copia e download rispettano tutti il filtro attivo, così puoi estrarre solo la porzione che ti interessa.Questo strumento recupera le sitemap in modo anonimo via HTTPS, quindi le sitemap protette da password, limitate per IP o di staging non sono raggiungibili direttamente. Apri il file nel tuo browser, copia l'XML e usa la scheda Incolla XML.
Attiva l'interruttore Rimuovi duplicati nella barra degli strumenti dei risultati. Quando le sotto-sitemap si sovrappongono (comune nei siti multilingue che ripubblicano lo stesso URL canonico in più sitemap di lingua), questo è essenziale.
Sì. Le sitemap sono file pubblici, quindi la sitemap di qualsiasi sito accessibile pubblicamente è disponibile per l'analisi. È un modo eccellente per mappare le categorie di contenuto, la profondità e la frequenza di aggiornamento di un competitor.
No. Ogni richiesta viene elaborata in memoria e scartata non appena la pagina viene renderizzata. Nulla viene loggato, accodato o persistito. Ricarica la pagina e l'estrazione precedente è sparita.
TXT (un URL per riga) è ideale per inviare a strumenti da riga di comando o flussi di incolla-su-form. CSV si apre direttamente in Excel/Sheets e preserva lastmod, changefreq e priority. JSON è il più comodo per gli script (Python, Node, ecc.) e fa il round-trip perfettamente.