Ekstraktor URL Peta Situs | Ekstrak URL dengan Mudah

Ekstraktor URL Peta Situs mengekstrak semua URL dari peta situs dengan cepat. Masukkan URL peta situs untuk mendapatkan daftar URL terorganisir untuk analisis SEO. Hasil langsung dan dapat diunduh tanpa keahlian teknis.

Apa itu ekstraktor URL sitemap?

Sebuah ekstraktor URL sitemap membaca sitemap XML dan menarik setiap URL halaman yang tercantum di dalamnya, sehingga Anda dapat menyalin atau mengunduh daftar lengkapnya. Ini berguna untuk audit SEO, migrasi, dan menjelajahi halaman-halaman situs.
Di browser Anda Diperbarui 05/2026

Tempel URL lengkap dari sitemap XML atau indeks sitemap — misalnya https://example.com/sitemap.xml
Berguna ketika sitemap berada di balik login, dihosting di intranet, atau Anda menyimpan salinannya secara lokal.
https://
Kami akan mengambil robots.txt domain dan mendaftar setiap direktif Sitemap: yang kami temukan. Lalu klik salah satu untuk mengekstrak URL-nya.
Privasi: Alat ini mendukung sitemap reguler dan file indeks sitemap. Tidak ada yang Anda kirimkan disimpan di server kami — hasil hilang saat Anda menutup tab.

Fitur Utama

  • Tiga mode input: tempel URL sitemap, tempel XML mentah, atau temukan sitemap secara otomatis dari robots.txt domain
  • Perluasan indeks sitemap rekursif — ambil hingga 50 sitemap anak dalam satu klik dan gabungkan setiap URL ke dalam satu daftar
  • Metadata per URL: lastmod, changefreq, dan priority diekstrak dari XML jika ada
  • Filter langsung (substring atau /regex/) plus enam mode pengurutan (A→Z, Z→A, terpanjang, terpendek, lastmod terbaru, default)
  • Penghapusan duplikat satu klik ketika URL yang sama muncul di beberapa sub-sitemap
  • Statistik sekilas: total URL, domain unik, rincian ekstensi file, rentang tanggal lastmod
  • Unduh hasil sebagai TXT (satu URL per baris), CSV (dengan semua kolom metadata), atau JSON
  • Salin daftar lengkap, hanya daftar tersaring yang terlihat, atau URL tunggal apa pun dengan satu klik
  • Menangani sitemap besar (50.000+ URL) berkat penguraian sisi server dan tabel hasil yang divirtualisasi
  • Gratis, tanpa pendaftaran, tanpa akun, tanpa logging — berguna untuk audit SEO, migrasi, persiapan scraping, dan riset kompetitor

Kasus Penggunaan Umum

  • Audit SEO — inventarisasi cepat setiap URL yang dipaparkan situs ke mesin pencari
  • Migrasi situs — buat daftar URL lengkap untuk pemetaan pengalihan sebelum meluncurkan ulang di domain atau CMS baru
  • Riset kompetitor — pindai sitemap publik untuk memahami jejak konten kompetitor, kategori, dan kadensi pembaruan
  • Persiapan crawl — masukkan URL ke Screaming Frog, Sitebulb, scraper Python kustom, atau alat pemeriksaan HTTP apa pun
  • Audit tautan internal — pasangkan daftar URL dengan spreadsheet audit konten untuk menemukan halaman yatim piatu
  • Analisis kesenjangan konten — bandingkan sitemap Anda dengan kompetitor untuk menemukan kesenjangan topik
  • QA rilis baru — verifikasi CMS Anda menghasilkan sitemap yang diharapkan setelah deploy
  • Inventaris lastmod — temukan halaman usang dengan mengurutkan kolom lastmod dan mengidentifikasi entri yang belum diperbarui selama bertahun-tahun
  • Permintaan pengindeksan massal — ekspor ke CSV dan kirim URL dalam batch ke protokol IndexNow atau alur kerja inspeksi URL Google Search Console
  • Kepatuhan dan aksesibilitas — buat daftar URL master untuk tinjauan aksesibilitas (WCAG) atau privasi berkala

Cara Menggunakan

  1. Pilih tab. Dari URL adalah jalur paling umum: tempel alamat sitemap publik mana pun (sebagian besar situs menerbitkannya di /sitemap.xml).
  2. Opsional aktifkan Ambil juga sub-sitemap jika Anda mencurigai URL adalah file indeks — alat akan mengikuti setiap sitemap anak dan menggabungkan setiap URL.
  3. Jika sitemap Anda bersifat pribadi atau Anda memilikinya sebagai file, beralih ke tab Tempel XML dan tempel kontennya secara langsung.
  4. Tidak tahu di mana sitemap berada? Gunakan tab Cari melalui robots.txt dan cukup masukkan domainnya — kami akan mendaftar setiap direktif Sitemap: yang dideklarasikan di robots.txt.
  5. Klik Ekstrak URL. Tabel hasil muncul dengan panel statistik di atasnya yang menunjukkan total URL, domain unik, rincian ekstensi file, dan rentang lastmod.
  6. Gunakan kotak filter untuk menyimpan hanya URL yang cocok dengan substring (misalnya /blog/) atau ekspresi reguler (misalnya /^https:\/\/.+\.pdf$/).
  7. Urutkan daftar dengan menu dropdown — berguna untuk menemukan halaman usang berdasarkan lastmod atau menemukan URL terpanjang/terpendek.
  8. Aktifkan Hapus duplikat jika sub-sitemap gabungan mencakup duplikat.
  9. Gunakan tombol Salin Semua, TXT, CSV, atau JSON. CSV mempertahankan kolom lastmod, changefreq, dan priority.

Gunakan alat ini dari agen AI Anda

API JSON dan server Model Context Protocol (MCP) gratis. Tanpa pendaftaran, tanpa kunci API, CORS terbuka. Dirancang untuk Claude, ChatGPT, Cursor, skrip, dan aplikasi frontend.

curl -X POST https://mate.tools/api/v1/sitemap-extract.php \
  -H "Content-Type: application/json" \
  -d '{"url":"https://example.com/sitemap.xml"}'
import urllib.request, json

req = urllib.request.Request(
    "https://mate.tools/api/v1/sitemap-extract.php",
    data=json.dumps({"url":"https://example.com/sitemap.xml"}).encode(),
    headers={"Content-Type": "application/json"},
)
with urllib.request.urlopen(req) as r:
    print(json.load(r))
const r = await fetch("https://mate.tools/api/v1/sitemap-extract.php", {
    method: "POST",
    headers: { "Content-Type": "application/json" },
    body: JSON.stringify({"url":"https://example.com/sitemap.xml"}),
});
console.log(await r.json());

Tambahkan ke claude_desktop_config.json (Claude Desktop), ~/.cursor/mcp.json (Cursor), atau klien kompatibel MCP lainnya:

{
  "mcpServers": {
    "mate-tools": {
      "command": "npx",
      "args": ["-y", "@mate-tools/mcp-server"]
    }
  }
}
Dokumentasi API OpenAPI 3.1 npm 60 req/menit · 600 req/jam · isi maks 1 MB

Pertanyaan yang Sering Diajukan

Sitemap XML adalah file yang mencantumkan setiap URL yang ingin diketahui mesin pencari oleh sebuah situs web. Sebagian besar situs menerbitkannya di https://example.com/sitemap.xml atau mencantumkannya di robots.txt. Gunakan tab Cari melalui robots.txt jika Anda tidak yakin.

Indeks sitemap adalah sitemap yang menunjuk ke sitemap lain — situs besar membagi URL mereka di banyak file. Alat ini mendeteksi keduanya. Jika Anda mengirimkan indeks, Anda dapat mendapatkan kembali daftar sitemap anak, atau centang Ambil juga sub-sitemap untuk memperluas semuanya menjadi satu daftar URL gabungan (dibatasi 50 sub-sitemap untuk keamanan).

Tidak ada batas ketat, tetapi sitemap yang sangat besar (>100.000 URL) mungkin lambat untuk dirender di browser. Pengurai XML itu sendiri ada di sisi server dan menangani file besar dengan mudah — bagian yang lambat hanyalah merender tabel hasil.

Saat ada di XML, kami membaca <lastmod>, <changefreq>, dan <priority> untuk setiap URL. Tabel hasil menunjukkan lastmod, dan unduhan CSV/JSON mencakup ketiga kolom. Entri indeks sitemap juga mengekspos lastmod mereka jika disediakan.

Ya — ketik substring apa pun (tidak peka huruf besar/kecil) di kotak filter, atau bungkus ekspresi reguler dalam garis miring (misalnya /\.pdf$/). Penghitung hasil, tindakan salin, dan unduh semua menghormati filter aktif, sehingga Anda dapat mengekstrak hanya bagian yang Anda pedulikan.

Alat ini mengambil sitemap secara anonim melalui HTTPS, jadi sitemap yang dilindungi kata sandi, dibatasi IP, atau staging tidak dapat dijangkau secara langsung. Buka file di browser Anda, salin XML, dan gunakan tab Tempel XML.

Aktifkan sakelar Hapus duplikat di toolbar hasil. Ketika sub-sitemap tumpang tindih (umum pada situs multibahasa yang menerbitkan ulang URL canonical yang sama di seluruh sitemap bahasa), ini sangat penting.

Ya. Sitemap adalah file publik, jadi sitemap dari situs apa pun yang dapat diakses publik adalah subjek yang sah untuk dianalisis. Ini adalah cara yang sangat baik untuk memetakan kategori konten kompetitor, kedalaman, dan frekuensi pembaruan.

Tidak. Setiap permintaan diproses dalam memori dan dibuang segera setelah halaman dirender. Tidak ada yang dicatat, diantrekan, atau dipertahankan. Muat ulang halaman dan ekstraksi sebelumnya hilang.

TXT (satu URL per baris) paling baik untuk dialirkan ke alat baris perintah atau alur kerja tempel-ke-formulir. CSV terbuka langsung di Excel/Sheets dan mempertahankan lastmod, changefreq, dan priority. JSON paling ramah untuk skrip (Python, Node, dll.) dan bolak-balik dengan sempurna.