ตัวดึง URL แผนผังเว็บไซต์ | ดึง URL อย่างรวดเร็ว

เครื่องมือดึง URL แผนผังเว็บไซต์ช่วยดึงข้อมูล URL ได้รวดเร็วและแม่นยำ ใช้สำหรับสร้างหรือปรับปรุงแผนผังเว็บไซต์ เพื่อให้เข้าถึงง่ายและเป็นไปตามมาตรฐาน SEO.

ในเบราว์เซอร์ อัปเดต 05/2026

วาง URL แบบเต็มของแผนผังเว็บไซต์ XML หรือดัชนีแผนผังเว็บไซต์ — ตัวอย่างเช่น https://example.com/sitemap.xml
มีประโยชน์เมื่อแผนผังเว็บไซต์อยู่หลังการเข้าสู่ระบบ โฮสต์อยู่บนอินทราเน็ต หรือคุณบันทึกสำเนาไว้ในเครื่อง
https://
เราจะดึงไฟล์ robots.txt ของโดเมนและแสดงรายการคำสั่ง Sitemap: ทุกตัวที่พบ จากนั้นคลิกที่ใดก็ได้เพื่อแยก URL ของมัน
ความเป็นส่วนตัว: เครื่องมือนี้รองรับทั้งแผนผังเว็บไซต์ปกติและไฟล์ดัชนีแผนผังเว็บไซต์ ไม่มีสิ่งใดที่คุณส่งจะถูกจัดเก็บไว้บนเซิร์ฟเวอร์ของเรา — ผลลัพธ์จะหายไปเมื่อคุณปิดแท็บ

คุณสมบัติหลัก

  • โหมดการป้อนข้อมูลสามแบบ: วาง URL ของแผนผังเว็บไซต์ วาง XML ดิบ หรือค้นหาแผนผังเว็บไซต์อัตโนมัติจาก robots.txt ของโดเมน
  • การขยายดัชนีแผนผังเว็บไซต์แบบเรียกซ้ำ — ดึงแผนผังย่อยได้ถึง 50 รายการในคลิกเดียวและรวมทุก URL เข้าเป็นรายการเดียว
  • ข้อมูลเมตาต่อ URL: lastmod, changefreq และ priority ที่แยกจาก XML เมื่อมี
  • ตัวกรองสด (สตริงย่อยหรือ /regex/) บวกกับโหมดการเรียงลำดับหกแบบ (A→Z, Z→A, ยาวที่สุด, สั้นที่สุด, lastmod ใหม่ที่สุด, ค่าเริ่มต้น)
  • การกำจัดข้อมูลซ้ำในคลิกเดียวเมื่อ URL เดียวกันปรากฏในแผนผังย่อยหลายรายการ
  • สถิติแบบเห็นในพริบตา: URL ทั้งหมด โดเมนที่ไม่ซ้ำ การแบ่งตามนามสกุลไฟล์ ช่วงวันที่ lastmod
  • ดาวน์โหลดผลลัพธ์เป็น TXT (หนึ่ง URL ต่อบรรทัด) CSV (พร้อมคอลัมน์ข้อมูลเมตาทั้งหมด) หรือ JSON
  • คัดลอกรายการทั้งหมด เฉพาะรายการที่กรองแล้วที่มองเห็นได้ หรือ URL เดียวใดๆ ในคลิกเดียว
  • รองรับแผนผังเว็บไซต์ขนาดใหญ่ (50,000+ URL) ด้วยการแยกวิเคราะห์ฝั่งเซิร์ฟเวอร์และตารางผลลัพธ์แบบเสมือน
  • ฟรี ไม่ต้องสมัคร ไม่ต้องมีบัญชี ไม่มีการบันทึก — มีประโยชน์สำหรับการตรวจสอบ SEO การย้ายเว็บไซต์ การเตรียม scraping และการวิจัยคู่แข่ง

กรณีการใช้งานทั่วไป

  • การตรวจสอบ SEO — สำรวจทุก URL ที่เว็บไซต์เปิดเผยต่อเสิร์ชเอนจินอย่างรวดเร็ว
  • การย้ายเว็บไซต์ — สร้างรายการ URL ทั้งหมดสำหรับการแมปการเปลี่ยนเส้นทางก่อนเปิดตัวใหม่บนโดเมนหรือ CMS ใหม่
  • การวิจัยคู่แข่ง — สแกนแผนผังเว็บไซต์สาธารณะเพื่อทำความเข้าใจรอยเท้าเนื้อหา หมวดหมู่ และจังหวะการอัปเดตของคู่แข่ง
  • การเตรียมการรวบรวมข้อมูล — ป้อน URL เข้าสู่ Screaming Frog, Sitebulb, สคริปต์ Python ที่กำหนดเอง หรือเครื่องมือตรวจสอบ HTTP ใดๆ
  • การตรวจสอบการเชื่อมโยงภายใน — จับคู่รายการ URL กับสเปรดชีตการตรวจสอบเนื้อหาเพื่อค้นหาหน้าที่เป็นกำพร้า
  • การวิเคราะห์ช่องว่างเนื้อหา — เปรียบเทียบแผนผังเว็บไซต์ของคุณกับของคู่แข่งเพื่อค้นพบช่องว่างของหัวข้อ
  • QA สำหรับการเปิดตัวใหม่ — ตรวจสอบว่า CMS ของคุณกำลังสร้างแผนผังเว็บไซต์ที่คาดหวังหลังจากการปรับใช้
  • รายการ lastmod — ตรวจหาหน้าเก่าโดยการเรียงลำดับตามคอลัมน์ lastmod และระบุรายการที่ไม่ได้รับการอัปเดตมาหลายปี
  • คำขอจัดทำดัชนีแบบกลุ่ม — ส่งออกเป็น CSV และส่ง URL เป็นชุดไปยังโปรโตคอล IndexNow หรือเวิร์กโฟลว์การตรวจสอบ URL ของ Google Search Console
  • การปฏิบัติตามและการเข้าถึง — สร้างรายการ URL หลักสำหรับการตรวจสอบการเข้าถึง (WCAG) หรือความเป็นส่วนตัวเป็นระยะ

วิธีใช้

  1. เลือกแท็บ จาก URL เป็นเส้นทางที่พบบ่อยที่สุด: วางที่อยู่แผนผังเว็บไซต์สาธารณะใดๆ (ส่วนใหญ่เผยแพร่ที่ /sitemap.xml)
  2. เลือกเปิด ดึงแผนผังย่อยด้วย หากคุณสงสัยว่า URL เป็นไฟล์ดัชนี — เครื่องมือจะติดตามแผนผังย่อยแต่ละรายการและรวมทุก URL
  3. หากแผนผังเว็บไซต์ของคุณเป็นแบบส่วนตัวหรือคุณมีในรูปแบบไฟล์ ให้สลับไปที่แท็บ วาง XML และวางเนื้อหาโดยตรง
  4. ไม่รู้ว่าแผนผังเว็บไซต์อยู่ที่ใด? ใช้แท็บ ค้นหาผ่าน robots.txt และเพียงป้อนโดเมน — เราจะแสดงรายการคำสั่ง Sitemap: ทุกตัวที่ประกาศใน robots.txt
  5. คลิก แยก URL ตารางผลลัพธ์จะปรากฏพร้อมแผงสถิติด้านบนแสดง URL ทั้งหมด โดเมนที่ไม่ซ้ำ การแบ่งตามนามสกุลไฟล์ และช่วง lastmod
  6. ใช้กล่องตัวกรองเพื่อเก็บเฉพาะ URL ที่ตรงกับสตริงย่อย (เช่น /blog/) หรือนิพจน์ปกติ (เช่น /^https:\/\/.+\.pdf$/)
  7. เรียงลำดับรายการด้วยเมนูแบบเลื่อนลง — มีประโยชน์สำหรับการตรวจหาหน้าเก่าตาม lastmod หรือค้นหา URL ที่ยาวที่สุด/สั้นที่สุด
  8. เปิด ตัดข้อมูลซ้ำ หากแผนผังย่อยที่รวมกันรวมรายการที่ซ้ำกัน
  9. ใช้ปุ่ม คัดลอกทั้งหมด, TXT, CSV หรือ JSON. CSV จะคงคอลัมน์ lastmod, changefreq และ priority ไว้

ใช้เครื่องมือนี้จาก AI agent ของคุณ

JSON API ฟรีและเซิร์ฟเวอร์ Model Context Protocol (MCP) ฟรี ไม่ต้องลงทะเบียน ไม่ต้องใช้ API key, CORS เปิด ออกแบบสำหรับ Claude, ChatGPT, Cursor, สคริปต์ และแอปฟรอนต์เอนด์

curl -X POST https://mate.tools/api/v1/sitemap-extract.php \
  -H "Content-Type: application/json" \
  -d '{"url":"https://example.com/sitemap.xml"}'
import urllib.request, json

req = urllib.request.Request(
    "https://mate.tools/api/v1/sitemap-extract.php",
    data=json.dumps({"url":"https://example.com/sitemap.xml"}).encode(),
    headers={"Content-Type": "application/json"},
)
with urllib.request.urlopen(req) as r:
    print(json.load(r))
const r = await fetch("https://mate.tools/api/v1/sitemap-extract.php", {
    method: "POST",
    headers: { "Content-Type": "application/json" },
    body: JSON.stringify({"url":"https://example.com/sitemap.xml"}),
});
console.log(await r.json());

เพิ่มลงใน claude_desktop_config.json (Claude Desktop), ~/.cursor/mcp.json (Cursor) หรือไคลเอ็นต์อื่นที่รองรับ MCP:

{
  "mcpServers": {
    "mate-tools": {
      "command": "npx",
      "args": ["-y", "@mate-tools/mcp-server"]
    }
  }
}
เอกสาร API OpenAPI 3.1 npm 60 คำขอ/นาที · 600 คำขอ/ชม. · เนื้อหาสูงสุด 1 MB

คำถามที่พบบ่อย

แผนผังเว็บไซต์ XML คือไฟล์ที่แสดงรายการทุก URL ที่เว็บไซต์ต้องการให้เสิร์ชเอนจินรู้จัก ส่วนใหญ่เผยแพร่ที่ https://example.com/sitemap.xml หรือระบุไว้ใน robots.txt ใช้แท็บ ค้นหาผ่าน robots.txt หากคุณไม่แน่ใจ

ดัชนีแผนผังเว็บไซต์คือแผนผังเว็บไซต์ที่ชี้ไปยังแผนผังเว็บไซต์อื่นๆ — เว็บไซต์ขนาดใหญ่จะแบ่ง URL ของตนออกเป็นหลายไฟล์ เครื่องมือนี้ตรวจจับทั้งสองแบบ หากคุณส่งดัชนี คุณสามารถได้รายการของแผนผังย่อยกลับมา หรือทำเครื่องหมาย ดึงแผนผังย่อยด้วย เพื่อขยายทั้งหมดเข้าเป็นรายการ URL รวมเดียว (จำกัดที่ 50 แผนผังย่อยเพื่อความปลอดภัย)

ไม่มีขีดจำกัดที่ตายตัว แต่แผนผังเว็บไซต์ขนาดใหญ่มาก (>100,000 URL) อาจแสดงผลในเบราว์เซอร์ช้า ตัวแยกวิเคราะห์ XML เองทำงานฝั่งเซิร์ฟเวอร์และจัดการไฟล์ขนาดใหญ่ได้อย่างง่ายดาย — ส่วนที่ช้าคือเพียงการแสดงผลตารางผลลัพธ์

เมื่อมีอยู่ใน XML เราจะอ่าน <lastmod>, <changefreq> และ <priority> สำหรับแต่ละ URL ตารางผลลัพธ์แสดง lastmod และการดาวน์โหลด CSV/JSON รวมทั้งสามคอลัมน์ รายการดัชนีแผนผังเว็บไซต์ก็แสดง lastmod ของพวกมันเมื่อมีให้

ได้ — พิมพ์สตริงย่อยใดๆ (ไม่คำนึงถึงตัวพิมพ์เล็ก-ใหญ่) ในกล่องตัวกรอง หรือห่อนิพจน์ปกติด้วยเครื่องหมายทับ (เช่น /\.pdf$/) ตัวนับผลลัพธ์ การคัดลอก และการดาวน์โหลดทั้งหมดเคารพตัวกรองที่ใช้งานอยู่ ดังนั้นคุณสามารถแยกเฉพาะส่วนที่คุณสนใจได้

เครื่องมือนี้ดึงแผนผังเว็บไซต์โดยไม่ระบุตัวตนผ่าน HTTPS ดังนั้นแผนผังเว็บไซต์ที่ป้องกันด้วยรหัสผ่าน จำกัด IP หรือ staging จะไม่สามารถเข้าถึงได้โดยตรง เปิดไฟล์ในเบราว์เซอร์ของคุณ คัดลอก XML และใช้แท็บ วาง XML

เปิดสวิตช์ ตัดข้อมูลซ้ำ ในแถบเครื่องมือผลลัพธ์ เมื่อแผนผังย่อยทับซ้อนกัน (พบได้ทั่วไปในเว็บไซต์หลายภาษาที่เผยแพร่ URL canonical เดียวกันซ้ำในแผนผังภาษาต่างๆ) สิ่งนี้เป็นสิ่งจำเป็น

ได้ แผนผังเว็บไซต์เป็นไฟล์สาธารณะ ดังนั้นแผนผังเว็บไซต์ของเว็บไซต์ที่เข้าถึงได้แบบสาธารณะใดๆ ก็สามารถนำมาวิเคราะห์ได้อย่างยุติธรรม นี่เป็นวิธีที่ยอดเยี่ยมในการแมปหมวดหมู่เนื้อหา ความลึก และความถี่ในการอัปเดตของคู่แข่ง

ไม่ คำขอแต่ละรายการได้รับการประมวลผลในหน่วยความจำและถูกทิ้งทันทีที่หน้าได้รับการแสดงผล ไม่มีสิ่งใดที่บันทึก คิวไว้ หรือคงอยู่ โหลดหน้าใหม่และการแยกข้อมูลก่อนหน้าจะหายไป

TXT (หนึ่ง URL ต่อบรรทัด) เหมาะที่สุดสำหรับการป้อนเข้าสู่เครื่องมือบรรทัดคำสั่งหรือเวิร์กโฟลว์การวางในแบบฟอร์ม CSV เปิดได้โดยตรงใน Excel/Sheets และคงค่า lastmod, changefreq และ priority ไว้ JSON เป็นมิตรที่สุดสำหรับสคริปต์ (Python, Node ฯลฯ) และส่งกลับได้อย่างสมบูรณ์