사이트맵 URL 추출기 | 손쉽게 URL 추출하기

사이트맵 URL 추출기는 웹사이트의 모든 URL을 빠르게 수집하고 관리합니다. 사용자가 입력한 사이트맵 URL을 기반으로 링크를 자동으로 정리하며, SEO 최적화와 웹사이트 분석에 도움을 줍니다.

사이트맵 URL 추출기란?

사이트맵 URL 추출기는 XML 사이트맵을 읽어 거기에 나열된 모든 페이지 URL을 추출하므로 전체 목록을 복사하거나 다운로드할 수 있습니다. SEO 감사, 마이그레이션, 사이트 페이지 크롤링에 유용합니다.
브라우저에서 업데이트 05/2026

XML 사이트맵 또는 사이트맵 인덱스의 전체 URL을 붙여넣으세요 — 예: https://example.com/sitemap.xml
사이트맵이 로그인 뒤에 있거나, 인트라넷에 호스팅되어 있거나, 로컬에 사본을 저장한 경우에 유용합니다.
https://
도메인의 robots.txt를 가져와 발견된 모든 Sitemap: 지시문을 나열합니다. 그런 다음 아무거나 클릭하여 해당 URL을 추출하세요.
개인정보: 이 도구는 일반 사이트맵과 사이트맵 인덱스 파일을 모두 지원합니다. 제출하신 어떠한 내용도 당사 서버에 저장되지 않습니다 — 탭을 닫으면 결과가 사라집니다.

주요 기능

  • 세 가지 입력 모드: 사이트맵 URL 붙여넣기, 원시 XML 붙여넣기, 또는 도메인의 robots.txt에서 사이트맵 자동 검색
  • 재귀적 사이트맵 인덱스 확장 — 한 번의 클릭으로 최대 50개의 자식 사이트맵을 가져와 모든 URL을 하나의 목록으로 병합
  • URL별 메타데이터: XML에 있는 경우 lastmod, changefreq, priority 추출
  • 실시간 필터(부분 문자열 또는 /regex/) 및 6가지 정렬 모드(A→Z, Z→A, 가장 긴, 가장 짧은, 최신 lastmod, 기본)
  • 동일한 URL이 여러 하위 사이트맵에 나타날 때 한 번의 클릭으로 중복 제거
  • 한눈에 보는 통계: 총 URL, 고유 도메인, 파일 확장자 분포, lastmod 날짜 범위
  • 결과를 TXT(한 줄에 하나의 URL), CSV(모든 메타데이터 열 포함) 또는 JSON으로 다운로드
  • 한 번의 클릭으로 전체 목록, 보이는 필터링된 목록만, 또는 단일 URL 복사
  • 서버 측 파싱과 가상화된 결과 테이블 덕분에 거대한 사이트맵(50,000개 이상의 URL) 처리 가능
  • 무료, 가입 불필요, 계정 불필요, 로그 기록 없음 — SEO 감사, 마이그레이션, 스크래핑 준비, 경쟁사 조사에 유용

일반적인 사용 사례

  • SEO 감사 — 사이트가 검색 엔진에 노출하는 모든 URL을 빠르게 인벤토리
  • 사이트 마이그레이션 — 새 도메인이나 CMS에서 재출시하기 전에 리디렉션 매핑을 위한 전체 URL 목록 생성
  • 경쟁사 조사 — 공개 사이트맵을 스캔하여 경쟁사의 콘텐츠 풋프린트, 카테고리 및 업데이트 주기 이해
  • 크롤링 준비 — Screaming Frog, Sitebulb, 사용자 정의 Python 스크래퍼 또는 임의의 HTTP 검사 도구에 URL 입력
  • 내부 링크 감사 — URL 목록을 콘텐츠 감사 스프레드시트와 결합하여 고립된 페이지 찾기
  • 콘텐츠 갭 분석 — 자신의 사이트맵을 경쟁사의 것과 비교하여 주제 격차 발견
  • 새 릴리스 QA — 배포 후 CMS가 예상한 사이트맵을 생성하는지 확인
  • lastmod 인벤토리 — lastmod 열을 정렬하여 수년간 업데이트되지 않은 항목을 식별해 오래된 페이지 발견
  • 대량 인덱싱 요청 — CSV로 내보내고 IndexNow 프로토콜이나 Google Search Console URL 검사 워크플로에 URL을 일괄 제출
  • 규정 준수 및 접근성 — 정기적인 접근성(WCAG) 또는 개인정보 보호 검토를 위한 마스터 URL 목록 생성

사용 방법

  1. 탭을 선택하세요. URL에서가 가장 일반적인 경로입니다: 공개된 사이트맵 주소를 붙여넣으세요(대부분의 사이트는 /sitemap.xml에 하나를 게시합니다).
  2. URL이 인덱스 파일이라고 의심되는 경우 선택적으로 하위 사이트맵도 가져오기를 켜세요 — 도구가 각 자식 사이트맵을 따라가며 모든 URL을 병합합니다.
  3. 사이트맵이 비공개이거나 파일로 가지고 있는 경우 XML 붙여넣기 탭으로 전환하여 내용을 직접 붙여넣으세요.
  4. 사이트맵이 어디 있는지 모르시나요? robots.txt에서 찾기 탭을 사용하여 도메인만 입력하면 — robots.txt에 선언된 모든 Sitemap: 지시문을 나열합니다.
  5. URL 추출을 클릭하세요. 결과 테이블이 나타나며 그 위에 총 URL 수, 고유 도메인, 파일 확장자 분포 및 lastmod 범위를 보여주는 통계 패널이 표시됩니다.
  6. 필터 상자를 사용하여 부분 문자열(예: /blog/) 또는 정규 표현식(예: /^https:\/\/.+\.pdf$/)과 일치하는 URL만 유지하세요.
  7. 드롭다운으로 목록을 정렬하세요 — lastmod로 오래된 페이지를 발견하거나 가장 길거나 짧은 URL을 찾는 데 유용합니다.
  8. 결합된 하위 사이트맵에 중복이 포함된 경우 중복 제거를 켜세요.
  9. 모두 복사, TXT, CSV 또는 JSON 버튼을 사용하세요. CSV는 lastmod, changefreq 및 priority 열을 보존합니다.

AI 에이전트에서 이 도구를 사용하세요

무료 JSON API와 Model Context Protocol (MCP) 서버. 가입 불필요, API 키 불필요, CORS 개방. Claude, ChatGPT, Cursor, 스크립트, 프런트엔드 앱을 위해 설계되었습니다.

curl -X POST https://mate.tools/api/v1/sitemap-extract.php \
  -H "Content-Type: application/json" \
  -d '{"url":"https://example.com/sitemap.xml"}'
import urllib.request, json

req = urllib.request.Request(
    "https://mate.tools/api/v1/sitemap-extract.php",
    data=json.dumps({"url":"https://example.com/sitemap.xml"}).encode(),
    headers={"Content-Type": "application/json"},
)
with urllib.request.urlopen(req) as r:
    print(json.load(r))
const r = await fetch("https://mate.tools/api/v1/sitemap-extract.php", {
    method: "POST",
    headers: { "Content-Type": "application/json" },
    body: JSON.stringify({"url":"https://example.com/sitemap.xml"}),
});
console.log(await r.json());

claude_desktop_config.json(Claude Desktop), ~/.cursor/mcp.json(Cursor) 또는 다른 MCP 호환 클라이언트에 추가하세요:

{
  "mcpServers": {
    "mate-tools": {
      "command": "npx",
      "args": ["-y", "@mate-tools/mcp-server"]
    }
  }
}
API 문서 OpenAPI 3.1 npm 60건/분 · 600건/시간 · 본문 최대 1 MB

자주 묻는 질문

XML 사이트맵은 웹사이트가 검색 엔진이 알기를 원하는 모든 URL을 나열하는 파일입니다. 대부분의 사이트는 https://example.com/sitemap.xml에 게시하거나 robots.txt에 나열합니다. 잘 모르겠다면 robots.txt에서 찾기 탭을 사용하세요.

사이트맵 인덱스는 다른 사이트맵을 가리키는 사이트맵입니다 — 대규모 사이트는 URL을 여러 파일로 분할합니다. 이 도구는 둘 다 감지합니다. 인덱스를 제출하면 자식 사이트맵 목록을 받거나, 하위 사이트맵도 가져오기를 체크하여 모두를 하나의 결합된 URL 목록으로 확장할 수 있습니다(안전을 위해 50개의 하위 사이트맵으로 제한).

하드 캡은 없지만, 매우 큰 사이트맵(>100,000 URL)은 브라우저에서 렌더링이 느릴 수 있습니다. XML 파서 자체는 서버 측에 있으며 거대한 파일을 쉽게 처리합니다 — 느린 부분은 결과 테이블 렌더링뿐입니다.

XML에 있는 경우, 각 URL에 대해 <lastmod>, <changefreq><priority>를 읽습니다. 결과 테이블에는 lastmod가 표시되고, CSV/JSON 다운로드에는 세 열이 모두 포함됩니다. 사이트맵 인덱스 항목도 제공된 경우 lastmod를 노출합니다.

예 — 필터 상자에 부분 문자열(대소문자 구분 안 함)을 입력하거나 정규 표현식을 슬래시로 감싸세요(예: /\.pdf$/). 결과 카운터, 복사 및 다운로드 작업은 모두 활성 필터를 따르므로 관심 있는 부분만 추출할 수 있습니다.

이 도구는 HTTPS를 통해 익명으로 사이트맵을 가져오므로 비밀번호로 보호된, IP 제한된 또는 스테이징 사이트맵에는 직접 접근할 수 없습니다. 브라우저에서 파일을 열고 XML을 복사한 다음 XML 붙여넣기 탭을 사용하세요.

결과 도구 모음에서 중복 제거 스위치를 켜세요. 하위 사이트맵이 겹칠 때(언어 사이트맵 전체에 동일한 정규 URL을 다시 게시하는 다국어 사이트에서 흔함) 이는 필수적입니다.

예. 사이트맵은 공개 파일이므로 공개적으로 접근 가능한 사이트의 사이트맵은 분석 대상이 됩니다. 경쟁사의 콘텐츠 카테고리, 깊이 및 업데이트 빈도를 매핑하는 훌륭한 방법입니다.

아니요. 각 요청은 메모리에서 처리되고 페이지가 렌더링되는 즉시 폐기됩니다. 어떤 것도 로깅, 큐잉 또는 영구 저장되지 않습니다. 페이지를 새로고침하면 이전 추출은 사라집니다.

TXT(한 줄에 하나의 URL)는 명령줄 도구로 파이프하거나 폼에 붙여넣는 워크플로에 가장 좋습니다. CSV는 Excel/Sheets에서 직접 열리며 lastmod, changefreq 및 priority를 보존합니다. JSON은 스크립트(Python, Node 등)에 가장 친숙하며 라운드트립이 완벽합니다.