Ekstraktor URL Sitemap | Wydobądź URL-e szybko
Ekstraktor URL Sitemap wydobywa adresy URL z pliku sitemap.xml. Użyteczny do analizy SEO, audytów treści i przeszukiwania stron. Podaj adres URL sitemapy, a otrzymasz listę URL-i do wykorzystania w projektach.
Prywatność: To narzędzie obsługuje zarówno zwykłe mapy witryny, jak i pliki indeksu map witryny. Nic, co przesyłasz, nie jest przechowywane na naszych serwerach — wyniki znikają po zamknięciu karty.
Kluczowe funkcje
- Trzy tryby wprowadzania: wklej URL mapy witryny, wklej surowy XML lub automatycznie wykryj mapy witryny z robots.txt domeny
- Rekurencyjne rozwijanie indeksu map witryny — pobierz do 50 podrzędnych map witryny jednym kliknięciem i połącz każdy URL w jedną listę
- Metadane na URL: lastmod, changefreq i priority wyodrębniane z XML, gdy są obecne
- Filtr na żywo (fragment tekstu lub /regex/) plus sześć trybów sortowania (A→Z, Z→A, najdłuższy, najkrótszy, najnowszy lastmod, domyślny)
- Usuwanie duplikatów jednym kliknięciem, gdy ten sam URL pojawia się w wielu podrzędnych mapach witryny
- Statystyki na pierwszy rzut oka: łączna liczba URL-i, unikalne domeny, podział na rozszerzenia plików, zakres dat lastmod
- Pobierz wynik jako TXT (jeden URL na linię), CSV (ze wszystkimi kolumnami metadanych) lub JSON
- Skopiuj pełną listę, tylko widoczną odfiltrowaną listę lub dowolny pojedynczy URL jednym kliknięciem
- Obsługuje ogromne mapy witryny (50 000+ URL-i) dzięki parsowaniu po stronie serwera i wirtualizowanej tabeli wyników
- Bezpłatne, bez rejestracji, bez konta, bez logowania — przydatne do audytów SEO, migracji, przygotowania do scrapowania i badania konkurencji
Popularne przypadki użycia
- Audyty SEO — szybko zinwentaryzuj każdy URL, który strona udostępnia wyszukiwarkom
- Migracje witryn — wygeneruj pełną listę URL-i do mapowania przekierowań przed ponownym uruchomieniem na nowej domenie lub CMS
- Badania konkurencji — przeskanuj publiczną mapę witryny, aby zrozumieć zasięg treści konkurenta, kategorie i częstotliwość aktualizacji
- Przygotowanie do crawlowania — przekaż URL-e do Screaming Frog, Sitebulb, niestandardowych skryptów Pythona lub dowolnego narzędzia do sprawdzania HTTP
- Audyty linkowania wewnętrznego — połącz listę URL-i z arkuszem audytu treści, aby znaleźć osierocone strony
- Analiza luk w treści — porównaj swoją mapę witryny z mapą konkurenta, aby odkryć luki tematyczne
- QA nowego wydania — zweryfikuj, czy CMS generuje oczekiwaną mapę witryny po wdrożeniu
- Inwentaryzacja lastmod — wyłap nieaktualne strony, sortując kolumnę lastmod i identyfikując wpisy, które nie były aktualizowane od lat
- Masowe żądania indeksowania — wyeksportuj do CSV i prześlij URL-e w partiach do protokołu IndexNow lub procesu inspekcji URL w Google Search Console
- Zgodność i dostępność — wygeneruj główną listę URL-i do okresowych przeglądów dostępności (WCAG) lub prywatności
Jak korzystać
- Wybierz kartę. Z adresu URL to najczęstsza ścieżka: wklej dowolny publiczny adres mapy witryny (większość witryn publikuje go pod
/sitemap.xml). - Opcjonalnie przełącz Pobierz także podmapy witryny, jeśli podejrzewasz, że URL jest plikiem indeksu — narzędzie podąży za każdą podrzędną mapą witryny i połączy każdy URL.
- Jeśli twoja mapa witryny jest prywatna lub masz ją jako plik, przełącz na kartę Wklej XML i wklej zawartość bezpośrednio.
- Nie wiesz, gdzie jest mapa witryny? Użyj karty Znajdź przez robots.txt i po prostu wprowadź domenę — wyświetlimy każdą dyrektywę Sitemap: zadeklarowaną w robots.txt.
- Kliknij Wyodrębnij adresy URL. Tabela wyników pojawi się z panelem statystyk powyżej, pokazującym łączną liczbę URL-i, unikalne domeny, podział na rozszerzenia plików i zakres lastmod.
- Użyj pola filtra, aby zachować tylko URL-e pasujące do fragmentu tekstu (np.
/blog/) lub wyrażenia regularnego (np./^https:\/\/.+\.pdf$/). - Posortuj listę za pomocą rozwijanego menu — przydatne do wykrywania nieaktualnych stron według lastmod lub znajdowania najdłuższych/najkrótszych URL-i.
- Przełącz Usuń duplikaty, jeśli połączone podmapy witryny zawierały duplikaty.
- Użyj przycisków Kopiuj wszystko, TXT, CSV lub JSON. CSV zachowuje kolumny lastmod, changefreq i priority.
Najczęściej zadawane pytania
Mapa witryny XML to plik, który zawiera każdy URL, o którym witryna chce poinformować wyszukiwarki. Większość witryn publikuje swoją pod adresem
https://example.com/sitemap.xml lub wymienia ją w robots.txt. Użyj karty Znajdź przez robots.txt, jeśli nie masz pewności.Indeks map witryny to mapa witryny wskazująca inne mapy witryny — duże witryny dzielą swoje URL-e na wiele plików. To narzędzie wykrywa oba. Jeśli prześlesz indeks, możesz otrzymać listę podrzędnych map witryny lub zaznaczyć Pobierz także podmapy witryny, aby rozwinąć je wszystkie w jedną połączoną listę URL-i (limit 50 podmap witryny dla bezpieczeństwa).
Nie ma sztywnego limitu, ale bardzo duże mapy witryny (>100 000 URL-i) mogą wolno renderować się w przeglądarce. Sam parser XML działa po stronie serwera i z łatwością obsługuje ogromne pliki — wolna część to tylko renderowanie tabeli wyników.
Gdy są obecne w XML, odczytujemy
<lastmod>, <changefreq> i <priority> dla każdego URL. Tabela wyników pokazuje lastmod, a pobrania CSV/JSON zawierają wszystkie trzy kolumny. Wpisy w indeksie map witryny również ujawniają swój lastmod, gdy zostanie podany.Tak — wpisz dowolny fragment tekstu (bez rozróżniania wielkości liter) w polu filtra lub umieść wyrażenie regularne między ukośnikami (np.
/\.pdf$/). Licznik wyników, akcje kopiowania i pobierania uwzględniają aktywny filtr, więc możesz wyodrębnić tylko interesujący cię fragment.To narzędzie pobiera mapy witryny anonimowo przez HTTPS, więc mapy chronione hasłem, ograniczone IP lub stagingowe nie są bezpośrednio dostępne. Otwórz plik w przeglądarce, skopiuj XML i użyj karty Wklej XML.
Przełącz przełącznik Usuń duplikaty na pasku narzędzi wyników. Gdy podmapy witryny się nakładają (częste w witrynach wielojęzycznych, które ponownie publikują ten sam kanoniczny URL w mapach witryn językowych), jest to niezbędne.
Tak. Mapy witryn są plikami publicznymi, więc mapa witryny dowolnej publicznie dostępnej strony jest uczciwym źródłem do analizy. To doskonały sposób, aby zmapować kategorie treści konkurenta, ich głębokość i częstotliwość aktualizacji.
Nie. Każde żądanie jest przetwarzane w pamięci i odrzucane, gdy tylko strona zostanie wyrenderowana. Nic nie jest logowane, kolejkowane ani utrwalane. Przeładuj stronę, a poprzednia ekstrakcja zniknie.
TXT (jeden URL na linię) jest najlepszy do przesyłania potokowo do narzędzi wiersza poleceń lub przepływów wklejania do formularzy. CSV otwiera się bezpośrednio w Excel/Sheets i zachowuje lastmod, changefreq i priority. JSON jest najprzyjaźniejszy dla skryptów (Python, Node itp.) i idealnie obsługuje cykl odczytu i zapisu.