XML Sitemap Dizin Yapısı ve 50K Sınırı

SEOBAZ SEO 27 Nisan 2026
XML Sitemap Dizin Yapısı ve 50K Sınırı
⚡ ÖZET

XML sitemap dizin yapısı ve 50K sınırı yönetimi, arama motoru botlarına taranacak URL envanterinin doğru ve verimli şekilde bildirilmesi disiplinidir. Sitemap index mimarisi, içerik tipine göre segmentasyon, lastmod doğruluğu, 200 OK URL filtrasyonu ve namespace yapılandırması bu sürecin kritik bileşenleridir.

🧠 Bu Rehberi 5 Farklı AI ile Test Et

Her modelin GEO karakterine göre özel prompt hazırlandı. Tıkla, kopyalansın ve ilgili AI açılsın.

XML sitemap, arama motoru botlarına sitenin taranabilir URL envanterini sunan yapılandırılmış bir dizin dosyasıdır. 2026 itibarıyla tek bir sitemap dosyası maksimum 50.000 URL ve 50 MB sıkıştırılmamış boyut sınırına tabidir. Bu sınırların doğru yönetilmesi, tarama bütçesinin verimli kullanılmasının ve indeksleme hızının korunmasının teknik ön koşuludur.

XML Sitemap Protokolünün Teknik Temelleri

XML sitemap, sitemaps.org tarafından tanımlanan ve tüm büyük arama motorlarının desteklediği standart bir protokoldür. Dosya, <urlset> kök elemanı altında her bir URL'yi <url> etiketi içinde barındırır. Her URL kaydında <loc> (adres), <lastmod> (son güncelleme), <changefreq> (değişiklik sıklığı) ve <priority> (öncelik) alanları tanımlanabilir.

Bu alanların tamamı zorunlu değildir. <loc> tek zorunlu etikettir. <changefreq> ve <priority> alanlarını Google resmen görmezden geldiğini beyan etmiştir. Dolayısıyla bu iki etiketi doldurmaya zaman harcamak gereksizdir. Aksine <lastmod> etiketi, doğru ve güncel tutulduğunda botun tarama önceliklendirmesini doğrudan etkiler. Bu etiketin değeri, sayfanın gerçek son değişiklik tarihini yansıtmalıdır; her build'de otomatik güncellenen sahte tarihler, botun bu sinyale olan güvenini sıfırlar.

50.000 URL Sınırının Teknik Gerekçesi

Tek bir sitemap dosyasında 50.000 URL sınırı, protokolün tasarımcıları tarafından belirlenmiş bir üst limitdir. Bu sınır, botun dosyayı parse ederken tükettiği bellek ve işlem gücünü kontrol altında tutmayı amaçlar. 50 MB boyut sınırı da aynı mantıkla, ağ üzerinden aktarım süresini ve sunucu yükünü dengelemeye yöneliktir.

Pratikte 50.000 URL sınırına ulaşmadan çok önce performans sorunları başlayabilir. 40.000 URL içeren bir sitemap dosyasının sıkıştırılmamış boyutu, URL uzunluklarına bağlı olarak 50 MB sınırına yaklaşabilir. Dolayısıyla sınırı URL sayısı olarak değil, dosya boyutu olarak da izlemek gerekir. Dosya boyutunu kontrol etmek için ls -lh sitemap.xml komutuyla sıkıştırılmamış boyutu, gzip -k sitemap.xml && ls -lh sitemap.xml.gz komutuyla sıkıştırılmış boyutu görebilirsiniz.

Sitemap Index Dosyasının Mimarisi

50.000 URL sınırını aşan siteler, birden fazla sitemap dosyasını bir sitemap index dosyası altında gruplamak zorundadır. Index dosyası, <sitemapindex> kök elemanı içinde her bir sitemap dosyasının konumunu <sitemap> etiketiyle bildirir. Tek bir sitemap index dosyası da 50.000 alt sitemap referansı içerebilir. Bu yapı teorik olarak 2,5 milyar URL'nin yönetilmesine olanak tanır.

Index dosyasının yapısı şöyledir:

    
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://www.example.com/sitemap-posts.xml</loc>
    <lastmod>2026-04-10T08:00:00+03:00</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://www.example.com/sitemap-products.xml</loc>
    <lastmod>2026-04-12T14:30:00+03:00</lastmod>
  </sitemap>
</sitemapindex>       
    

Bu yapıda <lastmod> etiketi, alt sitemap dosyasının son güncellenme tarihini bildirir. Bot, bu tarihe bakarak hangi sitemap dosyasını yeniden işlemesi gerektiğine karar verir. Değişmeyen bir sitemap'in <lastmod> değeri sabit kalmalıdır.

İçerik Tipine Göre Sitemap Segmentasyonu

Sitemap dosyalarını içerik tipine göre ayırmak, hem yönetim kolaylığı hem de tarama davranışı analizi açısından kritik avantaj sağlar. Blog yazıları, ürün sayfaları, kategori sayfaları, görsel ve video içerikleri ayrı sitemap dosyalarında tutulmalıdır. Bu ayrım, Search Console'da her içerik tipinin indekslenme oranını bağımsız olarak izlemeyi mümkün kılar.

Önerilen segmentasyon yapısı şöyledir: sitemap-posts.xml blog ve makale sayfaları için, sitemap-products.xml ürün sayfaları için, sitemap-categories.xml kategori ve taksonomi sayfaları için, sitemap-images.xml görsel içerikler için. E-ticaret sitelerinde ürün varyasyonları ayrı URL'lere sahipse, bunları ana ürün sitemap'inden ayırıp sitemap-product-variants.xml olarak yönetmek, indeksleme durumunu daha net takip etmeye yarar.

Sitemap index dosyasının alt sitemap'lere dallandığını gösteren hiyerarşik ağaç diyagramı.

Lastmod Etiketinin Doğru Kullanımı ve Kötüye Kullanım Senaryoları

<lastmod> etiketi, botun tarama önceliklendirmesinde kullandığı en güçlü sitemap sinyallerinden biridir. Bu etiket, sayfada gerçek bir içerik değişikliği yapıldığında güncellenmelidir. Yalnızca bir navigasyon menüsü veya footer değişikliği, sayfa içeriğini değiştirmez ve <lastmod> güncellemesini gerektirmez.

En yaygın kötüye kullanım senaryosu, tüm URL'lerin <lastmod> değerini her build veya deployment sırasında otomatik olarak güncellemektir. Bu yaklaşım, botun <lastmod> sinyaline olan güvenini aşındırır. Bot, tüm tarihlerin aynı anda değiştiğini gördüğünde bu veriyi anlamsız kabul eder ve kendi tarama önceliklendirmesine döner. Lastmod değeri yalnızca gerçek içerik değişikliğinde güncellenmelidir. CMS tarafında bu kontrolü sağlamak için, yayın tarihinden bağımsız bir "içerik değişiklik tarihi" alanı tanımlamak ve sitemap oluşturucusunu bu alana bağlamak doğru yaklaşımdır.

Changefreq ve Priority Etiketlerinin Güncel Durumu

Google, <changefreq> ve <priority> etiketlerini resmi olarak görmezden geldiğini duyurmuştur. Bu etiketler, protokolün ilk versiyonunda tanımlanmış olsa da pratikte tarama davranışını etkilememektedir. Bot, bir sayfanın ne sıklıkla değiştiğini kendi tarama geçmişinden öğrenir; sitemapteki beyana güvenmez.

Dolayısıyla bu etiketleri sitemap dosyalarında tutmak zorunlu değildir. Kaldırılmaları, dosya boyutunu küçültür ve parse süresini kısaltır. 50.000 URL'lik bir sitemap'te her URL için <changefreq> ve <priority> etiketlerinin kaldırılması, dosya boyutunu ortalama %15-20 azaltır. Bu tasarruf, 50 MB sınırına yaklaşan büyük sitemap dosyalarında belirleyici olabilir.

Sitemap'te Yalnızca 200 OK URL'lerin Bulundurulması

Sitemap dosyasında yer alan her URL, tarayıcıya "bu sayfayı tara ve indeksle" mesajı verir. Bu dosyada 301 yönlendirmesi döndüren, 404 hata veren, noindex etiketi taşıyan veya canonical etiketi başka bir URL'ye işaret eden sayfaların bulunması, çelişkili sinyal üretir. Bot bu çelişkileri Search Console'da uyarı olarak raporlar.

Sitemap hijyeninin temel kuralı basittir: dosyada yalnızca 200 HTTP durum kodu döndüren, indekslenebilir ve kanonik olan URL'ler bulunmalıdır. Bu kuralı uygulamak için sitemap oluşturma sürecine bir doğrulama katmanı eklemek gerekir. Sitemap'i oluşturan script veya eklenti, URL'yi listeye eklemeden önce HTTP durum kodunu, meta robots etiketini ve canonical URL'yi kontrol etmelidir. Bu kontrol, özellikle dinamik sitemap üreten CMS yapılarında otomasyonla sağlanmalıdır.

Robots.txt ile Sitemap Bildirimi

Sitemap dosyasının konumu, robots.txt dosyasında Sitemap: direktifiyle bildirilir. Bu bildirim, botun sitemap keşfini hızlandırır. Search Console üzerinden sitemap göndermek bu bildirimin alternatifi değil, tamamlayıcısıdır. Her iki yöntemin birlikte kullanılması önerilir.

Robots.txt dosyasının en altına eklenen bildirim şu formatta olmalıdır:

    
Sitemap: https://www.example.com/sitemap-index.xml     
    

Birden fazla sitemap index dosyanız varsa, her birini ayrı satırda bildirin. Sitemap URL'sinin mutlaka tam (absolute) URL olması gerekir; göreceli (relative) yol kullanımı protokol tarafından desteklenmez. Ayrıca sitemap URL'sinin robots.txt ile aynı host üzerinde olması zorunludur; farklı bir subdomain veya domain'deki sitemap'i robots.txt'den bildiremezsiniz.

Dinamik ve Statik Sitemap Üretim Yaklaşımları

Sitemap dosyaları statik XML dosyaları olarak sunulabileceği gibi, her istekte dinamik olarak üretilip sunulabilir de. Küçük ve orta ölçekli sitelerde (10.000 URL altı) dinamik sitemap üretimi kabul edilebilir. Ancak büyük ölçekli sitelerde her bot isteğinde veritabanı sorgusu çalıştırarak sitemap üretmek, sunucu performansını olumsuz etkiler.

Büyük sitelerde önerilen yaklaşım, sitemap dosyalarını periyodik olarak (günde bir veya iki kez) statik dosya olarak oluşturup sunucu üzerinde cache'lemektir. WordPress'te Yoast SEO veya Rank Math eklentileri bu süreci otomatik yönetir. Özel CMS'lerde ise bir cron job ile sitemap'i XML dosyası olarak diske yazdırmak ve Nginx'te bu dosyayı doğrudan statik olarak sunmak en verimli yoldur. Bu yaklaşım, sitemap isteğinin veritabanına hiç dokunmamasını sağlar.

Gzip Sıkıştırma ile Sitemap Dosya Boyutunu Kontrol Altına Alma

XML sitemap dosyaları gzip ile sıkıştırılarak sunulabilir. Sıkıştırılmış dosyalar .xml.gz uzantısıyla adlandırılır ve tüm büyük arama motorları tarafından desteklenir. Tipik bir XML sitemap dosyası, gzip sıkıştırma ile %60-80 oranında küçülür.

Sıkıştırma, 50 MB boyut sınırına yaklaşan dosyalar için kritik bir çözümdür. Ancak dikkat edilmesi gereken nokta şudur: 50 MB sınırı sıkıştırılmamış boyut için geçerlidir. Sıkıştırma yalnızca aktarım süresini kısaltır, sınırı aşmanızı sağlamaz. Nginx'te sitemap dosyaları için gzip sıkıştırmayı etkinleştirmek için yapılandırmaya gzip_types application/xml text/xml; satırını eklemek yeterlidir. Alternatif olarak, sitemap'i önceden sıkıştırıp .xml.gz dosyası olarak sunmak da geçerli bir yaklaşımdır.

Namespace Tanımlarının Doğruluğu ve Yaygın Hatalar

XML sitemap dosyalarında namespace tanımı, dosyanın hangi protokol versiyonuna uygun olduğunu belirtir. Standart sitemap namespace'i http://www.sitemaps.org/schemas/sitemap/0.9 olarak tanımlanır. Görsel sitemap için image, video için video ve haber içerikleri için news ek namespace'leri gerekir.

En yaygın hata, namespace URL'sinde HTTPS kullanmaktır. Protokol tanımındaki URL HTTP olarak kalmalıdır; bu bir güvenlik açığı değil, XML şema tanımının parçasıdır. İkinci yaygın hata, birden fazla içerik tipi için gerekli namespace'lerin eksik bırakılmasıdır. Örneğin resim URL'leri içeren bir sitemap'te xmlns:image namespace'i tanımlanmamışsa, bot bu görselleri keşfedemez. Doğru namespace tanımı:

    
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
        xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">
    

Image Sitemap Entegrasyonu ve Görsel Keşif

Görsel içerikler, ana sitemap dosyası içinde <image:image> etiketi ile veya ayrı bir image sitemap dosyasında bildirilebilir. Her <url> etiketi altına maksimum 1.000 görsel tanımlanabilir. Bu entegrasyon, Google Görseller'de indeksleme hızını ve kapsamını doğrudan artırır.

Görsel sitemap yapısı şöyledir:

    
<url>
  <loc>https://www.example.com/makale-basligi</loc>
  <image:image>
    <image:loc>https://www.example.com/images/gorsel-adi.webp</image:loc>
  </image:image>
</url>
    

CDN üzerinden sunulan görsellerde <image:loc> etiketi CDN URL'sini işaret etmelidir. Ancak CDN domain'inin Search Console'da doğrulanmış olması veya ana domain'le aynı origin'de olması gerekir. Farklı bir domain'deki CDN görselleri, sitemap'te bildirseniz bile indekslenmeyebilir.

Video Sitemap Yapılandırması ve Zorunlu Alanlar

Video içerikler için ayrı bir video sitemap oluşturmak, video arama sonuçlarında görünürlüğü artırır. Video sitemap, standart sitemap'e xmlns:video namespace'i eklenerek veya bağımsız bir dosya olarak oluşturulur. Her video kaydında <video:thumbnail_loc>, <video:title>, <video:description> ve <video:content_loc> veya <video:player_loc> alanları zorunludur.

LinkedIn üzerindeki SEO topluluklarında paylaşılan veri analizleri gösteriyor ki, video sitemap kullanan sitelerin video snippet kazanma oranı, kullanmayanlara kıyasla ortalama 2,5 kat daha yüksek. Video süresini <video:duration> etiketi ile saniye cinsinden bildirmek, botun video içeriğini daha doğru kategorize etmesine yardımcı olur. YouTube embed kullanan sitelerde <video:player_loc> alanına YouTube player URL'si yerleştirilir; kendi hosting'inde video barındıran sitelerde ise <video:content_loc> alanına doğrudan video dosya URL'si girilir.

News Sitemap ve Google Haberler Entegrasyonu

Haber yayıncıları için Google News sitemap'i, standart sitemap'ten ayrı bir yapı gerektirir. News sitemap, son 48 saat içinde yayınlanmış makaleleri içermeli ve xmlns:news namespace'i ile tanımlanmalıdır. Bu sitemap'teki her kayıt <news:publication>, <news:publication_date> ve <news:title> alanlarını zorunlu olarak barındırmalıdır.

News sitemap'in standart sitemap'ten temel farkı zamansallıktır. 48 saatten eski içerikler bu dosyadan çıkarılmalıdır. Bot, news sitemap'i standart sitemap'ten çok daha sık tarar. Dolayısıyla bu dosyanın dinamik olarak üretilmesi ve her yeni haber yayınlandığında anında güncellenmesi şarttır. Statik üretim bu kullanım senaryosunda yetersiz kalır; CMS'in yayın anında news sitemap'i otomatik olarak güncellemesi gerekir.

Hreflang Sitemap Yapısı ile Çok Dilli URL Yönetimi

Çok dilli sitelerde hreflang etiketleri, HTML <head> bölümünde veya HTTP header'larında tanımlanabileceği gibi, sitemap dosyası içinde de bildirilebilir. Sitemap yöntemi, özellikle binlerce sayfası olan çok dilli sitelerde en ölçeklenebilir yaklaşımdır; çünkü her sayfanın HTML'ini düzenlemeye gerek kalmaz.

Hreflang sitemap yapısı, xmlns:xhtml namespace'i ile tanımlanır:

    
<url>
  <loc>https://www.example.com/tr/sayfa</loc>
  <xhtml:link rel="alternate" hreflang="tr" href="https://www.example.com/tr/sayfa"/>
  <xhtml:link rel="alternate" hreflang="en" href="https://www.example.com/en/page"/>
  <xhtml:link rel="alternate" hreflang="de" href="https://www.example.com/de/seite"/>
</url>
    

Her dil versiyonunun kendi <url> bloğunda tüm alternatifleri ve kendisini (self-referencing) listelemesi zorunludur. Bu çapraz referans eksik bırakıldığında, bot hreflang ilişkisini doğrulayamaz ve sinyali görmezden gelir. 10 dilli bir sitede her sayfa için 10 hreflang satırı gerekir; bu da sitemap dosyasının boyutunu hızla şişirir ve segmentasyon ihtiyacını artırır.

Büyük Ölçekli Sitelerde Sitemap Bölümleme Stratejisi

100.000 üzeri URL'ye sahip sitelerde sitemap yönetimi, yalnızca 50K sınırına bölmekten ibaret değildir. Bölümleme stratejisi, tarama önceliklendirmesi ve indeksleme takibi gereksinimlerine göre şekillenmelidir. İçerik tipine göre ayrım (yazılar, ürünler, kategoriler) temel katmandır. Ancak ölçek büyüdükçe zaman bazlı bölümleme de gerekli hale gelir.

E-ticaret sitelerinde etkili bir yaklaşım, ürün sitemap'lerini kategoriye veya ekleme tarihine göre alt dosyalara bölmektir: sitemap-products-electronics.xml, sitemap-products-fashion.xml veya sitemap-products-2026-q1.xml, sitemap-products-2026-q2.xml. Bu bölümleme, Search Console'da her segmentin indekslenme oranını bağımsız izlemeye olanak tanır. Bir kategorideki indeksleme oranı düşükse, sorun o segmente özel olarak araştırılır; site genelinde gereksiz zaman harcanmaz.

Search Console Sitemap Raporunun Yorumlanması

Search Console'daki Sitemap'ler raporu, gönderilen sitemap dosyalarının durumunu, keşfedilen URL sayısını ve indekslenen URL sayısını gösterir. "Gönderilen" ve "İndekslenen" arasındaki fark, sitemap hijyen sorunlarının en doğrudan göstergesidir.

Bu rapora Search Console > Sitemap'ler yolundan erişilir. Her sitemap dosyasının yanındaki "Durum" sütunu "Başarılı" olmalıdır. "Hata var" ibaresi, dosyada XML sözdizimi hatası, erişilemez URL veya desteklenmeyen format olduğuna işaret eder. Gönderilen URL sayısı ile indekslenen URL sayısı arasındaki fark %20'yi aştığında sistematik bir sorun vardır. Bu durumda indekslenmeyen URL'lerin neden dışarıda kaldığını, Kapsam raporundaki "Hariç tutulan" kategorileriyle çaprazlayarak tespit etmek gerekir.

Sitemap Ping ve Otomatik Bildirim Mekanizması

Sitemap dosyasını güncelledikten sonra arama motorlarına bildirim göndermek, taranma süresini kısaltır. Google'a ping göndermek için şu URL'ye GET isteği yapılır:

    
https://www.google.com/ping?sitemap=https://www.example.com/sitemap-index.xml
    

Ancak Google, 2023 itibarıyla ping mekanizmasının artık gerekli olmadığını ve robots.txt ile Search Console üzerinden yapılan bildirimlerin yeterli olduğunu açıklamıştır. Dolayısıyla ping, ek bir güvence katmanı olarak kullanılabilir ancak buna bağımlı kalınmamalıdır. CMS tarafında içerik yayınlandığında sitemap'i otomatik güncelleyip Search Console API üzerinden programatik bildirim göndermek, en güncel ve güvenilir yaklaşımdır.

WordPress Sitemap Yapılandırması ve Eklenti Seçimi

WordPress 5.5 sürümünden itibaren yerleşik bir XML sitemap özelliği sunmaktadır. Ancak bu yerleşik sitemap, segmentasyon esnekliği ve gelişmiş filtreleme seçenekleri açısından sınırlıdır. Yoast SEO ve Rank Math eklentileri, içerik tipine göre otomatik segmentasyon, noindex sayfaların otomatik filtrelenmesi ve sitemap dosya sayısı kontrolü gibi gelişmiş özellikler sunar.

Sahadaki gerçek tecrübemiz gösteriyor ki, WordPress'in yerleşik sitemap'i küçük bloglar için yeterli olsa da, 5.000 URL'yi aşan sitelerde Yoast SEO veya Rank Math'in sitemap modülüne geçmek operasyonel açıdan çok daha verimlidir. Eklenti ayarlarından her içerik tipinin sitemap'e dahil edilip edilmeyeceğini tek tek kontrol edin. Tag sayfaları, yazar arşivleri ve tarih bazlı arşivler genellikle ince içerik barındırır; bu sayfaları sitemap'ten çıkarmak, botun dikkatini değerli sayfalara yönlendirir.

Headless CMS ve Özel Sitemap Üretim Süreçleri

Headless CMS mimarilerinde (Next.js, Nuxt.js, Gatsby gibi framework'ler) sitemap üretimi, geleneksel CMS'lerden farklı bir süreç gerektirir. Bu yapılarda sitemap, build aşamasında statik olarak üretilir veya API üzerinden dinamik olarak sunulur. Build-time üretimde her deployment'ta sitemap yeniden oluşturulur; bu yaklaşım statik siteler için idealdir.

Next.js ile sitemap üretimi için next-sitemap paketi yaygın olarak kullanılır. next-sitemap.config.js dosyasında siteUrl, generateRobotsTxt ve exclude parametreleri tanımlanır. Bu yapılandırma, build sonrasında otomatik olarak segmentli sitemap dosyaları ve robots.txt oluşturur. ISR (Incremental Static Regeneration) kullanan sitelerde ise sitemap'in yalnızca build-time'da üretilmesi yetmez; yeni eklenen sayfaların sitemap'e dahil edilmesi için sunucu taraflı dinamik sitemap endpoint'i de tanımlanmalıdır.

Sitemap Dosyasının XML Doğrulaması ve Hata Ayıklama

Sitemap dosyasındaki tek bir XML sözdizimi hatası, dosyanın tamamının bot tarafından reddedilmesine neden olur. Kapanmamış bir etiket, yanlış kodlanmış bir özel karakter veya eksik bir namespace tanımı, tüm dosyayı geçersiz kılar. Bu nedenle her sitemap güncellemesinden sonra XML doğrulaması yapmak zorunludur.

Doğrulama için xmllint --noout sitemap.xml komutu en hızlı yöntemdir. Bu komut, XML sözdizimi hatalarını satır ve kolon numarasıyla raporlar. URL'lerde ampersand (&) karakteri en sık hata kaynağıdır; XML'de bu karakter &amp; olarak encode edilmelidir. Türkçe karakterler (ş, ç, ğ, ü, ö, ı) UTF-8 encoding ile sorunsuz çalışır, ancak dosyanın XML bildirimi <?xml version="1.0" encoding="UTF-8"?> satırını içermesi şarttır.

Sitemap'ten Hariç Tutulması Gereken URL Tipleri

Sitemap dosyasına dahil edilmemesi gereken URL tipleri, tarama bütçesini korumanın en doğrudan yoludur. Bu listeye dahil edilmesi gerekenler:

  • Noindex etiketi taşıyan sayfalar: Meta robots noindex direktifi olan URL'leri sitemap'e eklemek, botu "tara ama indeksleme" çelişkisine sokar ve gereksiz tarama isteği tüketir.
  • Canonical etiketi başka URL'ye işaret eden sayfalar: Kanonik olmayan URL'ler sitemap'te yer almamalıdır; bot bu sayfaları tarasa bile canonical hedefe yönlenecektir.
  • Parametre bazlı duplicate URL'ler: Sıralama, filtreleme ve session parametresi içeren URL'ler, ana sayfanın kopyalarıdır ve sitemap'i gereksiz şişirir.
  • Soft 404 ve ince içerikli sayfalar: İçerik değeri düşük, birkaç cümlelik veya boş sayfalar sitemap'ten çıkarılmalıdır; bu sayfaların indekslenmesi site geneli kalite skorunu düşürür.
  • Paginasyon sayfalarının derin katmanları: /page/2/ ve sonrası genellikle sitemap'te gereksizdir; içerikler zaten ana sitemap'te bireysel URL'leriyle yer almalıdır.

CDN ve Farklı Domain Üzerindeki Sitemap Erişim Kuralları

Sitemap dosyası, robots.txt ile aynı protocol ve host üzerinden sunulmalıdır. https://www.example.com/robots.txt dosyasında bildirilen sitemap, yalnızca https://www.example.com/ altındaki URL'leri içerebilir. Farklı bir subdomain'deki URL'ler (örneğin https://blog.example.com/) bu sitemap'te yer alamaz; o subdomain için ayrı bir sitemap ve robots.txt gerekir.

Sitemap dosyasının kendisi CDN üzerinden sunulabilir, ancak CDN URL'sinin ana domain'e alias olarak yapılandırılmış olması gerekir. Sitemap'in https://cdn.example.com/sitemap.xml adresinde olması, yalnızca bu adresin https://www.example.com/sitemap.xml ile aynı içeriği sunduğu ve robots.txt'den doğru bildirimin yapıldığı durumda geçerlidir. Aksi halde bot, farklı host'tan sunulan sitemap'i reddedebilir.

Sitemap Güncelleme Sıklığının Tarama Davranışına Etkisi

Sitemap dosyasının güncelleme sıklığı, botun o dosyayı ne sıklıkla kontrol edeceğini dolaylı olarak etkiler. Sık güncellenen sitemap dosyaları, botun tarama kuyruğunda daha yüksek öncelik alır. Ancak bu önceliklendirme, gerçek değişiklik içermeyen güncellemelerde geçersizdir. Bot, sitemap'i her kontrol ettiğinde değişiklik bulamazsa, kontrol sıklığını düşürür.

Doğru strateji, sitemap'i yalnızca gerçek bir URL ekleme veya çıkarma işlemi yapıldığında güncellemektir. Bu güncellemeyi, CMS'in yayın ve silme hook'larına bağlamak en tutarlı yöntemdir. WordPress'te save_post ve delete_post action'larına bağlanan bir fonksiyon, sitemap'i otomatik olarak yeniden oluşturabilir. Her güncelleme sonrasında <lastmod> değerinin yalnızca değişen alt sitemap dosyaları için güncellenmesi, botun değişmeyen dosyaları tekrar işlemesini önler.

Sitemap Denetiminin Aylık Teknik Kontrol Döngüsüne Dahil Edilmesi

Çoğu uzman aksini iddia etse de, sitemap yönetimi tek seferlik bir kurulum değil, sürekli bakım gerektiren bir süreçtir. İçerik eklendikçe, silindikçe ve URL'ler değiştikçe sitemap dosyasının bu değişiklikleri doğru yansıtması gerekir. Aylık teknik denetim döngüsünde sitemap kontrolü için üç temel adım uygulanmalıdır.

Birinci adım, sitemap'teki URL sayısını Search Console'daki indekslenmiş URL sayısıyla karşılaştırmaktır. İkinci adım, sitemap'teki URL'lerin tamamının 200 durum kodu döndürdüğünü toplu bir HTTP durum kodu kontrolüyle doğrulamaktır. wget --spider --force-html -i url-listesi.txt -o sonuc.log 2>&1 komutuyla bu kontrolü otomasyona bağlayabilirsiniz. Üçüncü adım, sitemap'te olmaması gereken URL tiplerinin (noindex, non-canonical, parametre bazlı) dosyaya sızıp sızmadığını kontrol etmektir. Bu üç adım, sitemap hijyenini sürdürülebilir kılar ve tarama bütçesinin değerli sayfalara yönelmesini garanti eder.

🚀 Şimdi Harekete Geçin

Bu rehberi teori olmaktan çıkar — 5 farklı AI ile test et veya ekibinle paylaş.

WhatsApp