Googleden Icerigi Kaldirma
Google'den İçerik Kaldırma
Bu sayfada kendi içeriğinizi (sayfa, site, görsel ve diğerleri) Google dizininden nasıl kaldırabileceğiniz hakkında bilgiler yer almaktadır. Bunun için, sitenizde bazı değişiklikler yapmanız ve sonra Google'ın sitenizi tekrar taramasını beklemeniz gerekir. Bu işlemi, Web Yöneticisi Araçları'ndaki URL kaldırma aracını kullanarak hızlandırabilirsiniz.
İçeriği kaldırmak veya arama motorlarının sitenizdeki içeriği taramasını engellemek için, aşağıdakilerden birini veya her ikisini kullanmanız gerekir:
- robots.txt dosyası. robots.txt dosyası web'i tarayan arama motoru robotlarının sitenize erişimini kısıtlar. (Not: Google, robots.txt tarafından engellenen içerik sayfalarını taramamasına veya dizine eklememesine karşın, URL'lerini web üzerindeki diğer sayfalarda bulduğu takdirde bu URL'leri dizine ekleyebilir.) Bir robots.txt dosyası kullanmak için sunucunuzun kök dizinine erişiminizin olması gerekir. robots.txt dosyası oluşturma hakkında daha fazla bilgi edinin.
- Noindex meta etiketi. Bir sayfada noindex meta etiketi gördüğümüzde, Google söz konusu sayfayı, diğer sayfalardan o sayfaya bağlantı olsa bile, arama sonuçlarımızdan tamamen çıkarır. İçerik şu an için dizinimizde bulunuyorsa, bir sonraki dizin taramasının ardından içeriği kaldırırız. Meta etiketi, sayfa bazında erişimi denetlemenize olanak sağlar; sunucunuzun kök dizinine erişiminiz yoksa bu faydalı olacaktır. (Sayfanızın kaynak HTML'sini düzenleyebilmeniz gerekir.)
1- Sitenin tamamını ya da bir dizinini kaldırma
Robotların sitenizi taramasına engel olmak için aşağıdaki yönergeyi robots.txt dosyanıza ekleyin:
User-agent: * Disallow: /
Sitenizi yalnızca Google'dan kaldırmak ve gelecekte yalnızca Googlebot'un sitenizi taramasına engel olmak için aşağıdaki yönergeyi kullanın:
User-agent: Googlebot Disallow: /
Her bağlantı noktasının kendi robots.txt dosyası olmalıdır. Özellikle hem http, hem de https üzerinden içerik sunuyorsanız bu protokollerin her biri için ayrı bir robots.txt dosyası gerekir. Örneğin, Googlebot'un dizine tüm http sayfalarını ekleyip https sayfalarını eklememesi için aşağıdaki robots.txt yönergelerini kullanmalısınız.
http protokolünüz için (http://sunucunuz.com.tr/robots.txt):
User-agent: * Allow: /
https protokolü için (https://sunucunuz.com.tr/robots.txt):
User-agent: * Disallow: /
Tüm robotların sitenizdeki bir sayfayı dizine eklemelerini engellemek için noindex meta etiketi kullanın. Aşağıdaki meta etiketini sayfanızın kısmına yerleştirmeniz gerekir:
<meta name="robots" content="noindex">
Sitenizdeki bir sayfanın diğer robotlar tarafından dizine eklenmesine izin verip yalnızca Google'ın robotlarını engellemek için:
<meta name="googlebot" content="noindex">
noindex meta etiketini görmek için sayfanızı taramamız gerektiğinden, küçük bir olasılık da olsa, Googlebot noindex meta etiketini görmeyebilir ve bu durumda etiketi dikkate alamaz. Sayfanız sonuçlarda görünmeye devam ediyorsa, bunun nedeni büyük olasılıkla siz etiketi eklediğinizden beri sitenizi taramamış olmamızdır. (Ayrıca, bu sayfayı engellemek için robots.txt dosyanızı kullandıysanız bu sayfaya erişemez ve etiketi göremeyiz.)
3- Görselleri kaldırma
Bir resmi Google'ın görsel dizininden kaldırmak için robots.txt dosyanıza bir yönerge ekleyin. Örneğin, sitenizin www.siteniz.com.tr/gorseller/kopekler.jpg adresinde görünen kopekler.jpg resmini hariç tutmak istiyorsanız, aşağıdaki yönergeyi robots.txt dosyanıza ekleyin:
User-agent: Googlebot-Image Disallow: /gorseller/kopekler.jpg
Sitenizdeki tüm görselleri dizinimizden kaldırmak için robots.txt dosyanıza aşağıdaki yönergeyi ekleyin:
User-agent: Googlebot-Image Disallow: /
Disallow kalıpları, herhangi bir karakter dizisiyle eşleşmek üzere "*" içerebilir ve kalıplar, bir adın sonunu belirtecek şekilde "$" ile bitebilir. Belirli bir dosya türündeki (örneğin .jpg dahil ancak .gif hariç) tüm dosyaları kaldırmak için aşağıdaki robots.txt girişini kullanabilirsiniz:
User-agent: Googlebot-Image Disallow: /*.gif$
Googlebot-Image, User-agent olarak belirtildiğinde, görseller Google Görsel Arama'dan çıkarılır. Görselleri (Google web arama ve Google Görseller dahil olmak üzere) tüm Google aramalarından çıkarmak istiyorsanız, User-agent Googlebot'u belirtin.
4- Önbelleği alınmış sayfa
Google, taradığı sayfaların otomatik olarak "anlık görüntüsünü" alır ve bu görüntüyü arşive ekler. Bu "önbelleğe alınmış" sürüm, orijinal sayfanın kullanılamaması (sayfanın web sunucusunun geçici olarak devre dışı kalması) durumunda kullanıcılarınızın web sayfasını görebilmesini sağlar. Önbelleğe alınmış sayfa kullanıcılara Google'ın sayfayı en son taradığı zamanki gibi görünür ve bunun önbellekteki sürüm olduğunu belirtmek için sayfanın başında bir mesaj gösteririz. Kullanıcılar arama sonuçları sayfasındaki "Önbellek" bağlantısını tıklayarak önbellekteki sürüme erişebilirler.
Başlamadan önce, aşağıdakilerden birini yapmalısınız:
- Bir sayfanın önbelleğe alınmış sürümünü güncellemek için sayfanın içeriğini değiştirin. Google, daha sonra sayfayı taradığında önbelleğe alınmış sürümü güncelleriz.
- Bir sayfanın önbelleğe alınmış sürümünü Google dizininden kaldırtmak ve Google'ın sayfayı daha sonra önbelleğe almasını önlemek için bu sayfaya arşivlenmemiş bir meta etiket ekleyin. Bu siteyi daha sonra taradığımızda, bu etiketi görür ve sayfayı kaldırırız.
Bu işlem tamamlandığında, Google sayfanın yeni sürümünü tarayana ve önbelleğe alana kadar, önbelleğe alınmış eski içeriğin kaldırılması için acil bir istekte bulunmak üzere Web Yöneticisi Araçları'ndaki URL kaldırma aracını kullanabilirsiniz.
Tüm arama motorlarının siteniz için "Önbellek" bağlantısını göstermesini engellemek üzere sayfanızın <HEAD> kısmına şu etiketi yerleştirin:
<meta name="robots" content="noarchive">
Yalnızca Google tarafından görüntülenmesini önlemek için aşağıdaki etiketi kullanın:
<meta name="googlebot" content="noarchive">
Not: Arşive alınmamış bir meta etiketinin kullanılması durumunda sayfanın yalnızca "Önbellek" bağlantısı kaldırılır. Google, sayfayı dizine eklemeye ve bir parça göstermeye devam eder.
5- Güncel olmayan sayfa veya bağlantı
Google tüm dizinini düzenli olarak günceller. Web taraması yaparken, yeni sayfaları otomatik olarak bulur, güncel olmayan sayfaları kaldırır ve mevcut sayfaların güncellemelerini yansıtır ve Google dizinini mümkün olduğunca yeni ve güncel tutarız.
Arama sonuçlarında sitenize ait güncel olmayan bağlantılar görünüyorsa bu sayfaların başlığında 404 (bulunamadı) veya 410 (gitti) durumunun görünmesini sağlayın. Bu durum kodları, Googlebot'a, istenen URL'nin geçerli olmadığını bildirir. Bazı sunucular var olmayan sayfalar için 200 (Başarılı) durumu döndürecek şekilde hatalı olarak yapılandırılmıştır. Bu, Googlebot'a istenen URL'lerin geçerli olduğunu ve dizine eklenmesi gerektiğini bildirir. Bir sayfa, http başlıklarında gerçek bir 404 hatası döndürürse, herhangi bir kişi web sayfası kaldırma isteği aracını kullanarak sayfayı Google dizininden çıkarabilir. Gerçek 404 hataları döndürmeyen güncel olmayan sayfalar, genellikle başka sayfaların kendileriyle bağlantıları kesildiğinde doğal olarak dizinimizin dışında kalacaktır.