Robots.txt ayarları çok önemlidir. Arama sonuçları kısmında siteniz. com/feed, site. com/ page gibi arama motorları tarafından kopya gibi algılanabilecek kısımlar olur.(Kopya demeyelimde bunlar ana yazılarınızı vurgulamanızı kısıtlar. Onları da engelleyip indexleriniz arasına katmamalısınız.) Blog demişsiniz ben wordpress olduğunu varsayarak kendi robots.txt mi veriyorum size.
WordPress robots.txt örneği
# Google Image User-agent: Googlebot-Image Allow: / # Google AdSense User-agent: Mediapartners-Google* Allow: / # Google Adsbot User-agent: Adsbot-Google Allow: / # digg mirror User-agent: duggmirror Disallow: / # Archive User-agent: ia_archiver Disallow: / User-agent: * Disallow: /wp-admin/ Disallow: /wp-includes/ Disallow: /trackback/ Disallow: /feed/ Disallow: /comments/ Disallow: */trackback/ Disallow: */feed/ Disallow: */comments/ Disallow: /*? Disallow: /xmlrpc.php Allow: /wp-content/uploads/ Disallow: /page/* Disallow: /etiket/*/page Disallow: /etiket/*/page/ Disallow: /etiket/*/page/* Disallow: /etiket/*/page/*/ Disallow: /kategori/*/page Disallow: /kategori/*/page/ Disallow: /kategori/*/page/* Disallow: /kategori/*/page/*/
Üsttekine benzer kendi sitenize özel oluşturursunuz.(Ben garantici adamım. Biraz agrasiftir ama üstteki robots.txt sağlamdır 🙂 Mesela */page demişsek */page/ demeye gerek yok aslen ama ben birkaç sıkıntı yaşadım ondan ekledim. Ekleyin sizde garanti olsun) Sitemapı ben buraya eklemedim zaten webmaster tools’ tan ekli. Bu oradan ekli değilse ve farklı hedef arama motorları varsa onlara yol gösteriyor.
Yani siz isterseniz şunuda robots.txt dosyasında en alta eklersiniz;
Sitemap: http://….
Sorunuz olursa burdan iletirseniz elden geldiğince yardımcı olmaya çalışırız.
Yunus Emre KARTAL
Bu robot.txt dosyası bir film sitesi için uygunmudur ?
cryptosam
Disallow: /etiket/*/page
kısmından altını kendi sitenize göre oluşturacaksınız. İsterseniz etiket satırının üstü tüm wordpress siteler için kullanılabilir.
Serkan
Merhaba Hocam size sormak istediğim farklı bir konu var araştırdım yalnız bir türlü bulamadım. webcache olayını bilirsiniz. En son ne zaman indexlendiğinizi gösteren bir google aracı. Ben 1 hafta önce indexlenmiştim yalnız nasıl olduysa beni 12 önceki index aldığım güne dönderdi nedendir acaba?
cryptosam
Bu kadar takıntı yapmayın bu web cache vs olaylarına. İçeriğinizi girmeye bakın derim .
ahmet
bu şekilde Disallow: /etiket/*/page
olunca etiketlerin indexlenmesini engellemiş olmuyor muyuz acaba ?
cryptosam
Hayır engellenmiyor. Etiketleri sayfalayınca page kısımlarını indexleme demek istiyorsun botlara orda. Yapıya göre özelleştirmek gerek.
/tag/*/page
vs gibi.
unal
merhabalar.
benim sitede robot.txt yok :S yada ben bulamadım. yardımcı olurmusunuz robot dosyası nerede olur site panelımde ve yok ise olusturup nereye atmalıyım dosyayı wordprees kullanıyorum bu arada.
cryptosam
ana dizinde sitenoktacom/robots.txt de olur. Yoksa manuel oluşturursunuz orada.
secmasterz
sitenizi kelime bazlı bir konu araştırıken gördüm ve yazılarınız gerçekten özgün ve yararlı bilgiler aktarıyorsunuz.Güzel bir kaynak olarak sitenizi takipteyim.Teşekkürler.
cryptosam
Teşekkürler görüşünüz için.
ertan
Bu robots.txt dosyasını attığımızda daha önceki indexlenen konuları kapsar mı yoksa bundan sonrakiler için mi geçerli. Birde benim attığım video resimleri yaıdan önce çıkıyor oda saçma biryeri açıyor. bunu nasıl engellerim acaba?
cevap verirseniz çok sevinirim.
cryptosam
Daha önce değil tüm konuları kapsar. Bunu kendi sitenize göre ayarlayıp atmalısınız. Video resimleri olayı eğerki etiket ise sitemap ayarlarından etiketin değerini azaltmalısınız. Yani yazılar 0.9 ise etiketler 0.9 dan alt değer olmalı. Muhtemelen sizde üstte etiketler çıkıyor ve sorun bu.
ilhami karakoc
hocam ben bunu direk kullansam sorun olmaz demi.. ekleme yapcagim bir yer varsa sölermisin
Hakan Yerlikaya
Cryptosam içerik paylaşmıyorsun artık?
cryptosam
En yakın zamanda yeni içerikler geliyor. Geçmiş içerikleri düzenleyip güncellemeye çalışıyorum şu sıralar.