• 26-10-2008, 05:22:51
    #1
    İnternette çoğu site , arama sonuçlarında, gözükmesini istemediği, gizli kalmasını istediği, bazı dosyaları, sayfaları robots.txt ile gizlerler..


    bu sitelerin gizli bölümlerine yine robots.txt araması ile ulaşabilirsiniz ,


    şimdi, önce google arama motorunu açıyoruz ve arama kısmına aşağıdaki kelimeleri , kopyala yapıstır yaparak ekliyoruz

    "robots.txt" "disallow:" filetype:txt

    arama sonucunda çıkan sitelerin robots.txt 'lerinin "disallow" yazan kısımındakiler gizli olanlardır....


    örnek arama..


    örnekte white house kullanılmış,


    istediğiniz klasörü açmak için kopyala yapıştır ile seçim yapın ve açın, işte sonuçlar


    işte sonuçlar


    yani sizde web dedektifi olabilirsiniz

    alıntı; How To Find Secret Sites And Articles
  • 26-10-2008, 09:26:29
    #2
    Üyeliği durduruldu
    bilmem ki, bende yapabilir miyim acaba?
  • 26-10-2008, 09:43:58
    #3
    daha önce eğlenmek için kullandığım bir yöntemdi , Teşekkürler..
  • 30-01-2009, 20:42:41
    #4
    Arkadaşlar ben de birkaç ekleme yapayım bu bilgilere :
    Robot engelleme standardı, (aynı zamanda Robot engelleme protokolü veya robots.txt olarak da bilinir) web böceği (ing web spawler) veya web örümceği (ing. web spider) gibi yazılımların web sunucularının kamuya açık bölümlerinin tamamına veya bir kısmına erişimini engellemeye yarayan bir standarttır. Genelde web sitelerini sınıflandırmak ve arşivlemek amacı ile arama motorları ya da düzeltişmiş kaynak kodları için site yöneticileri robotları kullanırlar. Robotlar bu işlem sonucunda web siteleri için site haritaları oluştururlar.
    Bir web sitesinin kodunda bulunan robots.txt isimli dosya, robotlara yaptıkları indeksleme çalışmalarında o sitenin tamamını veya belirli bir bölümünü indekslememesini ( göz ardı etmesini) talep eder. Örneğin, web sitenizde arama motorunda çıkmasını istemediğiniz mahrem bilgiler olabiliceği gibi ya da sitenizdeki belirli bir içeriğin arama motorlarında çıkmasının sitenin bütününü yanlış tanıtacağı ya da yanlış anlaşılmalara yol açabiliceği durumlarda olabilmektedir. Bu gibi durumlar dosyanın kullanım amaçlarından bazı örneklerdir.
    Birçok alt-domain'i bulunan web siteleri için , her bir alt-domain kendine ait bir robots.txt dosyasına sahip olmalıdır. Örneğin ;
    example.com domain'i kendine ait bir robots.txt dosyasına sahipse, fakat a.example.com altında bu dosya yok ise, arama motoru robotları olmayan siteyi arama sayfalarında tarama yaptıysa, listeleyecektir.
    Bu protokol tamamen tavsiye niteliğinde, isteğe bağlı olması rağmen, web robotlarının bu protokolü uygulamasına ihtiyaç duymaktadır. Yani sitenize bir robots.txt dosyası koymanız, mahremiyetinizi garanti altına almamaktadır. Bazı web site idarecileri robots dosyalarını web sitelerinin özel bölümlerini tüm dünyaya görünmez yapmak için kullanmayı denediler fakat dosyanın kamuya açık olması gerekmekteydi ve dosyanın içeriği bir web tarayıcısı olan herkese açıktı.
    Robots.txt dosyası için herhangi bir resmi standart kurum ya da RFC (İng. Reguest For Comments - internet ve internetin çalışması ile ilgili metodlar araştırmalar ve bilgilerin bulunduğu dökümanlar arşivi) yoktur. Sadece bir robot mail grubu olan robots-request@nexor.co.uk üyeleri tarafından 30 Haziran 1984 tarihinde ulaşılmış bir fikir birliğinden ibarettir.Robotlar tarafından erişilmesinin istenmediği bölümlerin bulunduğu robots.txt dosyası, siteinin kök dizininde bulunmalıdır.
  • 31-01-2009, 01:38:33
    #5
    Teşekkürler değişik bir bilgi.
  • 31-01-2009, 01:43:47
    #6
    bilgi için çok sağol bunları uzun zamanlar önce kullanırdık ama gösterdiğin şekilde hala robots.txt yapan varsa yanlış en basit bir örnek size:

    Disallow: /gizliyer/

    yerine

    Disallow: /giz?

    korsanız bunlardan bir nebze olsun kurtul olursunuz.

    Bunlara ek olarak ta sallama bir çok klasor ve dosya adı girerseniz bir nevi yanıltmaca yapmış olursunuz.

    Bunlarıda geçtim gizli ve güvenlikli olmasını istediğiniz klasörlere ayrıca plesk gibi panellerden şifreleme verebilirsiniz buda ayrıca olursa bir adım daha sağlıklı olacaktır.

    Kolay gelsin...
  • 31-01-2009, 01:46:35
    #7
    Güzeş bilgi sağol.

    Zaten robots.txt spiderların o sayfayı indexlememesi için var.

    Kullanıcılardan gizli olsun diye değil.
  • 31-01-2009, 16:33:37
    #8
    İlginç
  • 31-01-2009, 17:48:00
    #9
    Üyeliği durduruldu
    bu kelimeyi sadece türk sitelerinde arama seçeneği ile aratın 3. sırada r10 var