Official Google Webmaster Central Blog: Crawling through HTML forms adresindeki makaleyi çevirdim. İleri derecede Seo ile ilgilenenler için yararlıdır.
Google bugünlerde indexleme konusunda yeni arttırımlar içerisinde. Javascript ve Flash içeriklerdeki linkleri takip edebildiğimiz gibi HTML formlar üzerine de çalışmalara başladık
Geçtiğimiz birkaç ayda, HTML formları takip ederek yeni sayfalar keşfedilmesi üzerine çalışmalar yaptık. Özellikle yüksek kalitede sitelerde <form> tagını gördüğümüzde birkaç sorguyla formun içeriğini araştırıyorduk. Text-box'lar için bilgisayarlarımız form'lar için genel kullanılan kelimeleri seçerek dğer check-box, seçim-menü vb. içinse HTML'den faydalanıyorduk. Seçtiğmiz bu değerlerle sorgular oluşturarak yönlendirilen sayfalrı değerlendiriyorduk. Eğer içerik konusunda eminsek, ilginç ve biz de olmayan bir içerikse arama sonuçlarımız arasına ekleyebiliyorduk
Bu deney bizim için iyi bir deneyim oldu. Sadece küçük sayıda web sitesi bu deneyden yararlandı. tabii ki robots.txt dosyasına hep sadık kaldık. Eğer form bu dosyada yasaklanmışsa bunu indexlemedik. Ayrıca sadece GET formlarını ve kişisel bilgi içermeyen formları dikkate aldık. Örneğin şifre alanları olanları ve ""kullanıcı adı, iletişim" gibi genel kelimeleri içeren formlara dokunmadık.
Keşfettiğimi sayfalar web sayfa ağımıziçin çok fazla bir büyüklük değil henüz . Ayrıca diğer sayfalar için pagerank bakımından bir değişikliğe yol açmadı. Tabii ki de diğer sayfaların indexlenme sayısı vb. konularını da değiştirmedi
Bu deneyin amacı Google'ın internet üzerinde kapsama alanını genişletmesi için bir adımdı. Aslında HTML formlar arama motorları için çok büyük veri kaynağı olabilirler. Derin web, Gizli web, görünmez web bu şekilde ortaya çıkarmayı planlıyoruz.HTML formları açarak (tabii ki robots.txt dosyasına sadık kalarak) kolay kolay bulunamayacak dökümanlara ulaşılabilirliği arttırmak istiyoruz. Hem kullanıcılara hem webmasterlara yeni bir arama deneyimi sağlıyoruz.