Veri çekilmesi belki şöyle engellenebilir:
Sayfa adreslerinde numara kullanmayın. Mesela forumda bu konunun adresine baktığımız zaman 1620446 yazdığını görüyoruz. Bu rakamdan sonraki kısımda yer alan kelimeler bulunmasa da bu konuya ulaşmak mümkün. Dolayısıyla bu forumdan veri çekmeye yönelik bir kod yazacak olursak bir for ... next veya while ... wend döngüsü ile BASIC programlama diliyle bile veri çekmek mümkündür. Eğer konu adresi numara olmadan bot-ile-veri-cekilmesini-engelleme.html şeklinde olsaydı bunu bir döngü yazarak hesap edemezdik.

Veri çekmenin bir diğer yolu da liste kullanmaktır. Mesela bir Türkçe sözlük sitesinden veri çekecek olursak Türkçe kelime listesi kullanarak veri çekmek mümkündür. Birçok yazılım konuların listelenmesi için indeks sayfaları oluşturmaktadır. Eğer bu indeks sayfalarının gizlenmesi ziyaretçilerin siteyi kullanmasına mani olmuyorsa sayfayı sadece arama motorlarına açık hâle getirebilirsiniz. Yalnız bunu yaparken user agent kontrolü kullanırsanız sahte botlar bu sayfalara yine erişebilir. Kısıtlamayı .htaccess ile veya php ile arama motorunun host adresine göre yaparsanız bu durumu önleyebilirsiniz. Aşağıdaki kodu sayfanın başına yerleştirirseniz host "google" içermediğinde sayfa boş olarak görüntülenir.
$botkontrol=gethostbyaddr($_SERVER['REMOTE_ADDR']);
if (strpos($botkontrol, "google")===FALSE) exit;

Burada "google" yerine Google tarafından ilan edilen host adresinin (veya adreslerinin) tamamını yazmak sayfaya başkalarının erişme riskini en aza indirebilir ancak sayfa zaten herkese boş görüntüleneceğinden ve kaynak kodu da ziyaretçiler göremediğinden bu kadarı bile yeterli olabilir.

Sayfa bu şekilde Google'a açık bırakıldığı için ön bellekten listenin bulunup kopyalanması mümkün olabilir. Buna karşı da <head> etiketinden sonra şu kodu yerleştirebilirsiniz:
<meta name="robots" content="noarchive">

Böylece google sayfayı aramalarda listelese bile ön bellekten sayfanıza erişilemez.

İlaveten robots.txt kullanıyorsanız ona erişimi de arama motorlarıyla sınırlandırmayı deneyebilirsiniz.