Web’de bir şey aradığınızda arama motorları saniyeler içinde binlerce sonuç gösterir. Peki Google veya diğer arama motorları bu kadar fazla siteyi nasıl buluyor? İnternetteki milyarlarca sayfayı tek tek insanların kontrol etmesi mümkün değil. İşte tam bu noktada devreye
Web Crawler adı verilen sistemler girer.
Web crawler, internet üzerindeki sayfaları otomatik olarak gezen ve içerikleri keşfeden bot yazılımlardır. Arama motorları bu botlar sayesinde yeni açılan siteleri bulur, mevcut sayfaları kontrol eder ve içerikleri kendi veritabanına kaydeder.
Web Crawler Nedir?
Web crawler, kısaca interneti dolaşan bir
arama motoru botudur. Bu botlar bir web sayfasını ziyaret eder, sayfanın içeriğini inceler ve sayfadaki bağlantıları takip ederek başka sayfalara geçer.
Yani bir sayfaya girer, içindeki linkleri görür ve o linklere giderek yeni sayfaları keşfetmeye devam eder. Bu işlem sürekli tekrar ettiği için arama motorları internet üzerindeki içerikleri düzenli olarak takip edebilir.
Basit bir örnekle düşünürsek; bir web sayfasına giren crawler botu, sayfadaki menü linklerini, yazı linklerini ve diğer bağlantıları görür. Daha sonra bu bağlantılara giderek yeni sayfaları da tarar. Böylece site içerisindeki birçok sayfa kısa sürede keşfedilmiş olur.
Arama Motorları Siteleri Nasıl Tarar?
Arama motorlarının tarama süreci aslında birkaç basit adımdan oluşur.
Öncelikle botlar bilinen bazı web sitelerinden taramaya başlar. Bu sayfalar genellikle daha önce indekslenmiş sitelerdir. Bot sayfayı ziyaret ettikten sonra sayfanın HTML yapısını inceler ve içindeki bağlantıları tespit eder.
Bulduğu her bağlantı yeni bir sayfa anlamına gelir. Bot bu bağlantıları sıraya alır ve zamanla hepsini ziyaret eder. Ziyaret edilen sayfaların içerikleri analiz edilir ve uygun olanlar arama motorunun indeksine eklenir.
Kısaca süreç şöyle işler:
- Bot bir web sayfasına girer
- Sayfanın içeriğini ve kod yapısını inceler
- Sayfadaki linkleri tespit eder
- Bu linkleri takip ederek yeni sayfalara gider
- Uygun içerikleri arama motoru indeksine ekler
En Bilinen Crawler Botları
Her arama motorunun kendine ait bir tarama botu vardır. En bilinen crawler botları şunlardır:
- Googlebot
- Bingbot
- YandexBot
Bu botlar web sitelerini belirli aralıklarla ziyaret eder ve içeriklerde değişiklik olup olmadığını kontrol eder.
Kısacası
Web crawler aslında internetin görünmeyen gezginleridir. İnsanlar siteyi ziyaret etmeden önce genellikle ilk gelen misafir bu botlar olur.
Yeni bir sayfa yayınladığınızda, bir süre sonra bir crawler gelip kapıyı çalar, içeri bakar ve "bu sayfa arama sonuçlarına eklenebilir mi?" diye kontrol eder.
Kısacası internetin dev kütüphanesinde rafları düzenleyen görünmez kütüphaneciler gibi çalışırlar. Siz içerik üretirsiniz, crawler botları gelir, sayfayı keşfeder ve arama motorlarına haber verir.
Eğer siteniz düzgün bir yapıya sahipse bu küçük dijital gezginler yolu kolayca bulur ve sayfalarınız arama sonuçlarında yerini almaya başlar.