vuralcan adlı üyeden alıntı: mesajı görüntüle

Gözlük Çerçevesi kelimesine çalışıyorsak...
Çerçevesi
çerçevesi
cercevesi
CERCEVESİ
Ya kullanıcı gozluk çerçevesi ararsa? "gözlük cercevesi", "gozluk cerceve", "gözlük çerçeve", "gözlüğü cercevesi", "gozluk cercevesi", "gözlüğünün çerçevesi" .... ne kadar çok yazım yanlışı ve farklı şekillerde yazım yapılabilir değil mi? Bunların hepsini yazacak mısınız.

Bir arama motoru olarak da bunları düşünmek zorundasınız. Sorgu n-gramlara ayrılır. "gözlük çerçevesi" bigramdır, gözlük ve çerçeve unigramdır. sorguya bağlı özellik oluşturmada geleneksel TF-IDF gibi yöntemler kullanılır. yani "gözlük" ve "çerçeve" ayrı ayrı unigram olarak da ele alınıyor.

Semantik olmayan yöntemde "gözlük çerçevesi" bigramının tüm karakterleri karakter gruplarına ayrıştırılıyor. Ardından bu karakterlerle diğer sorgunun karakterleri karşılaştırılır ve eşleşme oranı belli yüzdenin üzerindeyse devam edilir. Yani bu yöntemde "gozluk cercevesi" ile "gözlük çerçevesi" nin aynı kelime olduğuna karar verilir. Bu daha semantik olayını işin içine katmadan ilkel olarak kullanılan yöntemlerden biridir. Yani gozluk cercevesi eşittir gözlük çerçevesi. Doğru şeklinini kullanın. Çünkü karşılaştırma her zaman doğru şekli ile yapılacaktır. Sıra bulucunun ne bulduğu önemli değil.

vuralcan adlı üyeden alıntı: mesajı görüntüle
keywords da nasıl çalışmalıyız.
Oraya şiir bile yazsanız dikkate almıyoruz (John Mueller 15 şubat
hangout)