abirisebil adlı üyeden alıntı: mesajı görüntüle
İnternet üzerindeki araçlar maalesef bu iş için yeterli değil. LSI programları genelde, yakın anlam ilişkisindeki kelime öbeklerini LSI gibi sunuyor. Reçel örneğinde, herkes marmelat kelimesini, reçel için LSI zannediyor. Ancak bu kelimeler arasındaki ilişki LSI değil, yakın anlam ilişkisidir.

Google için, yakın anlam ilişkisi ile, LSI farklı verilerdir.

Bu nedenle kendi çabamla buluyorum. Ancak verileri yine Google'dan alıyorum. Yakın ilişkili kelimeleri ve sıralamada çıkan sonuçlarını kendi oluşturduğum database'e kaydediyorum. Daha sonra, geniş öbekli sorguları ufak bir programcıkla tetikliyorum. Yaklaşık arama sonuçları tetiklendikten sonra, Semantic Static sonuçlarına göre derliyorum. Bu yöntem şuana kadar bulduğum en iyi yöntem. Yanılma payının ne olduğunu henüz ölçemedim. Çünkü bunu ölçebilecek bir veriyi Google bizimle paylaşmıyor.
@abirisebil Usta,

Buraya kadar yazdıklarınızdan çıkardığım sonucun, sorumla ilgili olacak kısmını anladığım kadarı ile özetleyecek olursam; yakın anlam ilişkisi olan kelimelerle, LSI kelimelerinin aynı şey olmadığı sonucuna varıyorum. Yorumunuzda, LSI programlarının, daha çok yakın anlam ilişkisindeki kelime öbeklerini sunduğunu belirtmişsiniz. Bu sonucu "Google için, yakın anlam ilişkisi ile, LSI farklı verilerdir." cümlenizden çıkarıyorum.

LSI kelimeleri çıkarmak için kendi yazdığınız uygulama "öbeklerinden" yararlandığınızı anlatmışsınız. Ben de buna benzer bir uygulama öbeği yazma hevesi içindeyim. Anladığım kadarı ile sizin kullandığınız tam anlamı ile bir kelime işlemcisi uygulaması, ben haddimi bilerek küçük bir başlangıç yapmak istiyorum sadece konuya...

"Yakın ilişkili kelimeleri ve sıralamada çıkan sonuçlarını kendi oluşturduğum database'e kaydediyorum." Database'e aldığınız yakın ilişkili kelimeleri anladım(ancak bu yakın ilişkili kelimeleri curl gibi bir dille otomatik olarak mı çekiyorsunuz? yoksa bu kelimeleri manuel olarak database kendiniz mi ekliyorsunuz?) ancak "sıralamada çıkan sonuçlarını" derken neyi kastettiğinizi anlayamadım, bu kısmı biraz açabilir misiniz? Buraya kadar kelimeleri database e attığımızı düşünüp soruma devam ediyorum. Database de yakın ilişkili ve sıralamada çıkan sonuçlardan(bunların ne olduğunu şu an için anlamamış olsam da...) elde ettiğimiz kelimelerimiz mevcut.

"Daha sonra, geniş öbekli sorguları ufak bir programcıkla(burada "geniş öbekli sorguları" derken, aLKaDraZ Ustanın bahsettiği algoritmaların formüllerinden yazdığınız scriptleri mi kastediyorsunuz?) tetikliyorum. Yaklaşık arama sonuçları tetiklendikten sonra, Semantic Static sonuçlarına göre derliyorum." Burada "geniş öbekli sorgular", "bir programcıkla tetikliyorum"(kısmını anlayamadım, LSI kelimeleri bu aşamada mı elde ediyorsunuz? yoksa bir sonraki aşamada mı?), "Semantic Static sonuçlarına göre derliyorum". Sakıncası yoksa, bu kısımla ilgili olarak yaptıklarınızı, ya da bu tarz bir uygulama geliştirmek isteyen arkadaşlara yol göstermek için, yararlı olacak detayları bizlerle paylaşmanız mümkün mü acaba?


Konunun sadece abirisebil Ustanın omuzlarına yıkılmamasını umut ediyorum, gerçi kendisi iyi niyetle, bıkmadan, usanmadan sorularımızı detaylı bir şekilde cevaplıyor ancak, aLKaDraZ, digiklan, NeLph, delphi911... gibi ustaların da konuya, abirisebil ustaya destek olmalarını rica ediyorum. İlginiz ve anlayışınız için şimdiden teşekkürler.