• 26-08-2017, 02:30:23
    #1
    Arkadaşlar selam,

    Basit bir tool ihtiyacımız bulunuyor. İlgili anahtar kelimelerde arama sonuçlarında çıkan sitelerin ortalama kelime sayılarını çekmek istiyoruz. İlgilenen arkadaşların mesajlarını bekliyoruz.
  • 26-08-2017, 03:06:25
    #2
    Kimlik doğrulama veya yönetimden onay bekliyor.
    Merhaba
    Biraz daha detay anlatır mısınız ? Tam istenileni anlayamadım kusura bakmayın. Tam olarak neredeki kelimelere bakacaksınız ? Küçük bir uygulamalı anlatımınız olabilir mi ?
    Dilerseniz özel mesaj aracılığı ile iletişimde kalabiliriz.

    Teşekkürler.
  • 26-08-2017, 11:50:09
    #3
    Merhaba;
    Aynı pm den bende alabilirmiyim ?
  • 26-08-2017, 12:53:07
    #4
    pmler gönderildi
  • 26-08-2017, 13:57:42
    #5
    Basit bir tool dediğiniz google ı crawl ettirmek oluyor.

    Daha önce çalıştığım startup bu fikir etrafına kuruluydu. Ve emin olun hiçte basit bir tool değil.

    Öncelikle elinizde sürekli canlı ve çok sayıda proxy olması gerekiyor ki google a sürekli istek atılabilsin.

    Sonrasında google belirli aralıklarla xpath lerini tasarım yapısını değiştirdiği için bunun takibi yapılmalı ve değişiklik durumunda hızlıca önlem alınmalı.

    Çıkan sonuçlarda sonuç listesinin arasında reklam giriyor, arama kelimesine göre harita, liste ve başka componentler giriyor. Bunların ayrımı yapılmalı.

    Ondan sonra çıkan sitelerin crawl edilmesi var.

    Böyle bir sistemin asenkron bir şekilde çalışması, fault tolerance olması, dağıtık bir şekilde çalışabilmesi lazım.

    Bana kalırsa pekte basit bir tool değil bu.



    Size tavsiyem, böyle bir tool yazdırmak yerine, bu hizmeti veren şirketlerden ürün satın almanız.
  • 26-08-2017, 14:15:49
    #6
    dotnetDeveloper adlı üyeden alıntı: mesajı görüntüle
    Basit bir tool dediğiniz google ı crawl ettirmek oluyor.

    Daha önce çalıştığım startup bu fikir etrafına kuruluydu. Ve emin olun hiçte basit bir tool değil.

    Öncelikle elinizde sürekli canlı ve çok sayıda proxy olması gerekiyor ki google a sürekli istek atılabilsin.

    Sonrasında google belirli aralıklarla xpath lerini tasarım yapısını değiştirdiği için bunun takibi yapılmalı ve değişiklik durumunda hızlıca önlem alınmalı.

    Çıkan sonuçlarda sonuç listesinin arasında reklam giriyor, arama kelimesine göre harita, liste ve başka componentler giriyor. Bunların ayrımı yapılmalı.

    Ondan sonra çıkan sitelerin crawl edilmesi var.

    Böyle bir sistemin asenkron bir şekilde çalışması, fault tolerance olması, dağıtık bir şekilde çalışabilmesi lazım.

    Bana kalırsa pekte basit bir tool değil bu.



    Size tavsiyem, böyle bir tool yazdırmak yerine, bu hizmeti veren şirketlerden ürün satın almanız.

    Google'ı crawl etmenize gerek yok hocam. Google bununla alakalı bir search api sunuyor zaten. Bu search api ile sonuçları kolay bir şekilde alabiliyorsunuz zaten. Sonrası ise sitede bulunan content alanındaki metnin kelime sayısını hesaplamak. Daha önce çalıştığınız startup ortaya ekstra caseler koymuş olabilir. Bizim ihtiyacımızı söylediğim bu iki madde çözüyor. Yine de konuya katkınız için teşekkürler.
  • 26-08-2017, 14:18:44
    #7
    KareAsCS adlı üyeden alıntı: mesajı görüntüle
    Google'ı crawl etmenize gerek yok hocam. Google bununla alakalı bir search api sunuyor zaten. Bu search api ile sonuçları kolay bir şekilde alabiliyorsunuz zaten. Sonrası ise sitede bulunan content alanındaki metnin kelime sayısını hesaplamak. Daha önce çalıştığınız startup ortaya ekstra caseler koymuş olabilir. Bizim ihtiyacımızı söylediğim bu iki madde çözüyor. Yine de konuya katkınız için teşekkürler.
    Google ın sunduğu api de rate limit olduğu için çalıştığım yerde yetersiz gelmişti.

    Belki sizin isteğinizi karşılıyordur o zaman durum değişir.

    İyi çalışmalar dilerim.
  • 26-08-2017, 14:23:08
    #8
    dotnetDeveloper adlı üyeden alıntı: mesajı görüntüle
    Google ın sunduğu api de rate limit olduğu için çalıştığım yerde yetersiz gelmişti.

    Belki sizin isteğinizi karşılıyordur o zaman durum değişir.

    İyi çalışmalar dilerim.
    Dediğim gibi çalıştığınız yerin ihtiyaçları farklı olabilir

    Teşekkürler!