• 22-10-2018, 20:34:43
    #1
    Selamun aleykum arkadaşlar,

    elimde 30 bin url var www.domain.com/kullaniciadi/kelime-kelime2-and-or.html ve ben bu url leri cluster(gruplamak) etmek istiyorum. 30 bin url ile manuel uğraşılmaz herhalde

    şeklinde.

    Benim düşüncem url yi kelime kelime2 şekline getirip bu kelimeleri tf idf sini alıp gruplamak. Veya k-means gibi algoritmalara göz atmak istiyorum. Acaba diyorum forumda bu tarz işlerle uğraşan varmı öneri verebilecek. Belki bilmediğimiz bir paket vardır sormak istedim. Python da yeniyim o açıdan. Teşekkürler.
  • 02-11-2018, 00:06:18
    #2
    aLKaDraZ adlı üyeden alıntı: mesajı görüntüle
    Selamun aleykum arkadaşlar,

    elimde 30 bin url var www.domain.com/kullaniciadi/kelime-kelime2-and-or.html ve ben bu url leri cluster(gruplamak) etmek istiyorum. 30 bin url ile manuel uğraşılmaz herhalde

    şeklinde.

    Benim düşüncem url yi kelime kelime2 şekline getirip bu kelimeleri tf idf sini alıp gruplamak. Veya k-means gibi algoritmalara göz atmak istiyorum. Acaba diyorum forumda bu tarz işlerle uğraşan varmı öneri verebilecek. Belki bilmediğimiz bir paket vardır sormak istedim. Python da yeniyim o açıdan. Teşekkürler.
    bu örnek url'den elde etmek istediğiniz veriler sadece "kelime" ve "kelime2" mi?
  • 02-11-2018, 00:19:24
    #3
    Misafir adlı üyeden alıntı: mesajı görüntüle
    bu örnek url'den elde etmek istediğiniz veriler sadece "kelime" ve "kelime2" mi?
    Merhabalar,

    Örnek url ler malesef çok değişken. Bir kelimede olabiliyor 10 kelimede. Ayrıca arada stopwords gibi kelimelerde olabiliyor.