10 kişilik ses kaydı yetersiz . Makine öğrenmesi/yapay zeka modellerinde verisetinin büyüklüğü çok önemlidir. Ne kadar büyük veriseti olursa o kadar iyi diyebiliriz . Tabi verisetinin doğru, tutarlı olması da önemlidir.
Hocam elimde yılların verdiği bir arşiv var o konuda sıkıntı yok. Ama bu yıllar içindeki arşiv 10 kişiye ait ve ben bunların hepsini kategorize edeceğim.
Yapmak istediğim senaryo şu şekilde.
Elimde 87bin den fazla birer saatlik ses dosyaları var.
Bu ses kayıtları 10 farklı kişiye ait.
Ben ses kaydını dinleyip algılayıp klasörlemek istiyorum.
Örnek veriyorum: ses-3698.mp3 dinlendi ahmet adlı kişi olduğu algılandı ahmet klasörüne taşındı.
yapmak istediğim bu.
Bana 100 her kişi için saatlik kayıt ayarlamanız gerek öğrenilmesi için derseniz onu da ayarlarım.
Sadece bu olay için kısa olarak tek kelimelik seslerle mi eğitiliyor yoksa ben 1 saatlik dosya ile eğitsem de olur mu?