weqale adlı üyeden alıntı: mesajı görüntüle
Çok ileri düzey veri analizcisi değilim fakat TÜBİTAK eğitiminden aklımda kalanlardan bahsedebilirim. İlk olarak veri analizi için Python şart değil R & R studio 'da kullanılabilir. 2018 verilerine bakıldığında veri analizi için %60 Python %46 R kullanımı olduğu biliniyor. Bundan bahsetmemin sebebi R Studio arayüzünün daha güzel olup daha kullanışlı olması (benim açımdan).

İlk olarak veri analizi için bilinmesi gerekenler; Değişkenler, döngüler, operatörler, fonksiyonlar, veri okuma, veri manipülasyonu bunları iyi oturtup bir sonraki aşamaya geçmelisiniz. Bunları halletiniz artık yavaş yavaş analize girmek istiyorsanız bilmeniz gereken önemli kütüphaneler: Numpy, Pandas, Matplotlib. Bunları hallettikten sonra artık veriyi işlemeye başlıyorsunuz burada ihtiyacınız olan şey istatiksel metodlar ve eksik verileri tamamlama yöntemleri.

Eksik Veri Tamamlama Yöntemlerinden Bazıları:
Doğrusal Interpolasyon
Maksimum Beklenti
Jackknife
Ortalama/Mod/Medyan Imputasyonu
Ağaç Tabanlı Veri Imputasyonu
K-NN
fuzzy k-Means
Chained Equations Tabanlı Multiple Imputation (MICE)
Singular Value Decomposition (SVD)
Principal Component Analizi (PCA)
Bayesyen Principal Component Analizi
Bunlar hakkında bilginiz olduğu takdirde elle tutulur bir bilginiz olmuş olur. Tamamen yüzeysel olarak anlatmaya çalıştım umarım aydınlatıcı olmuştur.
Hocam İlginize çok teşekkürler ;