Merhabalar Ben Saitama sitem kapandığı için bir süre yazılarımı buraya atacağım.
ana içerik şunları içerir:
- Histogram Tabanlı Frekans İstatistikleri
- Çeyrek yöntemine dayalı aykırı konum analizi
- Tanımlayıcı İstatistiksel Analiz
- Kümülatif Dağılım Fonksiyonuna Dayalı Analiz
- ikili analiz
- Korelasyon analizi...
veri seti
Veri adresi:
https://www.kaggle.com/code/kanncaa1...nners/notebook
İlk veriler UCI resmi web sitesinden gelir:
https://archive.ics.uci.edu/ml/datas...in+(Diagnostic)
Phyton'da kitaplığı içe aktar import pandas as pd
import numpy as np
import plotly.express as px
import plotly.graph_objects as go
import seaborn as sns
import matplotlib.pyplot as plt from scipy
import stats plt.style.use("ggplot")
import warnings warnings.filterwarnings("ignore") Analiz 1: Histogram - Histogram
Histogram, her bir değerin ne sıklıkla meydana geldiğini sayar.
# radius_mean: ortalama
m = plt.hist(df[df["diagnosis"] == "M"].radius_mean, bins=30, fc=(1,0,0,0.5), label="Maligant" # kötü huylu )
b = plt.hist(df[df["diagnosis"] == "B"].radius_mean, bins=30, fc=(0,1,0,0.5), label="Bening" # iyi huylu ) plt.legend() plt.xlabel("Radius Mean Values") plt.ylabel("Frequency") plt.title("Histogram of Radius Mean for Bening and Malignant Tumors") plt.show()
özet:
- Kötü huylu tümörlerin ortalama yarıçapı çoğunlukla iyi huylu tümörlerden daha büyüktür.
- İyi huylu tümörlerin (yeşil) dağılımı, normal bir dağılımın ardından kabaca çan şeklindedir.
Yarın İse Analiz 2: Anormallik Aykırı Değer Analizi yapacağız