Merhabalar Ben Saitama sitem kapandığı için bir süre yazılarımı buraya atacağım.

ana içerik şunları içerir:
  • Histogram Tabanlı Frekans İstatistikleri
  • Çeyrek yöntemine dayalı aykırı konum analizi
  • Tanımlayıcı İstatistiksel Analiz
  • Kümülatif Dağılım Fonksiyonuna Dayalı Analiz
  • ikili analiz
  • Korelasyon analizi...
veri seti

Veri adresi: https://www.kaggle.com/code/kanncaa1...nners/notebook

İlk veriler UCI resmi web sitesinden gelir: https://archive.ics.uci.edu/ml/datas...in+(Diagnostic)



Phyton'da kitaplığı içe aktar
import pandas as pd
import numpy as np 
 import plotly.express as px 
import plotly.graph_objects as go 
 import seaborn as sns
 import matplotlib.pyplot as plt from scipy
 import stats plt.style.use("ggplot")
 import warnings warnings.filterwarnings("ignore")




Analiz 1: Histogram - Histogram

Histogram, her bir değerin ne sıklıkla meydana geldiğini sayar.
# radius_mean: ortalama

m = plt.hist(df[df["diagnosis"] == "M"].radius_mean,             bins=30,             fc=(1,0,0,0.5),             label="Maligant"  # kötü huylu )
b = plt.hist(df[df["diagnosis"] == "B"].radius_mean,             bins=30,             fc=(0,1,0,0.5),              label="Bening"  # iyi huylu ) plt.legend() plt.xlabel("Radius Mean Values") plt.ylabel("Frequency") plt.title("Histogram of Radius Mean for Bening and Malignant Tumors") plt.show()

özet:
  1. Kötü huylu tümörlerin ortalama yarıçapı çoğunlukla iyi huylu tümörlerden daha büyüktür.
  2. İyi huylu tümörlerin (yeşil) dağılımı, normal bir dağılımın ardından kabaca çan şeklindedir.
Yarın İse Analiz 2: Anormallik Aykırı Değer Analizi yapacağız