Exploring Numerical Data
Identifikasi Outlier Menggunakan Nilai Z
Nilai Z adalah perbedaan antara nilai data dengan nilai rata-rata, dibagi dengan standar deviasi. Skor Z = 0 menunjukkan bahwa nilai data sama dengan mean. Skor Z membantu mengidentifikasi outlier. Nilai yang sangat berbeda dari rata-rata akan memiliki nilai Z yang sangat kecil (negatif) atau nilai Z yang sangat besar (positif). Sebagai aturan umum, skor Z yang kurang dari -3,0 atau lebih besar dari +3,0 menunjukkan nilai outlier.
Skewness
Skewness mengukur sejauh mana nilai data tidak simetris di sekitar mean. Tiga kemungkinan tersebut adalah:
- Mean < median: distribusi negatif, atau miring ke kiri (A)
- Mean = median: distribusi simetris/kemiringan nol (B)
- Mean > median: distribusi positif, atau miring ke kanan (C)
Kurtosis
- Kurtosis mengukur puncak kurva distribusi—yaitu, seberapa tajam kurva naik mendekati pusat distribusi. Distribusi yang memiliki puncak pusat naik lebih tajam dari puncak distribusi normal memiliki kurtosis positif, nilai kurtosis yang lebih besar dari nol, dan disebut leptokurtik.
- Distribusi yang memiliki puncak pusat yang naik lebih lambat (lebih datar) daripada puncak distribusi normal memiliki kurtosis negatif, nilai kurtosis yang kurang dari nol, dan disebut platikurtik.
Comments :