Menentukan Keterhubungan Antara 2 Hal dengan Statistik Korelasi
Artikel berikut akan membahas tentang cara menentukan keterhubungan antara 2 hal dengan statistik korelasi. Misalkan kita akan menentukan hubungan antara jumlah jam belajar siswa dengan nilai yang didapatkanya, apakah semakin banyak belajar akan menghasilkan nilai yang besar pula? Contoh lainnya adalah menentukan keterhubungan antara suhu ruangan dengan kelembaban dalam ruangan, apakah semakin tinggi suhu ruangan akan menyebabkan kelembaban naik atau malah turun? Pada artikel ini akan diberikan contoh perhitungan korelasi untuk menentukan keterhubungan antara suhu ruangan dengan kelembabannya.
Statistik korelasi merupakan alat yang sangat penting dalam analisis data, karena memungkinkan kita untuk mengidentifikasi dan mengukur hubungan antara dua variabel. Dalam berbagai bidang, seperti ekonomi, psikologi, biologi, dan ilmu sosial, memahami keterhubungan antara variabel dapat memberikan wawasan yang mendalam dan membantu dalam pengambilan keputusan. Artikel ini akan membahas konsep dasar statistik korelasi, jenis-jenis korelasi, cara menghitungnya, serta interpretasi hasil korelasi.
Konsep Dasar Statistik Korelasi
Apa itu Korelasi?
Korelasi adalah ukuran statistik yang menunjukkan sejauh mana dua variabel bergerak bersama. Jika perubahan dalam satu variabel diikuti oleh perubahan yang konsisten dalam variabel lainnya, maka kedua variabel tersebut dikatakan berkorelasi. Korelasi dapat bersifat positif, negatif, atau nol:
- Korelasi Positif: Ketika satu variabel meningkat, variabel lainnya juga meningkat.
- Korelasi Negatif: Ketika satu variabel meningkat, variabel lainnya menurun.
- Korelasi Nol: Tidak ada hubungan yang jelas antara perubahan kedua variabel.
Koefisien Korelasi
Koefisien korelasi adalah angka yang menggambarkan kekuatan dan arah hubungan antara dua variabel. Nilai koefisien korelasi berkisar antara -1 dan +1:
- +1 menunjukkan korelasi positif sempurna.
- -1 menunjukkan korelasi negatif sempurna.
- 0 menunjukkan tidak ada korelasi.
Koefisien korelasi yang paling umum digunakan adalah koefisien korelasi Pearson.
Korelasi vs. Kausalitas
Penting untuk diingat bahwa korelasi tidak berarti kausalitas. Hanya karena dua variabel berkorelasi, tidak berarti bahwa satu variabel menyebabkan perubahan pada variabel lainnya. Korelasi hanya menunjukkan bahwa ada hubungan antara kedua variabel.
Korelasi merupakan salah satu ilmu yang dipelajari pada pelajaran statistika. Menurut Kamus Besar Bahasa Indonesia (KBBI), pengertian korelasi adalah hubungan timbal balik atau sebab akibat. Definisi pada ilmu statistika, korelasi merupakan salah satu teknik statistik yang digunakan untuk mencari hubungan antara dua variable yang bersifat kuantitatif (nilai berupa angka). 2 hal dikatakan memiliki keterhubungan jika nilai korelasi mendekati -1 atau 1, jika nilai korelasi mendekati 0 artinya kedua variable tersebut kurang memiliki keterhubungan. Jika didapatkan nilai korelasi mendekati 1, artinya jika satu nilai meningkat maka nilai yang lain secara linear akan meningkat. Jika didapatkan nilei korelasi mendekati -1, artinya jika satu nilai menaik maka nilai yang lain akan secara linear menurun.
Menghitung Korelasi
1. Menghitung Korelasi Pearson
Rumus untuk menghitung koefisien korelasi Pearson (r) adalah:
r=∑(xi−xˉ)(yi−yˉ)∑(xi−xˉ)2∑(yi−yˉ)2r = \frac{\sum (x_i – \bar{x})(y_i – \bar{y})}{\sqrt{\sum (x_i – \bar{x})^2 \sum (y_i – \bar{y})^2}}r=∑(xi−xˉ)2∑(yi−yˉ)2∑(xi−xˉ)(yi−yˉ)
Di mana:
- xix_ixi dan yiy_iyi adalah nilai individu dari variabel X dan Y.
- xˉ\bar{x}xˉ dan yˉ\bar{y}yˉ adalah rata-rata dari variabel X dan Y.
Contoh: Misalkan kita memiliki data tinggi badan dan berat badan dari 5 individu:
- Tinggi (cm): 160, 165, 170, 175, 180
- Berat (kg): 55, 60, 65, 70, 75
Langkah-langkahnya:
- Hitung rata-rata tinggi (xˉ\bar{x}xˉ) dan berat (yˉ\bar{y}yˉ).
- Hitung deviasi dari setiap nilai terhadap rata-rata.
- Hitung hasil kali deviasi untuk setiap pasangan data.
- Jumlahkan hasil kali deviasi.
- Hitung kuadrat deviasi untuk setiap variabel dan jumlahkan.
- Masukkan nilai-nilai ini ke dalam rumus untuk menghitung r.
2. Menghitung Korelasi Spearman
Korelasi Spearman menggunakan peringkat data daripada nilai sebenarnya. Rumusnya adalah:
ρ=1−6∑di2n(n2−1)\rho = 1 – \frac{6 \sum d_i^2}{n(n^2 – 1)}ρ=1−n(n2−1)6∑di2
Di mana:
- did_idi adalah selisih peringkat antara dua variabel.
- nnn adalah jumlah pasangan data.
3. Menghitung Korelasi Kendall
Rumus untuk koefisien korelasi Kendall (τ) adalah:
τ=(C−D)(n(n−1)/2−T1)(n(n−1)/2−T2)\tau = \frac{(C – D)}{\sqrt{(n(n-1)/2 – T_1)(n(n-1)/2 – T_2)}}τ=(n(n−1)/2−T1)(n(n−1)/2−T2)(C−D)
Di mana:
- CCC adalah jumlah pasangan konkordan (pasangan yang memiliki urutan yang sama dalam kedua variabel).
- DDD adalah jumlah pasangan diskordan (pasangan yang memiliki urutan yang berbeda dalam kedua variabel).
- T1T_1T1 dan T2T_2T2 adalah jumlah pasangan ikatan dalam masing-masing variabel.
Interpretasi Hasil Korelasi
1. Kekuatan Korelasi
- 0.0 < |r| < 0.3: Korelasi lemah
- 0.3 < |r| < 0.5: Korelasi moderat
- 0.5 < |r| < 0.7: Korelasi kuat
- 0.7 < |r| ≤ 1.0: Korelasi sangat kuat
2. Arah Korelasi
- Positif (r > 0): Kedua variabel bergerak dalam arah yang sama.
- Negatif (r < 0): Kedua variabel bergerak dalam arah yang berlawanan.
Contoh Penerapan Korelasi dalam Berbagai Bidang
1. Ekonomi
Dalam ekonomi, korelasi sering digunakan untuk menganalisis hubungan antara dua variabel ekonomi, seperti inflasi dan pengangguran. Misalnya, teori Philips Curve menunjukkan korelasi negatif antara inflasi dan pengangguran.
2. Psikologi
Di bidang psikologi, korelasi dapat digunakan untuk mengeksplorasi hubungan antara variabel psikologis, seperti stres dan kinerja kerja. Studi mungkin menemukan korelasi negatif antara tingkat stres dan kinerja kerja, yang berarti semakin tinggi tingkat stres, semakin rendah kinerja kerja.
3. Pendidikan
Dalam pendidikan, korelasi dapat digunakan untuk menilai hubungan antara variabel, seperti waktu belajar dan hasil ujian. Penelitian mungkin menunjukkan korelasi positif antara waktu yang dihabiskan untuk belajar dan nilai ujian, yang berarti semakin banyak waktu yang dihabiskan untuk belajar, semakin tinggi nilai ujian.
4. Kesehatan
Di bidang kesehatan, korelasi dapat digunakan untuk menganalisis hubungan antara gaya hidup dan kesehatan. Misalnya, mungkin ada korelasi negatif antara merokok dan kesehatan paru-paru, yang berarti semakin banyak merokok, semakin buruk kesehatan paru-paru.
Keterbatasan dan Kesalahan dalam Interpretasi Korelasi
1. Korelasi Tidak Berarti Kausalitas
Hanya karena dua variabel berkorelasi, tidak berarti bahwa satu variabel menyebabkan perubahan pada variabel lainnya. Korelasi hanya menunjukkan bahwa ada hubungan antara dua variabel. Misinterpretasi ini dikenal sebagai kesalahan logika post hoc ergo propter hoc.
2. Pengaruh Variabel Lain
Kadang-kadang, korelasi antara dua variabel dapat dipengaruhi oleh variabel ketiga yang tidak terlihat (confounding variable). Misalnya, ada korelasi positif antara penjualan es krim dan insiden tenggelam. Namun, variabel ketiga seperti cuaca panas dapat menjadi faktor penyebab.
3. Korelasi Spurious
Korelasi spurious adalah korelasi yang muncul antara dua variabel tetapi tidak memiliki hubungan kausal yang nyata. Korelasi ini bisa terjadi karena kebetulan atau karena adanya tren yang sama dalam data.
4. Distribusi Non-Linear
Korelasi Pearson hanya mengukur hubungan linear antara dua variabel. Jika hubungan antara variabel bersifat non-linear, koefisien korelasi Pearson mungkin tidak memberikan gambaran yang akurat tentang hubungan tersebut.
Berikut ini akan diberikan contoh perhitungan keterhubungan antara data suhu dengan kelembaban dengan rumus korelasi Pearson.
- Siapkan data suhu dan kelembaban
Pada kasus ini digunakan 10 data pencatatan suhu dan kelembaban yang didapatkan dari pengukuran menggunakan sensor DHT-22.
NO | TEMP | HUMID |
1 | 27 | 50.3 |
2 | 27 | 50.4 |
3 | 27 | 50.7 |
4 | 27 | 51.6 |
5 | 26.9 | 50.3 |
6 | 26.9 | 50.3 |
7 | 26.9 | 50.1 |
8 | 26.9 | 50 |
9 | 26.9 | 50 |
10 | 26.9 | 50 |
- Rumus korelasi Pearson
- Buat perhitungan matematis dan hitung setiap variable di korelasi Pearson
NO | TEMP (x) | HUMID (y) | x2 | y2 | x*y |
1 | 27 | 50.3 | 729 | 2530.09 | 1358.1 |
2 | 27 | 50.4 | 729 | 2540.16 | 1360.8 |
3 | 27 | 50.7 | 729 | 2570.49 | 1368.9 |
4 | 27 | 51.6 | 729 | 2662.56 | 1393.2 |
5 | 26.9 | 50.3 | 723.61 | 2530.09 | 1353.07 |
6 | 26.9 | 50.3 | 723.61 | 2530.09 | 1353.07 |
7 | 26.9 | 50.1 | 723.61 | 2510.01 | 1347.69 |
8 | 26.9 | 50 | 723.61 | 2500 | 1345 |
9 | 26.9 | 50 | 723.61 | 2500 | 1345 |
10 | 26.9 | 50 | 723.61 | 2500 | 1345 |
S | 269.4 | 503.7 | 7257.66 | 25373.49 | 13569.83 |
n = | 10 |
n(Sxy) = | 135698.3 |
Sx = | 269.4 |
Sy = | 503.7 |
nSx2 = | 72576.6 |
nSy2 = | 253734.9 |
(Sx)2 = | 72576.36 |
(Sy)2 = | 253713.7 |
- Hitung nilai korelasi suhu dengan kelembaban menggunakan rumus pada poin nomor 2
r = 135698.3 – 135696.8 / Ö(72576.6-72576.36)*(253734.9-253713.7)
= 0.674
- Ambil kesimpulan
Nilai 0.674 memperlihatkan nilai korelasi kuat positif, artinya jika temperatur menaik maka secara linear akan didapatkan kelembaban yang meningkat pula.
Hasil percobaan tersebut menunjukkan keterhubungan antara temperatur dan kelembaban sehingga sering didapatkan pada data-data ilmiah kedua nilai tersebut digunakan sebagai dasar perhitungan.
Wassalam – Bobsis2019
Comments :