Halo sobat statistik, kali ini jasa olah data USH Indonesia membahas tentang uji korelasi atau analisis korelasi. Apa sih definisi korelasi? Uji korelasi merupakan teknik pengukuran asosiasi / hubungan (measures of association), digunakan untuk mengukur kekuatan hubungan antara dua variabel. Contoh sederhana, meneliti apakah terdapat hubungan antara tinggi ayah dengan tinggi anaknya? apakah bermakna secara statistik? seberapa kuat hubungannya?
Uji Korelasi yang kita bahas nantinya akan menggunakan aplikasi olah data SPSS dan R. Cara menghitung koefisien korelasi, uji korelasi menggunakan SPSS dan R:
Tiga metode untuk melakukan uji korelasi:
- Korelasi Pearson (r),
- Kendall’s tau, dan
- Spearman’s rho
Korelasi Pearson (r) juga dikenal sebagai uji korelasi parametrik karena tergantung pada distribusi data. Korelasi pearson hanya dapat digunakan ketika x dan y berasal dari distribusi normal. Sedangkan Kendall’s tau dan Spearman’s rho yang merupakan koefisien korelasi berbasis peringkat (non-parametrik) dapat digunakan sekali pun data berasal dari distribusi tidak normal. Kita bahas selengkapnya tentang ketiga jenis olah data analisis korelasi ini:
Uji Korelasi Pearson
Definisi Pearson’s Correlation Test
Koefisien korelasi momen-produk Pearson (korelasi Pearson, singkatnya) adalah ukuran kekuatan dan arah hubungan antar dua variabel yang diukur pada setidaknya skala interval (data numerik).
Contoh: hubungan tinggi ayah dengan tinggi anaknya, berkekuatan sangat kuat dan arah hubungannya sejajar atau selaras atau linear. Anda juga bisa menggunakan korelasi Pearson untuk memahami apakah ada hubungan antara nilai ujian mata pelajaran kewarganegaraan dengan pemilihan aplikasi olah data.
Korelasi Pearson berupaya untuk menggambar garis yang paling cocok melalui data yang ada. Koefisien korelasi Pearson – r – menunjukkan seberapa jauh semua titik data dari garis paling cocok (yaitu, seberapa baik titik data tersebut cocok dengan model matematika).
Jika salah satu dari dua variabel Anda adalah dikotomis (hanya ada 0 dan 1), Anda dapat menggunakan korelasi point-biserial sebagai gantinya. Contoh: hubungan antara nilai ujian mata pelajaran kewarganegaraan dengan pemilihan aplikasi olah data. Aplikasi olah data hanya ada 0 dan 1, yaitu asli atau bajakan.
Catatan: ada uji asumsi, data yang dilakukan uji korelasi pearson harus memiliki disribusi normal.
Formula Uji Korelasi Pearson
Cara menghitung koefisien korelasi Pearson:
mx dan my adalah rata-rata variabel x dan y.
Nilai p-value (tingkat signifikansi) dari korelasi pearson dapat ditentukan dengan menghitung nilai t
n adalah jumlah sampel. Hasil dari t hitung dibandingkan dengan t tabel. Jika t hitung > t tabel, maka signifikan
Uji Korelasi Spearman
Definisi Spearman’s Rank-Order Correlation Test
Koefisien korelasi peringkat-urutan Spearman (korelasi Spearman, singkatnya) adalah metode nonparametrik dari kekuatan dan arah hubungan antar dua variabel yang diukur pada setidaknya skala ordinal. Spearman’s rho dilambangkan dengan simbol rs (atau huruf Yunani ρ, diucapkan rho). Tes ini digunakan untuk variabel ordinal atau untuk data kontinu yang tidak terdistribusi secara normal. Sehingga tidak dapat dilakukan uji korelasi Pearson.
Misalnya, sobat statistik bisa menggunakan korelasi Spearman untuk memahami apakah ada hubungan antara nilai skripsi dengan berapa kali revisi yang dilakukan. Karena datanya pasti ordinal: 0, 1, 2, 3, 4 dan seterusnya. Sobat statistik juga bisa menggunakan spearman’s rho untuk data kuesioner yang menggunakan skala likert.
Formula Uji Korelasi Spearman
Cara menghitung koefisien korelasi Spearman:
Di mana x ′ = peringkat (x) dan y ′ = peringkat (y). mx adalah rerata x dan my adalah rerata y
Uji Korelasi Kendal
Definisi Kendall’s Tau Correlation Test
Koefisien korelasi kendall tau-b (τb) (singkatnya Kendall’s tau-b) adalah metode nonparametrik dari kekuatan dan arah hubungan antar dua variabel yang diukur pada setidaknya skala ordinal. Kendall’s tau dianggap sebagai alternatif nonparametrik untuk uji korelasi Pearson ketika data yang ada tidak terdistribusi secara normal. Kendall’s tau juga dianggap sebagai alternatif untuk uji korelasi Spearman jika sobat statistik memiliki jumlah sampel yang kecil.
Contoh, sobat statistik bisa menggunakan Kendall’s tau-b untuk memahami apakah ada hubungan antara nilai ujian dan waktu yang dihabiskan untuk merevisi (yaitu, di mana ada enam nilai ujian yang mungkin – A, B, C, D, E dan F – dan waktu revisi dibagi menjadi lima kategori: kurang dari 5 jam, 5-9 jam, 10-14 jam, 15-19 jam, dan 20 jam atau lebih). Contoh lain, melihat apakah ada hubungan antara kepuasan pelanggan dengan waktu pengiriman (yaitu, di mana waktu pengiriman memiliki empat kategori dan kepuasan pelanggan diukur dengan skala likert).
Formula Uji Korelasi Kendal
Mulailah dengan mengurutkan dengan nilai x. Jika x dan y berkorelasi, maka mereka akan memiliki urutan-urutan yang relatif yang sama. Lalu, untuk setiap yi, hitung jumlah yj> yi (pasangan konkordan (c)) dan jumlah yj <yi.
Cara menghitung koefisien korelasi Kendal Tau:
Dimana, nc: total jumlah pasangan yang sesuai. nd: jumlah total pasangan diskordan. n: ukuran x dan y
Jika sobat statistik masih bingung, lakukan saja formula tersebut menggunakan aplikasi statistika. Selengkapnya kita lihat pembahasan di bawah ini:
Uji Korelasi Menggunakan R atau R Studio
Setelah belajar teori dasar, sekarang kita aplikasikan ke dalam software statistik R1
Baca juga kenapa harus memilih R (klik)
Syntax
Koefisien korelasi dapat dihitung menggunakan syntax atau fungsi cor () atau cor.test ():
cor () menghitung koefisien korelasi
cor.test () untuk hubungan / korelasi antara sampel berpasangan.
Contoh syntax:
cor (x, y, method = c (“pearson”, “kendall”, “spearman”))
cor.test (x, y, method = c (“pearson”, “kendall”, “spearman”))
x, y: vektor numerik dengan panjang yang sama
method: metode korelasi
Import Data
Persiapkan data sobat statistik
# Jika file tab .txt, gunakan
my_data <- read.delim (file.choose ())
# Atau, jika file .csv, gunakan ini
my_data <- read.csv (file.choose ())
Di sini, jasa olah data USH Indonesia menggunakan dataset bawaan dari R, yaitu “mtcars” sebagai contoh.
Kode R di bawah ini menghitung korelasi antara variabel “mpg” dengan variabel “wt” di dalam data mtcars:
Masukkan syntax:
my_data <- mtcars
Visualisasi data
Visualisasikan data sobat statistik menggunakan plot pencar
Untuk menggunakan grafik dasar di R, jasa olah data USH Indonesia menggunakan ggpubr.
library("ggpubr")
ggscatter(my_data, x = "mpg", y = "wt",
add = "reg.line", conf.int = TRUE,
cor.coef = TRUE, cor.method = "pearson",
xlab = "Miles/(US) gallon", ylab = "Weight (1000 lbs)")
Uji Asumsi
Apakah data dari masing-masing variabel (x, y) mengikuti distribusi normal?
Gunakan uji normalitas Shapiro-Wilk -> R fungsi/syntax:
shapiro.test ()
dan lihat plot normalitas -> fungsi/syntax
ggpubr :: ggqqplot ()
Tes Shapiro-Wilk dapat dilakukan sebagai berikut:
Hipotesis nol: data terdistribusi secara normal
Hipotesis alternatif: data tidak terdistribusi secara normal
# Shapiro-Wilk normality test for mpg
shapiro.test(my_data$mpg) # => p = 0.1229
# Shapiro-Wilk normality test for wt
shapiro.test(my_data$wt) # => p = 0.09
Pada hasil di atas menunjukkan bahwa distribusi data normal karena p-value >0.05, sehingga uji korelasi pearson dapat dilakukan.
Uji Korelasi Pearson menggunakan R
Cara menghitung koefisien korelasi Pearson menggunakan R:
res <- cor.test(my_data$wt, my_data$mpg,
method = "pearson")
summary(res)
Pearson's product-moment correlation
data: my_data$wt and my_data$mpg
t = -9.559, df = 30, p-value = 1.294e-10
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.9338264 -0.7440872
sample estimates:
cor
-0.8676594
Interpretasi Uji Korelasi Pearson menggunakan R
Dalam hasil di atas:
t adalah nilai statistik uji-t (t = -9,559),
df adalah derajat kebebasan (df = 30),
p-value adalah tingkat signifikansi dari t-test (p-value = 1.29410 ^ {- 10}).
conf.int adalah interval kepercayaan dari koefisien korelasi sebesar 95% (conf.int = [-0.9338, -0.7441]);
Kekuatan dan arah hubungan adalah koefisien korelasi (Cor.coeff = -0.87).
Nilai p-value dari tes di atas adalah 1.29410 pangkat {- 10} atau mudahnya 0.000 (terkadang ditulis < 0.001). Karena p-value < 0.05, maka hasil bermakna secara statistik. Kita dapat menyimpulkan bahwa
wt dan mpg secara signifikan berkorelasi (memiliki hubungan). Koefisien korelasi -0,87, kekuatan hubungan kuat, dan arah hubungan terbalik (berkorelasi negatif), p-value 0.000
Uji Korelasi Kendall menggunakan R
Cara menghitung koefisien korelasi Kendal menggunakan R:
Koefisien korelasi peringkat Kendall atau statistik tau Kendall digunakan untuk memperkirakan ukuran asosiasi berdasarkan peringkat (non-parametrik). Tes ini dapat digunakan jika data tidak terdistribusi secara normal
res2 <- cor.test(my_data$wt, my_data$mpg, method="kendall")
summary(res2)
Kendall's rank correlation tau
data: my_data$wt and my_data$mpg
z = -5.7981, p-value = 6.706e-09
alternative hypothesis: true tau is not equal to 0
sample estimates:
tau
-0.7278321
Interpretasi Uji Korelasi Kendall menggunakan R
tau adalah koefisien korelasi Kendall.
Koefisien korelasi antara x dan y adalah -0,7278 dan nilai-p adalah 6,70610 pangkat {- 9}.
wt dan mpg secara signifikan berkorelasi (memiliki hubungan). Koefisien korelasi -0.72, kekuatan hubungan cukup kuat, dan arah hubungan terbalik (berkorelasi negatif), p-value 0.000
Uji Korelasi Spearman menggunakan R
Cara menghitung koefisien korelasi Spearman menggunakan R:
Uji statistik Spearman juga digunakan untuk memperkirakan ukuran asosiasi berdasarkan peringkat (non-parametrik).
res2 <-cor.test(my_data$wt, my_data$mpg, method = "spearman")
summary(res2)
Spearman's rank correlation rho
data: my_data$wt and my_data$mpg
S = 10292, p-value = 1.488e-11
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
-0.886422
Interpretasi Uji Korelasi Spearman menggunakan R
rho adalah koefisien korelasi Spearman.
Koefisien korelasi antara x dan y adalah -0,8864 dan nilai-p adalah 1,48810 ^ {- 11}.
wt dan mpg secara signifikan berkorelasi (memiliki hubungan). Koefisien korelasi -0.88, kekuatan hubungan kuat, dan arah hubungan terbalik (berkorelasi negatif), p-value 0.000
Interpretasi Secara Umum
Di dalam penulisan interpretasi, terdapat tiga poin utama:
- Kekuatan hubungan dua variabel;
- Signifikansi hubungan;
- Arah hubungan.
Kekuatan dan Arah Hubungan
Kekuatan hubungan kita lihat dari koefisien korelasi. Koefisien korelasi berada pada rentang antara -1 dan 1:
-1 menunjukkan korelasi negatif yang kuat: ini berarti bahwa setiap kali x meningkat, y berkurang. Contoh, terdapat korelasi negatif antara frekuensi PDKT dengan frekuensi pernikahan. Jadi semakin sering kita PDKT, ternyata semakin tidak menikah-menikah
0 berarti tidak ada hubungan antara dua variabel (x dan y)
1 menunjukkan korelasi positif yang kuat: ini berarti bahwa y meningkat dengan x
Untuk memudahkan melakukan interpretasi mengenai kekuatan hubungan antara dua variabel, Sarwono (2006) memberikan kriteria sebagai berikut:
- 0 : Tidak ada korelasi antara dua variabel
- >0 – 0,25: Korelasi sangat lemah
- >0,25 – 0,5: Korelasi cukup
- >0,5 – 0,75: Korelasi kuat
- >0,75 – 0,99: Korelasi sangat kuat
- 1: Korelasi sempurna
Signifikansi Hubungan
Interpretasi berikutnya melihat signifikansi hubungan. Signifikansi hubungan adalah penentu apakah uji korelasi yang kita lakukan bermakna atau tidak secara statistik. Signifikansi kita lihat dari p-value. Jika p-value < 0.05 (dengan tingkat error 5%) maka uji korelasi yang kita lakukan bermakna secara statistik. Angka 0.05 kadang kita naikkan hingga 0.1 dengan tingkat error 10%.
Uji Korelasi SPSS
Terdapat 5 tahap untuk melakukan uji korelasi SPSS2
Cara menghitung koefisien korelasi menggunakan SPSS:
Tahap 1
Pastikan SPSS yang sobat statistik miliki adalah SPSS asli, bukan bajakan, bukan pula crack
Jika sobat statistik belum memiliki SPSS asli, hubungi jasa olah data USH Indonesia, cabang offline: jasa olah data Jogja, Bandung, dan Semarang
Tahap 2
Jika SPSS sobat statistik sudah asli, barulah memulai tahap 2. Stop di tahap 1 jika aplikasi sobat statistik masih bajakan
Import data dari excel ke SPSS atau dari .sav ke SPSS
baca juga: hukum menggunakan software bajakan
Tahap 3
uji korelasi SPSS
Tahap 4
Akan muncul kotak / dialog box seperti di bawah:
Pilihlah variabel yang ingin sobat statistik ujikan. Lalu pilih metode yang sesuai (apakah pearson, kendal, atau spearman)
Tahap 5
Setelah sobat statistik klik “OK” akan muncul output uji korelasi SPSS seperti di bawah:
Interpretasi Uji Korelasi SPSS
Height dan Jump_Dist secara signifikan berkorelasi (memiliki hubungan). Koefisien korelasi 0.7 kekuatan hubungan cukup kuat, dan arah hubungan sejajar (berkorelasi positif), p-value 0.005
Referensi: