Uji Korelasi R dan SPSS (2020)

Halo sobat statistik, kali ini jasa olah data USH Indonesia membahas tentang uji korelasi atau analisis korelasi. Uji Korelasi nantinya akan menggunakan R dan uji korelasi SPSS. Ingatlah bahwa uji korelasi digunakan untuk menyelidiki hubungan antar-variabel. Contoh sederhana adalah melihat apakah ada hubungan antara usia ibu dengan berat badan lahir (anaknya) atau melihat apakah ada hubungan antara tinggi ayah dengan tinggi anaknya. Cara menghitung koefisien korelasi:

Tiga metode untuk melakukan uji korelasi:

  1. Korelasi Pearson (r),
  2. Kendall’s tau, dan
  3. Spearman’s rho

Korelasi Pearson (r) juga dikenal sebagai uji korelasi parametrik karena tergantung pada distribusi data. Korelasi pearson hanya dapat digunakan ketika x dan y berasal dari distribusi normal. Sedangkan Kendall’s tau dan Spearman’s rho yang merupakan koefisien korelasi berbasis peringkat (non-parametrik) dapat digunakan sekali pun data berasal dari distribusi tidak normal. Kita bahas selengkapnya tentang ketiga jenis olah data analisis korelasi ini:

Uji Korelasi Pearson

Definisi Pearson’s Correlation Test

Koefisien korelasi momen-produk Pearson (korelasi Pearson, singkatnya) adalah ukuran kekuatan dan arah hubungan antar dua variabel yang diukur pada setidaknya skala interval (data numerik).

Contoh: hubungan tinggi ayah dengan tinggi anaknya, berkekuatan sangat kuat dan arah hubungannya sejajar atau selaras atau linear. Anda juga bisa menggunakan korelasi Pearson untuk memahami apakah ada hubungan antara nilai ujian mata pelajaran kewarganegaraan dengan pemilihan aplikasi olah data.

Korelasi Pearson berupaya untuk menggambar garis yang paling cocok melalui data yang ada. Koefisien korelasi Pearson – r – menunjukkan seberapa jauh semua titik data dari garis paling cocok (yaitu, seberapa baik titik data tersebut cocok dengan model matematika).

Jika salah satu dari dua variabel Anda adalah dikotomis (hanya ada 0 dan 1), Anda dapat menggunakan korelasi point-biserial sebagai gantinya. Contoh: hubungan antara nilai ujian mata pelajaran kewarganegaraan dengan pemilihan aplikasi olah data. Aplikasi olah data hanya ada 0 dan 1, yaitu asli atau bajakan.

Catatan: ada uji asumsi, data yang dilakukan uji korelasi pearson harus memiliki disribusi normal.

Formula Uji Korelasi Pearson

Cara menghitung koefisien korelasi Pearson:

formula-uji-korelasi-Cara menghitung koefisien korelasi Pearson-Jasa olah data USH


mx dan my adalah rata-rata variabel x dan y.

Nilai p-value (tingkat signifikansi) dari korelasi pearson dapat ditentukan dengan menghitung nilai t

rumus-t-hitung-jasa-olah-data-ush-indonesia

n adalah jumlah sampel. Hasil dari t hitung dibandingkan dengan t tabel. Jika t hitung > t tabel, maka signifikan

Uji Korelasi Spearman

Definisi Spearman’s Rank-Order Correlation Test

Koefisien korelasi peringkat-urutan Spearman (korelasi Spearman, singkatnya) adalah metode nonparametrik dari kekuatan dan arah hubungan antar dua variabel yang diukur pada setidaknya skala ordinal. Spearman’s rho dilambangkan dengan simbol rs (atau huruf Yunani ρ, diucapkan rho). Tes ini digunakan untuk variabel ordinal atau untuk data kontinu yang tidak terdistribusi secara normal. Sehingga tidak dapat dilakukan uji korelasi Pearson.

Misalnya, sobat statistik bisa menggunakan korelasi Spearman untuk memahami apakah ada hubungan antara nilai skripsi dengan berapa kali revisi yang dilakukan. Karena datanya pasti ordinal: 0, 1, 2, 3, 4 dan seterusnya. Sobat statistik juga bisa menggunakan spearman’s rho untuk data kuesioner yang menggunakan skala likert.

Formula Uji Korelasi Spearman

Cara menghitung koefisien korelasi Spearman:

formula-uji-korelasi-spearman-Cara menghitung koefisien korelasi Spearman-Jasa olah data USH


Di mana x ′ = peringkat (x) dan y ′ = peringkat (y). mx adalah rerata x dan my adalah rerata y

Uji Korelasi Kendal

Definisi Kendall’s Tau Correlation Test

Koefisien korelasi kendall tau-b (τb) (singkatnya Kendall’s tau-b) adalah metode nonparametrik dari kekuatan dan arah hubungan antar dua variabel yang diukur pada setidaknya skala ordinal. Kendall’s tau dianggap sebagai alternatif nonparametrik untuk uji korelasi Pearson ketika data yang ada tidak terdistribusi secara normal. Kendall’s tau juga dianggap sebagai alternatif untuk uji korelasi Spearman jika sobat statistik memiliki jumlah sampel yang kecil.

Contoh, sobat statistik bisa menggunakan Kendall’s tau-b untuk memahami apakah ada hubungan antara nilai ujian dan waktu yang dihabiskan untuk merevisi (yaitu, di mana ada enam nilai ujian yang mungkin – A, B, C, D, E dan F – dan waktu revisi dibagi menjadi lima kategori: kurang dari 5 jam, 5-9 jam, 10-14 jam, 15-19 jam, dan 20 jam atau lebih). Contoh lain, melihat apakah ada hubungan antara kepuasan pelanggan dengan waktu pengiriman (yaitu, di mana waktu pengiriman memiliki empat kategori dan kepuasan pelanggan diukur dengan skala likert).

Formula Uji Korelasi Kendal

Mulailah dengan mengurutkan dengan nilai x. Jika x dan y berkorelasi, maka mereka akan memiliki urutan-urutan yang relatif yang sama. Lalu, untuk setiap yi, hitung jumlah yj> yi (pasangan konkordan (c)) dan jumlah yj <yi.

Cara menghitung koefisien korelasi Kendal Tau:

rumus-uji-korelasi-kendall-Cara menghitung koefisien korelasi Kendal-Jasa olah data USH

Dimana, nc: total jumlah pasangan yang sesuai. nd: jumlah total pasangan diskordan. n: ukuran x dan y

Jika sobat statistik masih bingung, lakukan saja formula tersebut menggunakan aplikasi statistika. Selengkapnya kita lihat pembahasan di bawah ini:

Uji Korelasi Menggunakan R atau R Studio

Setelah belajar teori dasar, sekarang kita aplikasikan ke dalam software statistik R1

Baca juga kenapa harus memilih R (klik)

Syntax

Koefisien korelasi dapat dihitung menggunakan syntax atau fungsi cor () atau cor.test ():

     cor () menghitung koefisien korelasi
     cor.test () untuk hubungan / korelasi antara sampel berpasangan.

Contoh syntax:

cor (x, y, method = c (“pearson”, “kendall”, “spearman”))
cor.test (x, y, method = c (“pearson”, “kendall”, “spearman”))

     x, y: vektor numerik dengan panjang yang sama
     method: metode korelasi

Import Data

Persiapkan data sobat statistik

# Jika file tab .txt, gunakan
my_data <- read.delim (file.choose ())
# Atau, jika file .csv, gunakan ini
my_data <- read.csv (file.choose ())

Di sini, jasa olah data USH Indonesia menggunakan dataset bawaan dari R, yaitu “mtcars” sebagai contoh.

Kode R di bawah ini menghitung korelasi antara variabel “mpg” dengan variabel “wt” di dalam data mtcars:

Masukkan syntax:

my_data <- mtcars

Visualisasi data

Visualisasikan data sobat statistik menggunakan plot pencar

Untuk menggunakan grafik dasar di R, jasa olah data USH Indonesia menggunakan ggpubr.

library("ggpubr")
ggscatter(my_data, x = "mpg", y = "wt", 
          add = "reg.line", conf.int = TRUE, 
          cor.coef = TRUE, cor.method = "pearson",
          xlab = "Miles/(US) gallon", ylab = "Weight (1000 lbs)")
Visualisasi data menggunakan r-Jasa olah data USH

Uji Asumsi

Apakah data dari masing-masing variabel (x, y) mengikuti distribusi normal?
Gunakan uji normalitas Shapiro-Wilk -> R fungsi/syntax:

shapiro.test ()

dan lihat plot normalitas -> fungsi/syntax

ggpubr :: ggqqplot ()

     Tes Shapiro-Wilk dapat dilakukan sebagai berikut:
         Hipotesis nol: data terdistribusi secara normal
         Hipotesis alternatif: data tidak terdistribusi secara normal

# Shapiro-Wilk normality test for mpg
shapiro.test(my_data$mpg) # => p = 0.1229
# Shapiro-Wilk normality test for wt
shapiro.test(my_data$wt) # => p = 0.09

Pada hasil di atas menunjukkan bahwa distribusi data normal karena p-value >0.05, sehingga uji korelasi pearson dapat dilakukan.

Uji Korelasi Pearson menggunakan R

Cara menghitung koefisien korelasi Pearson menggunakan R:

res <- cor.test(my_data$wt, my_data$mpg, 
                    method = "pearson")
summary(res)

    Pearson's product-moment correlation
data:  my_data$wt and my_data$mpg
t = -9.559, df = 30, p-value = 1.294e-10
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.9338264 -0.7440872
sample estimates:
       cor 
-0.8676594 

Interpretasi Uji Korelasi Pearson menggunakan R

Dalam hasil di atas:

     t adalah nilai statistik uji-t (t = -9,559),
     df adalah derajat kebebasan (df = 30),
     p-value adalah tingkat signifikansi dari t-test (p-value = 1.29410 ^ {- 10}).
     conf.int adalah interval kepercayaan dari koefisien korelasi sebesar 95% (conf.int = [-0.9338, -0.7441]);
     Kekuatan dan arah hubungan adalah koefisien korelasi (Cor.coeff = -0.87).
Nilai p-value dari tes di atas adalah 1.29410 pangkat {- 10} atau mudahnya 0.000 (terkadang ditulis < 0.001). Karena p-value < 0.05, maka hasil bermakna secara statistik. Kita dapat menyimpulkan bahwa

wt dan mpg secara signifikan berkorelasi (memiliki hubungan). Koefisien korelasi -0,87, kekuatan hubungan kuat, dan arah hubungan terbalik (berkorelasi negatif), p-value 0.000

Uji Korelasi Kendall menggunakan R

Cara menghitung koefisien korelasi Kendal menggunakan R:

Koefisien korelasi peringkat Kendall atau statistik tau Kendall digunakan untuk memperkirakan ukuran asosiasi berdasarkan peringkat (non-parametrik). Tes ini dapat digunakan jika data tidak terdistribusi secara normal

res2 <- cor.test(my_data$wt, my_data$mpg,  method="kendall")
summary(res2)

    Kendall's rank correlation tau
data:  my_data$wt and my_data$mpg
z = -5.7981, p-value = 6.706e-09
alternative hypothesis: true tau is not equal to 0
sample estimates:
       tau 
-0.7278321 

Interpretasi Uji Korelasi Kendall menggunakan R

tau adalah koefisien korelasi Kendall.

Koefisien korelasi antara x dan y adalah -0,7278 dan nilai-p adalah 6,70610 pangkat {- 9}.

wt dan mpg secara signifikan berkorelasi (memiliki hubungan). Koefisien korelasi -0.72, kekuatan hubungan cukup kuat, dan arah hubungan terbalik (berkorelasi negatif), p-value 0.000

Uji Korelasi Spearman menggunakan R

Cara menghitung koefisien korelasi Spearman menggunakan R:

Uji statistik Spearman juga digunakan untuk memperkirakan ukuran asosiasi berdasarkan peringkat (non-parametrik).

res2 <-cor.test(my_data$wt, my_data$mpg,  method = "spearman")
summary(res2)
    Spearman's rank correlation rho
data:  my_data$wt and my_data$mpg
S = 10292, p-value = 1.488e-11
alternative hypothesis: true rho is not equal to 0
sample estimates:
      rho 
-0.886422 

Interpretasi Uji Korelasi Spearman menggunakan R

rho adalah koefisien korelasi Spearman.

Koefisien korelasi antara x dan y adalah -0,8864 dan nilai-p adalah 1,48810 ^ {- 11}.

wt dan mpg secara signifikan berkorelasi (memiliki hubungan). Koefisien korelasi -0.88, kekuatan hubungan kuat, dan arah hubungan terbalik (berkorelasi negatif), p-value 0.000

Interpretasi Secara Umum

Koefisien korelasi berada pada rentang antara -1 dan 1:

     -1 menunjukkan korelasi negatif yang kuat: ini berarti bahwa setiap kali x meningkat, y berkurang
     0 berarti tidak ada hubungan antara dua variabel (x dan y)
     1 menunjukkan korelasi positif yang kuat: ini berarti bahwa y meningkat dengan x

Uji Korelasi SPSS

Terdapat 5 tahap untuk melakukan uji korelasi SPSS2

Cara menghitung koefisien korelasi menggunakan SPSS:

Tahap 1

Pastikan SPSS yang sobat statistik miliki adalah SPSS asli, bukan bajakan, bukan pula crack

Jika sobat statistik belum memiliki SPSS asli, hubungi jasa olah data USH Indonesia, cabang offline: jasa olah data Jogja, Bandung, dan Semarang

Tahap 2

Jika SPSS sobat statistik sudah asli, barulah memulai tahap 2. Stop di tahap 1 jika aplikasi sobat statistik masih bajakan

Import data dari excel ke SPSS atau dari .sav ke SPSS

baca juga: hukum menggunakan software bajakan

Tahap 3

uji korelasi SPSS

Cara menghitung koefisien korelasi menggunakan SPSS

Tahap 4

Akan muncul kotak / dialog box seperti di bawah:

jasa-spss-jasa-olah-data-ush-indonesia

Pilihlah variabel yang ingin sobat statistik ujikan. Lalu pilih metode yang sesuai (apakah pearson, kendal, atau spearman)

Tahap 5

Setelah sobat statistik klik “OK” akan muncul output uji korelasi SPSS seperti di bawah:

output-uji-korelasi-spss-jasa-olah-data-ush-indonesia

Interpretasi Uji Korelasi SPSS

Height dan Jump_Dist secara signifikan berkorelasi (memiliki hubungan). Koefisien korelasi 0.7 kekuatan hubungan cukup kuat, dan arah hubungan sejajar (berkorelasi positif), p-value 0.005

Referensi:

  1. http://www.sthda.com/english/wiki/correlation-test-between-two-variables-in-r
  2. https://statistics.laerd.com/spss-tutorials/pearsons-product-moment-correlation-using-spss-statistics.php