korelasi dan regresi linear | java php laravel linux mysql sql bootstrap html css query java php laravel linux mysql sql bootstrap html css query: korelasi dan regresi linear

Saturday, April 25, 2026

korelasi dan regresi linear

📊 Artikel 10 dari 14 — Seri Belajar Statistik

Ada Hubungan Apa?
Korelasi & Regresi Linear
yang Sering Disalahpahami

Dari "nilai ujian naik kalau belajar lebih lama" sampai prediksi penjualan — pelajari cara kerja korelasi dan regresi linear dengan benar, bukan sekadar hafal rumus.

Korelasi Pearson/Spearman Regresi Linear Sederhana Interpretasi R²
⏱️ Estimasi baca: 15–18 menit
🎓 Level: S1 & S2
📅 Update: 2026

Pernah dengar kalimat seperti ini: "Semakin banyak iklan yang ditayangkan, semakin tinggi penjualan produk." Atau mungkin di skripsi kamu sendiri: "Ada hubungan antara motivasi belajar dengan prestasi akademik." Nah, dua kalimat itu sebenarnya menyinggung dua konsep statistik yang berbeda tapi sering dicampuradukkan — yaitu korelasi dan regresi linear statistik. Keduanya memang berkaitan, tapi cara kerja, fungsi, dan interpretasinya punya perbedaan penting yang sering disalahpahami oleh mahasiswa, bahkan oleh sebagian peneliti sekalipun.

Artikel ini adalah bagian dari seri 14 Artikel Belajar Statistik: 📚 Statistik from Zero to Zorro — sebuah roadmap belajar statistik dari nol sampai bisa. Kalau kamu sedang nulis skripsi, tesis, atau artikel ilmiah dan bingung kapan pakai korelasi, kapan pakai regresi, dan bagaimana membaca angka-angkanya — artikel ini dibuat persis untuk kamu.

📌 Korelasi: Mengukur Kekuatan Hubungan Dua Variabel

Bayangkan kamu sedang mengamati teman-teman sekelas: yang sering belajar cenderung dapat nilai bagus, yang jarang belajar nilainya lebih rendah. Ada pola yang kamu rasakan — seiring bertambahnya jam belajar, nilai ujian cenderung naik. Nah, pola inilah yang diukur oleh korelasi.

Secara formal, korelasi adalah ukuran statistik yang menggambarkan seberapa kuat dan ke arah mana hubungan linear antara dua variabel (Gravetter & Wallnau, 2017). Korelasi tidak menyatakan bahwa satu variabel menyebabkan variabel lain — ia hanya mengukur keterkaitan. Nilai korelasi dinyatakan dalam koefisien korelasi (r) yang berkisar dari −1 hingga +1.

📐 Formula & Nilai Acuan

−1 ≤ r ≤ +1

r = −1
Korelasi negatif sempurna
r = 0
Tidak ada hubungan linear
r = +1
Korelasi positif sempurna
Nilai |r| Interpretasi Contoh Konteks
0,00 – 0,19 Sangat lemah Hubungan hampir tidak ada
0,20 – 0,39 Lemah Harga dan rating toko online
0,40 – 0,59 Sedang Jam belajar vs nilai ujian
0,60 – 0,79 Kuat Penghasilan vs pengeluaran RT
0,80 – 1,00 Sangat kuat Tinggi badan vs berat badan

Kategori berdasarkan pedoman umum (Sugiyono, 2019)

⚡ Insight Penting — Pearson vs Spearman, Pilih yang Mana?

Korelasi Pearson digunakan ketika kedua variabel berskala interval/rasio dan berdistribusi normal — ini yang paling umum dipakai di skripsi. Sedangkan Korelasi Spearman adalah alternatif non-parametrik yang cocok untuk data ordinal atau ketika asumsi normalitas tidak terpenuhi (Field, 2018). Jadi, kalau data kamu dari skala Likert 1–5 dan ukuran sampel kecil, pertimbangkan Spearman!

📈 Regresi Linear: Bukan Sekadar Hubungan, Tapi Prediksi

Kalau korelasi menjawab pertanyaan "seberapa erat hubungannya?", maka regresi linear menjawab pertanyaan "seberapa besar pengaruhnya, dan bisakah kita memprediksinya?". Regresi linear adalah metode statistik untuk memodelkan hubungan antara satu variabel dependen (Y) dan satu atau lebih variabel independen (X) dalam bentuk persamaan garis lurus (Triola, 2018).

Analoginya begini: bayangkan kamu punya warung mie ayam di Surabaya. Kamu ingin tahu — kalau besok hujan deras, kira-kira berapa porsi yang terjual? Dengan regresi linear, kamu bisa membangun model prediksi berdasarkan data historis: jumlah porsi terjual (Y) diprediksi dari intensitas hujan (X).

📐 Persamaan Regresi Linear Sederhana

Ŷ = a + bX

Ŷ = nilai Y yang diprediksi
a = konstanta (intersep/titik potong)
b = koefisien regresi (slope)
X = nilai variabel independen

🛠️ Langkah Analisis Regresi Linear di SPSS

1

Input Data & Uji Asumsi

Pastikan data sudah bersih. Uji normalitas residual, linieritas hubungan, dan tidak ada outlier ekstrem (Montgomery & Runger, 2018).

2

Jalankan Analisis di SPSS

Klik Analyze → Regression → Linear. Masukkan variabel dependen (Y) dan independen (X), lalu klik OK.

3

Baca Model Summary (R²)

Lihat nilai R Square — ini menunjukkan persentase variasi Y yang bisa dijelaskan oleh X (Priyatno, 2018).

4

Uji Signifikansi (ANOVA & t-test)

Cek tabel ANOVA: jika Sig. < 0,05, model regresi signifikan secara statistik. Cek juga nilai t dan Sig. pada tabel Coefficients.

5

Interpretasi & Buat Persamaan

Ambil nilai konstanta (a) dan koefisien (b) dari tabel Coefficients. Tulis persamaan: Ŷ = a + bX. Jadikan dasar interpretasi dan prediksi.

💻 Contoh Output SPSS — Coefficients Table

Model         B (Unstd.)   Std. Error   Beta    t       Sig.
─────────────────────────────────────────────────────────────
(Constant)    12.450        2.310               5.389   .000
Jam_Belajar    3.720        0.480        .712    7.750   .000
─────────────────────────────────────────────────────────────

➜  Persamaan: Ŷ = 12.450 + 3.720X
   Artinya: Setiap tambah 1 jam belajar, nilai ujian
   diprediksi naik 3.72 poin.

Model Summary:  R = .712  |  R² = .507  |  Adj. R² = .499
➜  X menjelaskan 50.7% variasi pada Y.

🔍 Korelasi vs Regresi: Beda Tujuan, Beda Interpretasi

Ini adalah bagian yang paling sering bikin bingung. Banyak mahasiswa yang pakai korelasi padahal pertanyaan penelitiannya menuntut regresi, atau sebaliknya. Mari kita bedah perbedaannya secara praktis.

⚖️ Korelasi vs Regresi — Perbandingan Langsung

📊 KORELASI

  • Tujuan: mengukur kekuatan hubungan
  • Output utama: nilai r (koefisien korelasi)
  • Tidak ada variabel dependen/independen
  • Tidak bisa untuk prediksi
  • Arah hubungan: positif atau negatif
  • Contoh RQ: "Apakah ada hubungan antara stres dan IPK?"

📈 REGRESI LINEAR

  • Tujuan: memprediksi & mengukur pengaruh
  • Output utama: persamaan Ŷ = a + bX dan R²
  • Ada variabel X (independen) dan Y (dependen)
  • Bisa dipakai untuk prediksi nilai Y
  • Besar pengaruh: koefisien regresi (b)
  • Contoh RQ: "Seberapa besar pengaruh stres terhadap IPK?"

🔥 Fakta Menarik — Korelasi Bukan Kausalitas!

Ada korelasi tinggi antara konsumsi es krim dan kasus tenggelam — tapi bukan berarti es krim menyebabkan orang tenggelam! Keduanya sama-sama meningkat di musim panas. Ini disebut spurious correlation atau hubungan palsu. Ingat: korelasi dan regresi linear statistik hanya mengukur hubungan statistik, bukan kausalitas. Untuk klaim kausalitas, kamu butuh desain eksperimental atau pendekatan kausal yang lebih ketat (Moore et al., 2021).

🎯 R² (R-Squared): Ukuran Seberapa Bagus Model Kamu

Salah satu angka yang paling sering muncul tapi salah diinterpretasikan adalah R² (R-Squared) atau koefisien determinasi. Nilai ini menunjukkan proporsi variasi pada variabel Y yang dapat dijelaskan oleh variabel X dalam model (Walpole et al., 2012). Secara sederhana: seberapa besar X bisa "menjelaskan" perilaku Y?

Misalnya R² = 0,507 artinya 50,7% variasi nilai ujian mahasiswa dapat dijelaskan oleh jam belajar. Sisanya, 49,3%, dijelaskan oleh faktor lain yang tidak masuk dalam model — seperti kecerdasan, kondisi kesehatan, atau kualitas belajar (bukan sekadar durasinya).

💡 Tips — Berapa R² yang "Cukup"?

Tidak ada angka R² universal yang selalu "bagus". Untuk ilmu sosial dan pendidikan, R² = 0,30 sudah bisa diterima. Di bidang teknik atau ilmu eksak, ekspektasinya jauh lebih tinggi. Yang penting: interpretasikan R² sesuai konteks bidang studimu, dan jangan hanya mengejar angka besar. Sebuah model sederhana yang bermakna lebih baik dari model rumit yang overfitting (Hair et al., 2019).

📐 Lebih Dalam untuk S2: Asumsi, Keterbatasan, dan Implikasi

Bagi mahasiswa S2, pemahaman korelasi dan regresi tidak bisa berhenti di "koefisiennya 0,712 dan signifikan". Kamu perlu memahami asumsi-asumsi yang mendasari validitas model — karena jika asumsi dilanggar, output statistik bisa menyesatkan.

🎓 Asumsi Klasik Regresi Linear (Wajib Dipenuhi)

1. Linieritas Hubungan antara X dan Y harus bersifat linear. Cek dengan scatter plot atau uji Lagrange Multiplier.
2. Normalitas Residual (ε) harus berdistribusi normal. Uji dengan Kolmogorov-Smirnov atau Shapiro-Wilk (Field, 2018).
3. Homoskedastisitas Varians residual harus konstan di sepanjang nilai X. Jika tidak (heteroskedastisitas), estimasi SE tidak valid.
4. Independensi Residual harus independen satu sama lain. Uji dengan Durbin-Watson (nilai mendekati 2 = baik).
5. Tidak Multikolinieritas Khusus regresi berganda: variabel X tidak boleh saling berkorelasi tinggi. Cek VIF — nilai >10 jadi masalah (Hair et al., 2019).

⚠️ Perhatian S2 — Keterbatasan Regresi Linear Sederhana

Regresi linear sederhana hanya mampu memodelkan satu prediktor. Dalam penelitian tesis yang lebih kompleks, kamu akan membutuhkan regresi berganda, regresi logistik (untuk Y kategorik), atau bahkan Structural Equation Modeling (SEM) jika ada variabel laten. Regresi linear juga peka terhadap outlier — satu data ekstrem bisa menggeser garis regresi secara signifikan (Santoso, 2019). Pertimbangkan robust regression sebagai alternatif jika outlier tidak bisa dihilangkan.

💻 Kode R — Regresi Linear Sederhana

# Membuat model regresi
model <- lm(nilai_ujian ~ jam_belajar, data = df)

# Ringkasan output
summary(model)

# Output:
Coefficients:
            Estimate  Std. Error  t value  Pr(>|t|)    
(Intercept)  12.450      2.310     5.389   1.2e-06 ***
jam_belajar   3.720      0.480     7.750   8.4e-10 ***

Residual standard error: 5.23 on 98 degrees of freedom
Multiple R-squared: 0.5069, Adjusted R-squared: 0.4989
F-statistic: 60.06 on 1 and 98 DF, p-value: 8.4e-10

✅ Kesimpulan: Apa yang Perlu Kamu Ingat

Setelah membaca artikel ini, kamu seharusnya sudah bisa membedakan dan memilih antara korelasi dan regresi linear statistik sesuai pertanyaan penelitianmu. Ini ringkasannya:

Korelasi mengukur kekuatan dan arah hubungan dua variabel — bukan pengaruh. Output utamanya adalah nilai r antara −1 dan +1.
Regresi linear membangun model prediksi berbentuk persamaan Ŷ = a + bX, dan mengukur seberapa besar X mempengaruhi Y secara linear.
R² (koefisien determinasi) menunjukkan persentase variasi Y yang dijelaskan oleh model — interpretasikan sesuai konteks bidang studi, bukan kejar angka besar semata.
Korelasi ≠ kausalitas. Jangan klaim "X menyebabkan Y" hanya karena korelasinya tinggi — butuh desain penelitian yang lebih kuat untuk itu.
Untuk S2: selalu uji asumsi klasik sebelum menginterpretasikan output regresi, dan pertimbangkan model yang lebih kompleks jika penelitianmu memerlukannya.

📖 Artikel Berikutnya dalam Seri

Di Artikel 11, kita akan bahas Chi-Square — uji statistik andalan untuk data kategorik. Kapan pakai uji independensi? Apa itu uji goodness of fit? Semua akan dibahas tuntas dengan contoh konkret!

Artikel ini bermanfaat? Yuk bantu teman-teman yang lagi berjuang dengan statistik! 🙌

💬 Tulis Komentarmu 📤 Share Artikel
#Korelasi #RegresiLinear #Pearson #Spearman #R-Squared #AnalisisData
📚

Daftar Referensi

Format APA 7th Edition

  1. Field, A. (2018). Discovering statistics using IBM SPSS statistics (5th ed.). SAGE Publications.
  2. Gravetter, F. J., & Wallnau, L. B. (2017). Statistics for the behavioral sciences (10th ed.). Cengage Learning.
  3. Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E. (2019). Multivariate data analysis (8th ed.). Cengage Learning.
  4. Montgomery, D. C., & Runger, G. C. (2018). Applied statistics and probability for engineers (7th ed.). Wiley.
  5. Moore, D. S., McCabe, G. P., & Craig, B. A. (2021). Introduction to the practice of statistics (10th ed.). W. H. Freeman.
  6. Priyatno, D. (2018). SPSS panduan mudah olah data bagi mahasiswa dan umum. Andi Offset.
  7. Santoso, S. (2019). Mahir statistik multivariat dengan SPSS. PT Elex Media Komputindo.
  8. Sugiyono. (2019). Metode penelitian kuantitatif, kualitatif, dan R&D (2nd ed.). Alfabeta.
  9. Walpole, R. E., Myers, R. H., Myers, S. L., & Ye, K. (2012). Probability and statistics for engineers and scientists (9th ed.). Pearson.
📚

Statistik from Zero to Zorro — Daftar Isi Lengkap

Lihat roadmap lengkap 14 artikel seri belajar statistik — dari konsep dasar hingga analisis multivariat!

🗺️ Lihat Daftar Isi Seri Lengkap →

No comments:

Post a Comment

saifiahmada.com adalah blog belajar programming Indonesia, membahas lengkap materi bahasa pemrograman: code HTML, CSS, Bootstrap, Desain, PHP, MySQL, coding Java, Query, SQL, dan dunia linux