Tuesday 23 April 2019

CERITA 24: R square(R kuasa dua) dalam analisis regresi

CERITA 24: R square (R kuasa dua) dalam analisis regresi


Salam, hari ni kita bercerita sedikit tentang R squared.

R squared, (R2 = R kuasa dua) adalah peratus varians dalam pemboleh ubah bersandar (dependent variable) yang diterangkan oleh pemboleh ubah tidak bersandar (independent variable) dalam model regresi. R square adalah ukuran statistik yang menunjukkan bagaimana data terletak hampir dengan garis regresi yang dipadankan. Nilai R square adalah di antara 0 – 1, atau bila diterjemahkan dalam bentuk peratus, antara 0-100%.

R square juga dikenali dengan nama coefficient of determination.

Secara amnya, semakin tinggi nilai R square, semakin bagus data berpadanan dengan model. Namun, sebelum kita bergantung pada nilai R square ini, beberapa diagnostik lain harus disemak terlebih dahulu untuk mengelakkan dapatan analisis yang tidak tepat.


Rumus bagi R squared adalah seperti berikut:




Gambaran visual berkenaan R square


Sumber: google


R squared untuk model regresi di sebelah kiri adalah 38% manakala di sebelah kanan adalah 87.4%. Semakin tinggi varians yang dikira oleh model regresi, semakin hampir poin-poin data akan terletak berdekatan garis regresi yang dipadankan.

Adakah nilai r square yang rendah membawa implikasi yang buruk? Tidak, kerana ada beberapa sebab mengapa nilai yang rendah dalam kajian dikatakan ok sahaja. Dalam sesetengah bidang, adalah dijangka bahawa nilai R square adalah rendah. Contohnya bidang yang cuba untuk meramal tingkahlaku manusia, seperti kajian psikologi, lazimnya akan mendapat nilai R square yang kurang daripada 50%. Ini kerana dikatakan manusia adalah lebih sukar untuk diramal, berbanding dengan sesuatu proses fizikal.

Ok sekian sahaja untuk kali ini. Ada cerita dan masa saya kongsi lagi. Terima kasih sudi membaca.