Salam, hari ni kita bercerita sedikit tentang R squared.
R squared, (R2 = R kuasa dua) adalah peratus varians dalam pemboleh ubah bersandar (dependent variable) yang diterangkan oleh pemboleh ubah tidak bersandar (independent variable) dalam model regresi. R square adalah ukuran statistik yang menunjukkan bagaimana data terletak hampir dengan garis regresi yang dipadankan. Nilai R square adalah di antara 0 – 1, atau bila diterjemahkan dalam bentuk peratus, antara 0-100%.
R square juga dikenali
dengan nama coefficient of determination.
Secara amnya, semakin
tinggi nilai R square, semakin bagus data berpadanan dengan model. Namun,
sebelum kita bergantung pada nilai R square ini, beberapa diagnostik lain harus
disemak terlebih dahulu untuk mengelakkan dapatan analisis yang tidak tepat.
Rumus bagi R squared adalah seperti berikut:
Gambaran
visual berkenaan R square
Sumber: google
R squared untuk model
regresi di sebelah kiri adalah 38% manakala di sebelah kanan adalah 87.4%.
Semakin tinggi varians yang dikira oleh model regresi, semakin hampir poin-poin
data akan terletak berdekatan garis regresi yang dipadankan.
Adakah nilai r square
yang rendah membawa implikasi yang buruk? Tidak, kerana ada beberapa sebab mengapa
nilai yang rendah dalam kajian dikatakan ok sahaja. Dalam sesetengah bidang, adalah dijangka bahawa
nilai R square adalah rendah. Contohnya bidang yang cuba untuk meramal
tingkahlaku manusia, seperti kajian psikologi, lazimnya akan mendapat nilai R square
yang kurang daripada 50%. Ini kerana dikatakan manusia adalah lebih sukar untuk
diramal, berbanding dengan sesuatu proses fizikal.
Ok sekian sahaja untuk kali ini. Ada cerita dan masa saya kongsi lagi. Terima kasih sudi membaca.
No comments:
Post a Comment