CERITA 30: Analisis Regresi Logistik Binomial (binary
logistic regression analysis)
Regresi logistik binomial digunakan untuk
meramalkan pembolehubah bersandar dikotomi (terbahagi kepada 2 kategori) berdasarkan
satu atau lebih pembolehubah bebas selanjar atau nominal. Ia adalah jenis
regresi logistik yang paling biasa dan selalunya dirujuk sebagai regresi
logistik. Bahasa paling mudah, regresi logistik binomial ni bezanya dengan analisis
regresi berganda/ mudah adalah bergantung pada pemboleh ubah bersandarnya yg
mempunyai hanya 2 kategori.
Dalam erti kata lain, masa bila kita nak guna
regresi logistik binomial ni? Apabila kita lihat pemboleh ubah bersandar (y)
mempunyai 2 kategori, seperti (hidup / mati), (ya / tidak), (lulus / gagal) ,
(merokok/ tidak merokok), dan sebagainya. Dalam spss, lazimnya pemboleh ubah yang
kita minat untuk ramal atau kaji adalah kebarangkalian orang yang
lulus/hidup/merokok ini dikod sebagai 1,
manakala pemboleh ubah satu lagi dikod sebagai 0.
Untuk menganalisis menggunakan kaedah ini dalam
SPSS, pergi ke Analyze > Regression > Binary Logistic.
Masukkan pemboleh ubah bersandar (y) dalam
kotak ‘dependent’, pemboleh ubah tidak bersandar (x) dalam kotak ‘covariates’.
Di sini saya menggunakan SPSS versi 27, seperti berikut:
Sekiranya pemboleh tidak bersandar kita terdiri daripada pemboleh ubah nominal seperti kategori umur (umur< 18 thn atau umur >18 thn), kategori tahap pendidikan ( SPM, ijazah, master, phd), maka klik kotak ‘categorical’ untuk memberitahu spss bahawa ini adalah pemboleh ubah nominal. Kemudian pilih sama ada kategori yang dikod sebagai paling rendah untuk menjadi ‘reference category’ atau sebagainya.
Contohnya bagi
kategori umur (umur < 18 thn =1, atau
umur >18 thn = 2), jika kita pilih
reference category sebagai ‘last’, maka umur >18 thn = 2, akan dijadikan sebagai rujukan dalam
analisis. Bila nak interpret nanti, kita harus laporkan umur >18 thn sebagai
rujukan, apabila membuat perbandingan dengan umur < 18 thn. Jadi ini
bergantung pada pengkaji itu sendiri untuk memilih reference category yg mana.
Kemudian
pada kotak ‘options’ klik pada ‘hosmer-lemeshow goodness of fit’ dan ‘CI for
exp(B)’ untuk output nanti. Selepas itu, klik ok.
Output pada Block 0 menunjukkan model yang hanya mempunyai intercept/ constant sahaja. Untuk result dalam laporan, kita rujuk output pada Block 1, iaitu model yang ada semua faktor/pemboleh ubah tidak bersandar.
Output pada ‘Omnibus tests of model coefficients’, menerangkan sama ada model keseluruhan kita apabila dimasukkan kesemua faktor adalah signifikan iaitu lebih baik berbanding model asas yang tidak dimasukkan faktor.
Omnibus Tests of Model
Coefficients |
||||
|
Chi-square |
df |
Sig. |
|
Step 1 |
Step |
3.957 |
1 |
.047 |
Block |
3.957 |
1 |
.047 |
|
Model |
3.957 |
1 |
.047 |
Berikut adalah penerangan yang boleh dibuat:
Omnibus Tests of Model Coefficients shows that
overall model are statistically significant when compared to the null model,
χ2(1) = 3.957, p = 0.047.
Pada jadual ‘model summary’, kita berminat untuk melihat nilai pada Cox & Snell R2 dan Nagelkerke R2. Kedua-dua nilai ini boleh dilaporkan seperti R2 dalam analisis regresi yang biasa. Semakin hampir nilai Cox & Snell R2 dan Nagelkerke R2 kepada 1, semakin tinggi peratus variation dalam pemboleh bersandar dapat diterangkan oleh pemboleh ubah tidak bersandar.
Akhir sekali pada ‘variables in the equation’, adalah untuk melihat kesan setiap pemboleh ubah tidak bersandar terhadap model, iaitu dengan melihat nilai signfikan (sig). Sekiranya pemboleh ubah tidak bersandar adalah selanjar, boleh laporkan secara terus samada signfikan atau tidak. Bagi pemboleh ubah tidak bersandar yang nominal seperti umur tadi (umur < 18 thn =1, atau umur >18 thn = 2), kategori rujukan (umur >18 thn = 2) kita perlu laporkan, odds untuk responden mendpt penyakit xx (cth) adalah 1.026 (nilai ini merujuk pada Exp(B) lebih tinggi bagi responden umur < 18 thn berbanding umur >18 thn.
Sekian dahulu, terima kasih.
No comments:
Post a Comment