CERITA 30: Analisis Regresi Logistik Binomial (binary
logistic regression analysis)
Regresi logistik binomial digunakan untuk
meramalkan pembolehubah bersandar dikotomi (terbahagi kepada 2 kategori) berdasarkan
satu atau lebih pembolehubah bebas selanjar atau nominal. Ia adalah jenis
regresi logistik yang paling biasa dan selalunya dirujuk sebagai regresi
logistik. Bahasa paling mudah, regresi logistik binomial ni bezanya dengan analisis
regresi berganda/ mudah adalah bergantung pada pemboleh ubah bersandarnya yg
mempunyai hanya 2 kategori.
Dalam erti kata lain, masa bila kita nak guna
regresi logistik binomial ni? Apabila kita lihat pemboleh ubah bersandar (y)
mempunyai 2 kategori, seperti (hidup / mati), (ya / tidak), (lulus / gagal) ,
(merokok/ tidak merokok), dan sebagainya. Dalam spss, lazimnya pemboleh ubah yang
kita minat untuk ramal atau kaji adalah kebarangkalian orang yang
lulus/hidup/merokok ini dikod sebagai 1,
manakala pemboleh ubah satu lagi dikod sebagai 0.
Untuk menganalisis menggunakan kaedah ini dalam
SPSS, pergi ke Analyze > Regression > Binary Logistic.
Masukkan pemboleh ubah bersandar (y) dalam
kotak ‘dependent’, pemboleh ubah tidak bersandar (x) dalam kotak ‘covariates’.
Di sini saya menggunakan SPSS versi 27, seperti berikut:
Sekiranya
pemboleh tidak bersandar kita terdiri daripada pemboleh ubah nominal seperti kategori
umur (umur< 18 thn atau umur >18 thn), kategori tahap pendidikan ( SPM,
ijazah, master, phd), maka klik kotak ‘categorical’ untuk memberitahu spss
bahawa ini adalah pemboleh ubah nominal. Kemudian pilih sama ada kategori yang
dikod sebagai paling rendah untuk menjadi ‘reference category’ atau sebagainya.
Contohnya bagi
kategori umur (umur < 18 thn =1, atau
umur >18 thn = 2), jika kita pilih
reference category sebagai ‘last’, maka umur >18 thn = 2, akan dijadikan sebagai rujukan dalam
analisis. Bila nak interpret nanti, kita harus laporkan umur >18 thn sebagai
rujukan, apabila membuat perbandingan dengan umur < 18 thn. Jadi ini
bergantung pada pengkaji itu sendiri untuk memilih reference category yg mana.
Kemudian
pada kotak ‘options’ klik pada ‘hosmer-lemeshow goodness of fit’ dan ‘CI for
exp(B)’ untuk output nanti. Selepas itu, klik ok.
Output pada Block 0 menunjukkan model yang
hanya mempunyai intercept/ constant sahaja. Untuk result dalam laporan, kita
rujuk output pada Block 1, iaitu model yang ada semua faktor/pemboleh ubah tidak
bersandar.
Output pada ‘Omnibus tests of model
coefficients’, menerangkan sama ada model keseluruhan kita apabila dimasukkan kesemua
faktor adalah signifikan iaitu lebih baik berbanding model asas yang tidak
dimasukkan faktor.
Omnibus Tests of Model
Coefficients
|
|
Chi-square
|
df
|
Sig.
|
Step 1
|
Step
|
3.957
|
1
|
.047
|
Block
|
3.957
|
1
|
.047
|
Model
|
3.957
|
1
|
.047
|
Berikut adalah penerangan yang boleh dibuat:
Omnibus Tests of Model Coefficients shows that
overall model are statistically significant when compared to the null model,
χ2(1) = 3.957, p = 0.047.
Pada jadual ‘model summary’, kita berminat untuk
melihat nilai pada Cox & Snell R2 dan Nagelkerke R2. Kedua-dua
nilai ini boleh dilaporkan seperti R2 dalam analisis regresi yang
biasa. Semakin hampir nilai Cox & Snell R2 dan Nagelkerke R2
kepada 1, semakin tinggi peratus variation dalam pemboleh bersandar dapat
diterangkan oleh pemboleh ubah tidak bersandar.
Akhir sekali pada ‘variables in
the equation’, adalah untuk melihat kesan setiap pemboleh ubah tidak bersandar
terhadap model, iaitu dengan melihat nilai signfikan (sig). Sekiranya pemboleh
ubah tidak bersandar adalah selanjar, boleh laporkan secara terus samada signfikan
atau tidak. Bagi pemboleh ubah tidak bersandar yang nominal seperti umur tadi (umur < 18 thn =1, atau umur >18 thn = 2), kategori rujukan (umur >18 thn = 2) kita perlu laporkan, odds untuk responden
mendpt penyakit xx (cth) adalah 1.026 (nilai ini merujuk pada Exp(B) lebih
tinggi bagi responden umur < 18 thn berbanding umur >18 thn.
Sekian dahulu, terima kasih.