Statistik dan Data itu Mudah! : CERITA 30: Analisis Regresi Logistik Binomial (binary logistic regression analysis)

CERITA 30: Analisis Regresi Logistik Binomial (binary logistic regression analysis)

Regresi logistik binomial digunakan untuk meramalkan pembolehubah bersandar dikotomi (terbahagi kepada 2 kategori) berdasarkan satu atau lebih pembolehubah bebas selanjar atau nominal. Ia adalah jenis regresi logistik yang paling biasa dan selalunya dirujuk sebagai regresi logistik. Bahasa paling mudah, regresi logistik binomial ni bezanya dengan analisis regresi berganda/ mudah adalah bergantung pada pemboleh ubah bersandarnya yg mempunyai hanya 2 kategori.

Dalam erti kata lain, masa bila kita nak guna regresi logistik binomial ni? Apabila kita lihat pemboleh ubah bersandar (y) mempunyai 2 kategori, seperti (hidup / mati), (ya / tidak), (lulus / gagal) , (merokok/ tidak merokok), dan sebagainya. Dalam spss, lazimnya pemboleh ubah yang kita minat untuk ramal atau kaji adalah kebarangkalian orang yang lulus/hidup/merokok ini dikod sebagai 1, manakala pemboleh ubah satu lagi dikod sebagai 0.

Untuk menganalisis menggunakan kaedah ini dalam SPSS, pergi ke Analyze > Regression > Binary Logistic.

Masukkan pemboleh ubah bersandar (y) dalam kotak ‘dependent’, pemboleh ubah tidak bersandar (x) dalam kotak ‘covariates’. Di sini saya menggunakan SPSS versi 27, seperti berikut:

Sekiranya pemboleh tidak bersandar kita terdiri daripada pemboleh ubah nominal seperti kategori umur (umur< 18 thn atau umur >18 thn), kategori tahap pendidikan ( SPM, ijazah, master, phd), maka klik kotak ‘categorical’ untuk memberitahu spss bahawa ini adalah pemboleh ubah nominal. Kemudian pilih sama ada kategori yang dikod sebagai paling rendah untuk menjadi ‘reference category’ atau sebagainya.

Contohnya bagi kategori umur (umur < 18 thn =1, atau umur >18 thn = 2), jika kita pilih reference category sebagai ‘last’, maka umur >18 thn = 2, akan dijadikan sebagai rujukan dalam analisis. Bila nak interpret nanti, kita harus laporkan umur >18 thn sebagai rujukan, apabila membuat perbandingan dengan umur < 18 thn. Jadi ini bergantung pada pengkaji itu sendiri untuk memilih reference category yg mana.

Kemudian pada kotak ‘options’ klik pada ‘hosmer-lemeshow goodness of fit’ dan ‘CI for exp(B)’ untuk output nanti. Selepas itu, klik ok.

Output pada Block 0 menunjukkan model yang hanya mempunyai intercept/ constant sahaja. Untuk result dalam laporan, kita rujuk output pada Block 1, iaitu model yang ada semua faktor/pemboleh ubah tidak bersandar.

Output pada ‘Omnibus tests of model coefficients’, menerangkan sama ada model keseluruhan kita apabila dimasukkan kesemua faktor adalah signifikan iaitu lebih baik berbanding model asas yang tidak dimasukkan faktor.

Omnibus Tests of Model Coefficients
		Chi-square	df	Sig.
Step 1	Step	3.957	1	.047
	Block	3.957	1	.047
	Model	3.957	1	.047

Berikut adalah penerangan yang boleh dibuat:

Omnibus Tests of Model Coefficients shows that overall model are statistically significant when compared to the null model, χ2(1) = 3.957, p = 0.047.

Pada jadual ‘model summary’, kita berminat untuk melihat nilai pada Cox & Snell R² dan Nagelkerke R². Kedua-dua nilai ini boleh dilaporkan seperti R² dalam analisis regresi yang biasa. Semakin hampir nilai Cox & Snell R² dan Nagelkerke R² kepada 1, semakin tinggi peratus variation dalam pemboleh bersandar dapat diterangkan oleh pemboleh ubah tidak bersandar.

Akhir sekali pada ‘variables in the equation’, adalah untuk melihat kesan setiap pemboleh ubah tidak bersandar terhadap model, iaitu dengan melihat nilai signfikan (sig). Sekiranya pemboleh ubah tidak bersandar adalah selanjar, boleh laporkan secara terus samada signfikan atau tidak. Bagi pemboleh ubah tidak bersandar yang nominal seperti umur tadi (umur < 18 thn =1, atau umur >18 thn = 2), kategori rujukan (umur >18 thn = 2) kita perlu laporkan, odds untuk responden mendpt penyakit xx (cth) adalah 1.026 (nilai ini merujuk pada Exp(B) lebih tinggi bagi responden umur < 18 thn berbanding umur >18 thn.

Sekian dahulu, terima kasih.

Friday, 16 December 2022

CERITA 30: Analisis Regresi Logistik Binomial (binary logistic regression analysis)

No comments:

Post a Comment

Popular Posts

Blog Archive

Total Pageviews

Blog Archive