Saturday, 11 August 2018

CERITA 22: Crosstab dan hubungan antara dua pembolehubah nominal (Chi square)

CERITA 22: Hubungan (korelasi) antara dua pembolehubah (Chi square)

Assalamualaikum semua pembaca yang dihormati, topik ni dah lama simpan baru ada kesempatan untuk menulis.

Tabulasi silang (crosstabulation) 

Tabulasi silang (crosstabulation) adalah  satu jadual yang terdiri daripada beberapa kumpulan frekuensi bagi  beberapa pemboleubah.

Contoh kita nak tahu adakah pesakit patuh terhadap prosedur rawatan dialisis (Ya/Tidak) mengikut tahap pendidikan (SPM/Diploma/Ijazah)?

Di sini kita ada dua pembolehubah iaitu :
1. Kepatuhan terhadap prosedur rawatan (2 kategori)
2. Tahap pendidikan (3 kategori)

Maka daripada data yang kita ada, kita boleh bina jadual tabulasi silang di SPSS dengan klik Analyze> Descriptive Statistics > Crosstabs > Cells > Observed > Percentage (row) > OK

Maka terhasillah jadual tabulasi silang kita.


Statistik Khi Kuasa Dua (Chi-square statistics)

Digunakan apabila kita hendak mengetahui hubungan antara dua pembolehubah nominal, contoh seperti di atas, kita hendak tahu adakah terdapat hubungan antara kepatuhan dengan latar belakang pendidikan.

Berikut hipotesis kita:

Hipotesis null: Tiada hubungan antara kepatuhan dan latar belakang pendidikan
Hipotesis null: Terdapat hubungan antara kepatuhan dan latar belakang pendidikan


Maka lanjutan dari kaedah tadi;

Analyze> Descriptive Statistics > Crosstabs > Cells > Observed > Percentage (row)

Klik Statistics > Chi square and Phi Cramer's V > OK


Untuk melihat samada terdapat hubungan atau tidak, dalam jadual 'Chi-square test', kita melihat pada baris 'Pearson Chi Square' dan kemudian pada nilai 'asymptotic significance'. Jika nilai tersebut < 0.05, maka kita tolak hipotesis null dan ini bermaksud terdapat hubungan antara dua pembolehubah tersebut.

Sekiranya terdapat hubungan, selanjutnya kita lihat jadual 'Symmetric measures' dan nilai Phi dan Cramer's V digunakan untuk melihat kekuatan hubungan antara dua pembolehubah tersebut dan bolehlah kita tafsirkannya sebagai hubungan positif/negatif yang (sangat lemah, lemah, sederhana, kuat, sangat kuat)

Catatan/ Amaran: OK, sebenarnya ada beberapa assumptions yang kita perlu patuhi sebelum boleh guna chi square ni, antara yang saya nak highlight di sini adalah, dalam jadual crosstabulation tadi, setiap expected frequency harus tidak kurang daripada 5! Jadi anda perlu hati-hati  terutama jika bilangan sampel anda kecil! Lazimnya berdasarkan pengalaman saya, kes ini banyak dalam bidang perubatan/klinikal. Jika tidak anda tak boleh guna ujian ini, antara alternatif lain yang boleh dipertimbangkan adalah untuk menggunakan Ujian Fisher Exact Test dll.

Sekian dulu untuk kali ini. Ada cerita saya kongsi lagi. Terima kasih sudi membaca.