Analisis
regresi tidak saja digunakan untuk data-data kuantitatif, tetapi juga bisa
digunakan untuk data kualitatif. Jenis data kualitatif tersebut seringkali
menunjukkan keberadaan klasifikasi (kategori) tertentu, sering juga
dikatagorikan variabel bebas (X) dengan klasifikasi pengukuran nominal dalam
persamaan regresi.
Lalu bagaimana cara
kita memasukkan data kualitatif tersebut (yang tidak berbentuk angka) ke dalam
model regresi kita ?
Variabel kualitatif tersebut harus dikuantitatifkan
atributnya (cirinya). Untuk mengkuantitatifkan atribut variabel kualitatif,
dibentuk variabel dummy dgn nilai 1 dan 0. Nilai 1 menunjukkan adanya,
sedangkan nilai 0 menunjukkan tidak adanya ciri kualitas tsb. Jadi, inilah yang
dimaksud dengan variabel dummy tersebut. Variabel dummy disebut juga variabel
indikator, biner, kategorik, kualitatif, boneka, atau variabel dikotomi.
Variabel Dummy pada prinsipnya merupakan perbandingan karakteristik Misalnya untuk membedakan jenis kelamin (pria
dan wanita), tempat tinggal (misal desa dan kota), tingkat pendidikan (SD, SMP,
SMA, PT), agama (Islam, Kristen, Katolik, Hindu, Budha, dll), pembedaan periode
waktu (misal, sebelum krisis ekonomi dan setelah krisis ekonomi), Perbandingan
kondisi (besaran/jumlah) konsumen yang merasa puas terhadap suatu produk dengan
konsumen yang tidak puas, Perbandingan besarnya gaji antara laki-laki dan
perempuan. dan
kategori-kateogori lain yang ingin dimasukkan ke dalam analisis.
Metode yang digunakan adalah mengganti informasi yang bersifat kategori,
misalnya untuk jenis kelamin (pria dan wanita) diwakili dengan angka 1 dan 0.
Dalam prakteknya, misalnya kategori data pria diganti dengan angka 1, dan
kategori data wanita diganti dengan angka 0, atau sebaliknya.variabel
jenis kelamin. Jika nilai 1 digunakan untuk laki-laki maka nilai 0 menunjukkan
bukan laki-laki (perempuan), atau sebaliknya. (Kategori yg diberi nilai 0
disebut kategori dasar, dlm artian bahwa perbandingan dibuat atas kategori
tsb.)
Jika variabel kualitatif tsb terdiri lebih dari dua kategori,
jumlah variabel dummy yg dibentuk harus sebanyak n-1, dimana n adalah banyaknya
kategori variabel tsb. Misalnya variabel jenis pekerjaan dgn tiga kategori
yaitu pekerja kasar, setengah terampil dan pekerja terampil, maka dibentuk dua
variabel dummy sebagai berikut:
Alternatif 1
Dk1 = 1 jika kasar, = 0 jika lainnya
Dk2 = 1 jika setengah terampil, = 0 jika lainnya
Pada alternatif 1,
Dk1 = 0, Dk2 = 0 →
terampil
Dk1 = 0, Dk2 = 1 → ½ terampil
Dk1 = 1, Dk2 = 0 → kasar
Alternatif 2
Dk1 = 1 jika setengah terampil, = 0 jika lainnya
Dk2 = 1 jika terampil, = 0 jika lainnya
Pada alternatif 2,
Dk1 = 0, Dk2 = 0 → kasar
Dk1 = 0, Dk2 = 1 → terampil
Dk1 = 1, Dk2 = 0 → ½ terampil
(Catatan: untuk lebih jelasnya lihat data yang dilampirkan.
Dalam data tersebut, kita menggunakan alternatif 1 untuk membentuk variabel
dummy jenis pekerjaan).
1. Regresi Atas Satu Variabel Kualitatif (Dua Kategori)
Dari data yang diberikan, misalnya kita ingin meregresikan
variabel kualitatif jenis kelamin (sex) terhadap penghasilan, dengan
kuantifikasi laki-laki =1 dan perempuan =0
Model regresi yang kita bentuk :
Y = b1 + b2
Ds
Dimana : Y = penghasilan
Ds = variabel dummy untuk seks
Berdasarkan pengolahan data, persamaan regresi
yang terbentuk sebagai berikut:
Model ini memungkinkan untuk mengetahui perbedaan
penghasilan berdasarkan jenis kelamin.
Interpretasinya : b0 = rata-rata penghasilan pekerja
perempuan, b1 = besarnya perbedaan penghasilan
pekerja laki-laki dengan perempuan, dan b0 + b1 merupakan rata-rata penghasilan
pekerja laki-laki. Karena variabel Ds signifikan, artinya secara statistik
terdapat perbedaan nyata penghasilan laki-laki dengan perempuan
Jika Ds=0, artinya rata-rata penghasilan pekerja perempuan
adalah 647884 (sebesarb0). Jika Ds=1,
artinya rata-rata penghasilan pekerja laki-laki adalah 647884 + 552801 =1200685
(sebesar b0 + b 1)
2. Regresi Atas Satu Variabel Kuantitatif dan Satu Variabel Kualitatif (dua kategori)
Dari data yang sudah diberikan, misalnya kita bentuk suatu
model regresi sbb:
Y = b0 + b1 Ds
+ b2 Pd + ei
Dimana : Ds = dummy jenis kelamin
Pd = pendidikan
Berdasarkan pengolahan datanya, ditampilkan hasilnya
sebagai berikut :
Interpretasi : Pada setiap tingkat pendidikan, terdapat
perbedaan besarnya penghasilan laki-laki dan perempuan. Perbedaaan tsb
besar-nya adalah 331928 (sebesar b 1 )
lebih tinggi untuk laki-laki
Misalnya jika tahun pendidikan (Pd) = 15, maka
Jika Ds=0, rata-rata penghasilan perempuan adalah
Y = -1039341 + 331928 (0) + 134978 (15) = 985329
Jika Ds=1, rata-rata penghasilan laki-laki adalah
Y = -1039341 + 331928 (1) + 134978 (15) = 1317257
3. Regresi Atas Satu Variabel Kuantitatif dan Satu Variabel Kualitatif (lebih dua kategori)
Dari data yang diberikan, misalnya kita bentuk suatu model
regresi sbb:
Y = b0 + b 1 Dk1
+ b2 Dk2
+ b3 Pd
+ ei
Dimana : Dk1 = dummy jenis pekerjaan
1 = setengah terampil
0 = lainnya
Dk2 = dummy jenis pekerjaan
1 = terampil
0 = lainnya
Pd
= pendidikan
Berdasarkan pengolahan datanya, ditampilkan hasilnya
sebagai berikut :
Interpretasi :
Jika Dk1 = 0, Dk2 = 0 ==> pekerja kasar
Jika Dk1 = 1, Dk2 = 0 ==> pekerja setengah terampil
Jika Dk1 = 0, Dk2 = 1 ==> pekerja terampil
Pada setiap tingkat pendidikan, terdapat perbedaan
penghasilan pekerja kasar, setengah terampil dan terampil.
Pekerja setengah terampil memiliki penghasilan 475244
(sebesar b1) lebih tinggi
dibandingkan pekerja kasar.
Pekerja terampil memiliki penghasilan 590905 (sebesar b2) lebih tinggi
dibandingkan pekerja kasar.
Misalnya jika tahun pendidikan (Pd) = 15, maka
Jika Dk1=0 dan Dk2=0, rata-rata penghasilan pekerja kasar
adalah:
Y = -1286520 + 475244 (0) + 590905 (0) + 145168 (15) =
891000
Jika Dk1=1 dan Dk2=0, rata-rata penghasilan pekerja ½
terampil :
Y = -1286520 + 475244 (1) + 590905 (0) + 145168 (15) =
1366244
Jika Dk1=0 dan Dk2=1, rata-rata penghasilan pekerja
terampil:
Y = -1286520 + 475244 (1) + 590905 (1) + 145168 (15) =
1481905
4. Membandingkan Dua Regresi dengan Variabel Dummy
Secara implisit, teknik penggunaan variabel dummy (dari
pembahasan sebelum ini), pada dasarnya mengandung asumsi bahwa variabel
kualitatif mempengaruhi intersep tetapi tidak mempengaruhi koefisien kemiringan
dari berbagai regresi sub-kelompok. Kita dapat menghindari asumsi ini dengan
menggunakan teknik “pooling” (mengelompokkan), dengan dasar pemikiran sbb: (catatan:
banyak teknik yang lain, tetapi ini salah satunya)
Misalnya, dari model regresi terdahulu:
Y = b0 + b1 Ds + b2 Pd + ei
dimana : Ds = dummy jenis kelamin, Pd = pendidikan
Kita dapat merubah model ini dengan meregresi secara
terpisah antara pekerja perempuan dan laki-laki sebagai berikut:
Regresi untuk pekerja perempuan
Y = b0 + b1 Pd + ei
Regresi untuk pekerja laki-laki
Y = b0 + b 1 Pd
+ ei
(Catatan: banyaknya sampel untuk laki-laki dan perempuan tidak perlu sama)
Dua persamaan regresi tersebut, memberikan empat
kemungkinan hasil sebagai berikut:
Semua kemungkinan tersebut dapat diuji jika kita mengelompokkan
(pool) semua sampel laki-laki dan perempuan, dengan memodifikasi model menjadi
:
Y = b0 + b1 Ds
+ b2 Pd
+ b3 (Ds.Pd)
+ ei
Dibandingkan model sebelumnya, model ini mempunyai variabel
tambahan DsPd
Implikasi model ini sebagai berikut:
Jika Ds=0 (perempuan), maka model menjadi :
Y = b0 + b2 Pd
+ ei, setara dgn Y = b0 + b1 Pd
+ ei
Jika Ds=1 (laki-laki), maka model menjadi :
Y = (b0 + b1) + (b2 + b3 )Pd
+ ei, setara dgn Y = b0 + b1 Pd
+ ei
Dari data yg telah diberikan, kita meregresikan secara
terpisah untuk pekerja perempuan dan laki-laki didapatkan :
Regresi pekerja perempuan : Y = 12971 + 50793 Pd
Regresi pekerja laki-laki : Y = -1242495 + 172830 Pd
Dengan teknik “pooling” kita modifikasi model tersebut, dan
melalui perhitungan, persamaan regresinya menjadi :
Y = 12971 -1255466 Ds + 50793 Pd + 122036 DsPd
Jika Ds=0 (perempuan), persamaan regresi tsb menjadi:
Y = 12971 -1255466 (0) + 50793 Pd + 122036 (0)Pd
Y = 12971 + 50793 Pd
Jika Ds=1 (laki-laki), persamaan regresi tsb menjadi :
Y = 12971 -1255466 (1) + 50793 Pd + 122036 (1)Pd
Y = 12971 -1255466 + 50793 Pd + 122036 (1)Pd
Y = -1242495 + 172830 Pd
F Interpretasi model regresi (dengan DUMMY
Variabel):
v
Y = -1,96 + 0,12 X1 – 2,18
(0) Wanita
Y = -1,96 + 0,12 X1 – 2,18 (1) Pria
v
Koefisien 0,12 berarti :
Peningkatan
nilai rata-rata tingkat prestasi kerja untuk setiap kenaikan nilai tes bakat
sebesar 1 unit (berlaku untuk Wanita dan Pria)
v Koefisien regresi –2,18
hanya berlaku untuk Pria.
Jika seorang Pria mengikuti tes ini maka tingkat prestasi
kerja diramalkan turun 2,18 dengan anggapan nilai tes bakat konstan.
v
Dari
hasil hal 2 :
a.
Rata-rata
tingkat prestasi kerja (5,86) tidak jauh berbeda dengan Wanita (5,75).
b.
Tetapi rata-rata nilai tes bakat Pria (83) secara
signifikan lebih tinggi dari nilai tes wanita (64).
c.
Jika ada 2 pekerja, yang satu Wanita dan satu Pria
mengikuti tes dan keduanya mendapatkan nilai 70, maka estimasi tingkat
prestasi kerja wanita akan lebih tinggi 2,18 unit.
Y = -1,96 + 0,12 (70) = 6,44 Wanita
Y = -4,14 + 0,12 (70) = 4,26 Pria
v
Dari
hasil korelasi seperti pada tabel berikut :
(1)
Prestasi
|
(2)
Test Bakat
|
(3)
Sex
|
|
(1) Prestasi
(2) Test Bakat
(3) Sex
|
1.000
|
0.876
1.000
|
0.021
0.876
1.000
|
rY,X1 = 0,88 à Koefisien korelasi antara prestasi kerja dan
tes bakat, maka R2 = 0,77
rY,X2 = 0,02 à Koefisien korelasi antara prestasi kerja dan
jenis kelamin (kecil), artinya tingkat prestasi kerja tidak dipengaruhi
oleh jenis kelamin.
v Jika hasil tes bakat dan jenis kelamin
digunakan secara bersama-sama untuk memperhatikan prestasi kerja, 92%
variasi dapat dijelaskan. Artinya kedua variabel
mempunyai kontribusi penting bagi peramalan tingkat prestasi kerja.
MANFAAT LAIN VARIABEL DUMMY
Dalam analisis menggunakan data time series, variabel dummy
bermanfaat untuk membandingkan suatu kurun waktu dengan kurun waktu tertentu.
Misalnya:
◦
Bagaimana produksi PT Astra antara sebelum terjadi krisis dan
saat krisis ekonomi?
◦
Bagaimana minat masyarakat untuk menabung di Bank Syariah
setelah MUI mengeluarkan fatwa bahwa bunga haram?
◦
Apakah benar setiap bulan Desember harga dolar cenderung
naik?
◦
Apakah benar setiap hari senin harga saham Indofood naik?
Model diatas: Perbedaan hanya diakomodasi oleh
intersep. Bagaimana jika slop juga berbeda à Membandingkan 2 regresi
ANALISIS REGRESI DENGAN DUMMY VARIABEL
Diketahui data untuk
pengujian pengaruh PRESTASI KERJA oleh BAKAT yang juga dicurigai akan
dipengaruhi oleh perbedaan JENIS KELAMIN, sebagai berikut:
PrstasiKj TesBakat Sex
5 60 0
4 55 0
3 35 0
10 96 0
2 35 0
7 81 0
6 65 0
9 85 0
9 99 1
2 43 1
8 98 1
6 91 1
7 95 1
3 70 1
6 85 1
Jika diolah dengan MINITAB diperoleh hasil sebagai berikut:
Results for: DUMMY-PRESTASIKERJA-BAKAT.MTW
Regression Analysis: PrstasiKj versus TesBakat, Sex
The regression equation is
PrstasiKj = - 1.96 + 0.120 TesBakat
- 2.18 Sex
Predictor Coef
SE Coef T P
Constant -1.9565
0.7068 -2.77 0.017
TesBakat 0.12041
0.01015 11.86 0.000
Sex -2.1807 0.4503
-4.84 0.000
S = 0.786263 R-Sq = 92.1% R-Sq(adj) = 90.8%
Analysis of Variance
Source DF SS
MS F P
Regression 2
86.981 43.491 70.35
0.000
Residual Error 12
7.419 0.618
Total 14
94.400
referensi :