Regresi dengan Variabel Dummy

Analisis regresi tidak saja digunakan untuk data-data kuantitatif, tetapi juga bisa digunakan untuk data kualitatif. Jenis data kualitatif tersebut seringkali menunjukkan keberadaan klasifikasi (kategori) tertentu, sering juga dikatagorikan variabel bebas (X) dengan klasifikasi pengukuran nominal dalam persamaan regresi.
Lalu bagaimana cara kita memasukkan data kualitatif tersebut (yang tidak berbentuk angka) ke dalam model regresi kita ?
Variabel kualitatif tersebut harus dikuantitatifkan atributnya (cirinya). Untuk mengkuantitatifkan atribut variabel kualitatif, dibentuk variabel dummy dgn nilai 1 dan 0. Nilai 1 menunjukkan adanya, sedangkan nilai 0 menunjukkan tidak adanya ciri kualitas tsb. Jadi, inilah yang dimaksud dengan variabel dummy tersebut. Variabel dummy disebut juga variabel indikator, biner, kategorik, kualitatif, boneka, atau variabel dikotomi. Variabel Dummy pada prinsipnya merupakan perbandingan karakteristik Misalnya untuk membedakan jenis kelamin (pria dan wanita), tempat tinggal (misal desa dan kota), tingkat pendidikan (SD, SMP, SMA, PT), agama (Islam, Kristen, Katolik, Hindu, Budha, dll), pembedaan periode waktu (misal, sebelum krisis ekonomi dan setelah krisis ekonomi), Perbandingan kondisi (besaran/jumlah) konsumen yang merasa puas terhadap suatu produk dengan konsumen yang tidak puas, Perbandingan besarnya gaji antara laki-laki dan perempuan. dan kategori-kateogori lain yang ingin dimasukkan ke dalam analisis.
Metode yang digunakan adalah mengganti informasi yang bersifat kategori, misalnya untuk jenis kelamin (pria dan wanita) diwakili dengan angka 1 dan 0. Dalam prakteknya, misalnya kategori data pria diganti dengan angka 1, dan kategori data wanita diganti dengan angka 0, atau sebaliknya.variabel jenis kelamin. Jika nilai 1 digunakan untuk laki-laki maka nilai 0 menunjukkan bukan laki-laki (perempuan), atau sebaliknya. (Kategori yg diberi nilai 0 disebut kategori dasar, dlm artian bahwa perbandingan dibuat atas kategori tsb.)
Jika variabel kualitatif tsb terdiri lebih dari dua kategori, jumlah variabel dummy yg dibentuk harus sebanyak n-1, dimana n adalah banyaknya kategori variabel tsb. Misalnya variabel jenis pekerjaan dgn tiga kategori yaitu pekerja kasar, setengah terampil dan pekerja terampil, maka dibentuk dua variabel dummy sebagai berikut:
Alternatif 1
Dk1 = 1 jika kasar,  = 0 jika lainnya
Dk2 = 1 jika setengah terampil,  = 0 jika lainnya
Pada alternatif 1,
Dk1 = 0, Dk2 = 0 → terampil
Dk1 = 0, Dk2 = 1  ½ terampil
Dk1 = 1, Dk2 = 0  kasar
Alternatif 2
Dk1 = 1 jika setengah terampil, = 0 jika lainnya
Dk2 = 1 jika terampil,  = 0 jika lainnya
Pada alternatif 2,
Dk1 = 0, Dk2 = 0  kasar
Dk1 = 0, Dk2 = 1  terampil
Dk1 = 1, Dk2 = 0  ½ terampil
(Catatan: untuk lebih jelasnya lihat data yang dilampirkan. Dalam data tersebut, kita menggunakan alternatif 1 untuk membentuk variabel dummy jenis pekerjaan).

1. Regresi Atas Satu Variabel Kualitatif (Dua Kategori)

Dari data yang diberikan, misalnya kita ingin meregresikan variabel kualitatif jenis kelamin (sex) terhadap penghasilan, dengan kuantifikasi laki-laki =1 dan perempuan =0
Model regresi yang kita bentuk :
Y = b1 + b2 Ds


Dimana : Y = penghasilan
               Ds = variabel dummy untuk seks
Berdasarkan pengolahan data, persamaan regresi yang terbentuk sebagai berikut:





Model ini memungkinkan untuk mengetahui perbedaan penghasilan berdasarkan jenis kelamin.

Interpretasinya : b0 = rata-rata penghasilan pekerja perempuan, b1 = besarnya perbedaan penghasilan pekerja laki-laki dengan perempuan, dan b0 + b1 merupakan rata-rata penghasilan pekerja laki-laki. Karena variabel Ds signifikan, artinya secara statistik terdapat perbedaan nyata penghasilan laki-laki dengan perempuan
Jika Ds=0, artinya rata-rata penghasilan pekerja perempuan adalah 647884 (sebesarb0). Jika Ds=1, artinya rata-rata penghasilan pekerja laki-laki adalah 647884 + 552801 =1200685 (sebesar b0 + b 1)

2. Regresi Atas Satu Variabel Kuantitatif dan Satu Variabel Kualitatif (dua kategori)

Dari data yang sudah diberikan, misalnya kita bentuk suatu model regresi sbb:
Y = b0 + b1 Ds + b2 Pd + ei
Dimana : Ds = dummy jenis kelamin
Pd = pendidikan
Berdasarkan pengolahan datanya, ditampilkan hasilnya sebagai berikut :

Interpretasi : Pada setiap tingkat pendidikan, terdapat perbedaan besarnya penghasilan laki-laki dan perempuan. Perbedaaan tsb besar-nya adalah 331928 (sebesar b 1 ) lebih tinggi untuk laki-laki
Misalnya jika tahun pendidikan (Pd) = 15, maka
Jika Ds=0, rata-rata penghasilan perempuan adalah
Y = -1039341 + 331928 (0) + 134978 (15) = 985329
Jika Ds=1, rata-rata penghasilan laki-laki adalah
Y = -1039341 + 331928 (1) + 134978 (15) = 1317257


3. Regresi Atas Satu Variabel Kuantitatif dan Satu Variabel Kualitatif (lebih dua kategori)

Dari data yang diberikan, misalnya kita bentuk suatu model regresi sbb:
Y = b0 + b 1 Dk1 + b2 Dk2 + b3 Pd + ei
Dimana : Dk1 = dummy jenis pekerjaan
                          1 = setengah terampil
                          0 = lainnya
                Dk2 = dummy jenis pekerjaan
                         1 = terampil
                         0 = lainnya
                 Pd = pendidikan
Berdasarkan pengolahan datanya, ditampilkan hasilnya sebagai berikut :

Interpretasi :
Jika Dk1 = 0, Dk2 = 0 ==> pekerja kasar
Jika Dk1 = 1, Dk2 = 0 ==> pekerja setengah terampil
Jika Dk1 = 0, Dk2 = 1 ==> pekerja terampil
Pada setiap tingkat pendidikan, terdapat perbedaan penghasilan pekerja kasar, setengah terampil dan terampil.
Pekerja setengah terampil memiliki penghasilan 475244 (sebesar b1) lebih tinggi dibandingkan pekerja kasar.
Pekerja terampil memiliki penghasilan 590905 (sebesar b2) lebih tinggi dibandingkan pekerja kasar.
Misalnya jika tahun pendidikan (Pd) = 15, maka
Jika Dk1=0 dan Dk2=0, rata-rata penghasilan pekerja kasar adalah:
Y = -1286520 + 475244 (0) + 590905 (0) + 145168 (15) = 891000
Jika Dk1=1 dan Dk2=0, rata-rata penghasilan pekerja ½ terampil :
Y = -1286520 + 475244 (1) + 590905 (0) + 145168 (15) = 1366244
Jika Dk1=0 dan Dk2=1, rata-rata penghasilan pekerja terampil:
Y = -1286520 + 475244 (1) + 590905 (1) + 145168 (15) = 1481905

4. Membandingkan Dua Regresi dengan Variabel Dummy

Secara implisit, teknik penggunaan variabel dummy (dari pembahasan sebelum ini), pada dasarnya mengandung asumsi bahwa variabel kualitatif mempengaruhi intersep tetapi tidak mempengaruhi koefisien kemiringan dari berbagai regresi sub-kelompok. Kita dapat menghindari asumsi ini dengan menggunakan teknik “pooling” (mengelompokkan), dengan dasar pemikiran sbb: (catatan: banyak teknik yang lain, tetapi ini salah satunya)
Misalnya, dari model regresi terdahulu:
Y = b0 + b1 Ds + b2 Pd + ei
dimana : Ds = dummy jenis kelamin, Pd = pendidikan
Kita dapat merubah model ini dengan meregresi secara terpisah antara pekerja perempuan dan laki-laki sebagai berikut:
Regresi untuk pekerja perempuan
Y = b0 + b1 Pd + ei
Regresi untuk pekerja laki-laki
Y = b0 + b 1 Pd + ei
(Catatan: banyaknya sampel untuk laki-laki dan perempuan tidak perlu sama)
Dua persamaan regresi tersebut, memberikan empat kemungkinan hasil sebagai berikut:












Semua kemungkinan tersebut dapat diuji jika kita mengelompokkan (pool) semua sampel laki-laki dan perempuan, dengan memodifikasi model menjadi :
Y = b0 + b1 Ds + b2 Pd + b3 (Ds.Pd) + ei
Dibandingkan model sebelumnya, model ini mempunyai variabel tambahan DsPd
Implikasi model ini sebagai berikut:
Jika Ds=0 (perempuan), maka model menjadi :
Y = b0 + b2 Pd + ei, setara dgn Y = b0 + b1 Pd + ei
Jika Ds=1 (laki-laki), maka model menjadi :
Y = (b0 + b1) + (b2 + b3 )Pd + ei, setara dgn Y = b0 + b1 Pd + ei
Dari data yg telah diberikan, kita meregresikan secara terpisah untuk pekerja perempuan dan laki-laki didapatkan :
Regresi pekerja perempuan : Y = 12971 + 50793 Pd
Regresi pekerja laki-laki : Y = -1242495 + 172830 Pd
Dengan teknik “pooling” kita modifikasi model tersebut, dan melalui perhitungan, persamaan regresinya menjadi :
Y = 12971 -1255466 Ds + 50793 Pd + 122036 DsPd
Jika Ds=0 (perempuan), persamaan regresi tsb menjadi:
Y = 12971 -1255466 (0) + 50793 Pd + 122036 (0)Pd
Y = 12971 + 50793 Pd
Jika Ds=1 (laki-laki), persamaan regresi tsb menjadi :
Y = 12971 -1255466 (1) + 50793 Pd + 122036 (1)Pd
Y = 12971 -1255466 + 50793 Pd + 122036 (1)Pd
Y = -1242495 + 172830 Pd

F Interpretasi model regresi (dengan DUMMY Variabel):


v    Y = -1,96 + 0,12 X1 – 2,18 (0)               Wanita
Y = -1,96 + 0,12 X1 – 2,18 (1)               Pria

v  Koefisien  0,12  berarti :
Peningkatan nilai rata-rata tingkat prestasi kerja untuk setiap kenaikan nilai tes bakat sebesar 1 unit (berlaku untuk Wanita dan Pria)


v  Koefisien regresi  –2,18  hanya berlaku untuk Pria.
Jika seorang Pria mengikuti tes ini maka tingkat prestasi kerja diramalkan turun  2,18  dengan anggapan nilai tes bakat konstan.


v  Dari hasil hal 2 :
a.          Rata-rata tingkat prestasi kerja (5,86) tidak jauh berbeda dengan Wanita (5,75).
b.         Tetapi rata-rata nilai tes bakat Pria (83) secara signifikan lebih tinggi dari nilai tes wanita (64).
c.          Jika ada 2 pekerja, yang satu Wanita dan satu Pria mengikuti tes dan keduanya mendapatkan nilai 70, maka estimasi tingkat prestasi kerja wanita akan lebih tinggi 2,18 unit.

Y = -1,96 + 0,12 (70) = 6,44                 Wanita
Y = -4,14 + 0,12 (70) = 4,26                 Pria


v  Dari hasil korelasi seperti pada tabel berikut :


(1)

Prestasi

(2)
Test Bakat
(3)
Sex

(1)     Prestasi
(2)     Test Bakat
(3)     Sex


1.000

0.876
1.000

0.021
0.876
1.000


rY,X1 = 0,88  à  Koefisien korelasi antara prestasi kerja dan tes bakat, maka R2 = 0,77
rY,X2 = 0,02  à  Koefisien korelasi antara prestasi kerja dan jenis kelamin (kecil), artinya tingkat prestasi kerja tidak dipengaruhi oleh jenis kelamin.


v  Jika hasil tes bakat dan jenis kelamin digunakan secara bersama-sama untuk memperhatikan prestasi kerja, 92% variasi dapat dijelaskan.  Artinya kedua variabel mempunyai kontribusi penting bagi peramalan tingkat prestasi kerja.

MANFAAT LAIN VARIABEL DUMMY

Dalam analisis menggunakan data time series, variabel dummy bermanfaat untuk membandingkan suatu kurun waktu dengan kurun waktu tertentu.
Misalnya:
      Bagaimana produksi PT Astra antara sebelum terjadi krisis dan saat krisis ekonomi?
      Bagaimana minat masyarakat untuk menabung di Bank Syariah setelah MUI mengeluarkan fatwa bahwa bunga haram?
      Apakah benar setiap bulan Desember harga dolar cenderung naik?
      Apakah benar setiap hari senin harga saham Indofood naik?
Model diatas: Perbedaan hanya diakomodasi oleh intersep. Bagaimana jika slop juga berbeda à Membandingkan 2 regresi

ANALISIS REGRESI DENGAN DUMMY VARIABEL

Diketahui data untuk pengujian pengaruh PRESTASI KERJA oleh BAKAT yang juga dicurigai akan dipengaruhi oleh perbedaan JENIS KELAMIN, sebagai berikut:

PrstasiKj TesBakat      Sex
5                 60        0
4                 55        0
3                 35        0
10               96        0
2                 35        0
7                 81        0
6                 65        0
9                 85        0
9                 99        1
2                 43        1
8                 98        1
6                 91        1
7                 95        1
3                 70        1
6                 85        1

Jika diolah dengan MINITAB diperoleh hasil sebagai berikut:

Results for: DUMMY-PRESTASIKERJA-BAKAT.MTW

Regression Analysis: PrstasiKj versus TesBakat, Sex

The regression equation is
PrstasiKj = - 1.96 + 0.120 TesBakat - 2.18 Sex

Predictor     Coef  SE Coef      T      P
Constant   -1.9565   0.7068   -2.77  0.017
TesBakat    0.12041  0.01015  11.86  0.000
Sex        -2.1807   0.4503   -4.84  0.000

S = 0.786263   R-Sq = 92.1%   R-Sq(adj) = 90.8%



Analysis of Variance

Source          DF      SS      MS      F      P
Regression       2  86.981  43.491  70.35  0.000
Residual Error  12   7.419   0.618
Total           14  94.400


referensi :

Share this

Related Posts

First