Analisis Regresi Linier

Analisis regresi berganda adalah metode analisis untuk meramalkan nilai pengaruh dua variabel bebas atau lebih (X1, X2, X3, ..., Xn) terhadap satu variabel terikat Y. Semakin banyak variabel bebas yang digunakan maka semakin tinggi pula kemampuan model regresi untuk menjelaskan variabel terikat. Faktor-faktor lain di luar variabel bebas yang digunakan (residual) akan semakin kecil dan semakin tinggi pula koefisien determinasinya (R2). Contoh analisis yang dapat digunakan dalam penelitian sebagai berikut :
Sehingga, bentuk persamaan regresi yang akan dibentuk adalah :
Pemeriksaan keberartian pada analisis korelasi ganda dapat dilakukan dengan mengikuti langkah-langkah berikut :
  1. Menentukan rumusan hipotesis Ho dan H1. Ho : R = 0 : Tidak ada pengaruh variabel bebas terhadap variabel terikat. H1 : R ≠ 0 : Ada pengaruh variabel bebas terhadap variabel terikat. 
  2.  Membandingkan nilai uji F terhadap nilai tabel F dengan kriteria pengujian: Jika nilai uji F ≥ nilai tabel F, maka tolak H0 
  3. Membuat kesimpulan
Setelah model memenuhi pemeriksaan keberartian, maka perlu dilakukan pengujian untuk mengetahui apakah model yang terbentuk telah memenuhi sifat BLUE (Best Linear Unbiased Estimator). Model yang dikatakan memiliki sifat BLUE apabila telah memenuhi asumsi klasik di bawah ini :
  1. Asumsi Normalitas Regresi linier klasik mengasumsikan bahwa residual mengikuti distribusi normal dengan rata-rata 0 dan varians konstan . Pemeriksaan normalitas dapat dilakukan menggunakan Normal Probability Plot dari nilai residual. Apabila plot nilai residual dengan nilai harapannya mendekati garis lurus dengan sudut 45o, maka dapat disimpulkan residual berdistribusi normal.
  2. Asumsi Homoskedastis adalah keadaan dimana varians residual dari setiap variabel independen adalah konstan, dapat dinyatakan sebagai berikut : Untuk mendeteksi homoskedastisitas dapat dilakukan uji White (Gujarati, 2004). Pada pengujian digunakan variabel residual kuadrat sebagai variabel dependen dan observasi sebanyak n. Jika nilai tidak lebih besar dari nilai kritis chi-square dengan derajat bebas sebanyak regresor atau nilai p-value lebih besar dari taraf keberartian, maka dapat dikatakan tidak terjadi pelanggaran heteroskedastisitas.
  3. Asumsi Non-Multikolinieritas Satu dari asumsi model regresi linear klasik adalah tidak terdapat multikolinearitas di antara variabel-variabel penjelas. Deteksi multikolinieritas dapat melalui VIF atau Variance Inflation Factor.  VIF yang besar diakibatkan oleh korelasi yang besar antara X1 dan X2. Sehingga dengan kata lain, jika VIF kecil mala dapat diduga tidak terjadi multikolinieritas. Gujarati (2004) menyatakan bila korelasi antara dua variabel bebas melebihi 0,8 sehingga menghasilkan nilai VIF sebesar 5,  maka multikolinearitas menjadi masalah yang serius. Nilai VIF adalah sebagai berikut :

Uji Run Wald-Wolfowitz

Tes ini digunakan untuk memeriksa/menguji apakah dua sampel random yang diambil berasal dari populasi yang sama atau tidak. Perbedaan itu dapat terjadi dalam hal: rata-rata, variabilitas, kemencengan atau pun hal lain. Uji Wald-Wolfowitz pada prinsipnya menggunakan banyaknya rangkaian yang terdapat pada dua buah sample. Distribusi sampel diuji berdasarkan pada banyaknya Runs dalam kedua sampel. Skala data minimum yang dapat digunakan adalah skala ordinal.

Tahapan penggunaan :
  • Dua set sampel dari kelompok berbeda yang ukurannya n1 dan n2, lalu kita rangking semua skor yang ada dalam satu urutan. 
  • Selanjutnya kita tentukan banyak run didalam urutan tersebut.
Run adalah sembarang urutan skor-skor yang tidak terputus yang berasal dari kelompok yang sama.

Secara umum hipotesis yang muncul:
H0 = dua sampel yang diambil berasal dari populasi yang sama
H1 = dua sampel yang diambil berasal dari populasi yang berbeda

Bila r observasi kurang dari atau sama dengan nilai r kritis, maka H0 dapat ditolak pada α=0,05.
Bila r observasi lebih besar dari yang ditunjukkan pada nilai r kritis maka H0 gagal ditolak pada α=0,05. 

Contoh kasus sampel kecil : Dua belas anak lelaki dan perempuan berusia 4 tahun diobservasi dalam waktu bermain yang panjangnya 15 menit, dan masing-masing anak diberi skor untuk kejadian dan tingkat agresi. Dengan skor-skor ini ingin diketahui apakah ada perbedaan agresi karena jenis kelamin. Skor agresi anak lelaki dan perempuan :
Penyelesaian : Pengujian ini dapat dilakukan dengan menggunakan tes Run Wald-Wolfowitz karena data berada dalam skala ordinal dan hipotesisnya mengenai perbedaan sembarang antara skor agresi dua kelompok independen (anak lelaki dan anak perempuan) Hipotesis : Ho : kejadian dan derajat agresi sama di kalangan anak berusia 4 th dari kedua jenis kelamin H1 : anak lelaki dan anak perempuan berusia 4 th menunjukkan perbedaan dalam hal kejadian dan derajat agresi Taraf signifikansi : α = 0.05 Wilayah tolak : r hitung ≤ r tabel Statistik hitung : n1 (lelaki) = 12 n2 (perempuan) = 12 Data yang telah diurutkan berdasarkan nilai dan run adalah sbb :
Run hitung = 4 Run berdasar tabel untuk n1 = 12 dan n2 = 12 adalah 7

Keputusan : Run hitung ≤ nilai kritis , sehingga tolak Ho pada taraf signifikansi 0.05

Kesimpulan : anak lelaki dan anak perempuan berusia 4 th menunjukkan perbedaan dalam hal kejadian dan derajat agresi

Konsep Dasar Populasi dan Sampel

Populasi merupakan sekumpulan orang atau objek yang memiliki kesamaan karakteristik dalam satu atau beberapa hal dan yang membentuk masalah pokok dalam suatu riset khusus. pendefinisian populasi merupakan langkah pertama yang sangat penting, dari sini dapat tergambar bagaimana keadaan populasi, sub-sub unit populasi, karakteristik umum populasi serta keluasan dari populasi tersebut. Dalam hubungan ini perlu dibedakan antara populasi target (Target/actual population) dan populasi terjangkau (Accessible population), populasi target adalah populasi yang ingin digeneralisasi oleh peneliti, sedangkan populasi terjangkau adalah populasi yang dapat digeneralisasi oleh peneliti, target populasi merupakan pilihan ideal dan populasi terjangkau merupakan pilihan yang realistis. Sesudah diperoleh gambaran tersebut kemudian ditentukan prosedur apa yang akan diambil dalam penentuan sampel, sesudah langkah ini baru kemudian ditentukan besarnya sampel yang akan dijadikan obyek penelitian.

Sampel adalah sebagian unsur populasi yang dijadikan objek penelitian. Dalam statistik lebih umum menggunakan data sampel dibandingkan data populasi. Penentuan sampel merupakan langkah penting dalam penelitian kuantitatif, konsep dasar dari penentuan sampel adalah bahwa agregasi dari orang, rumah tangga atau organisasi yang sangat besar dapat dikaji secara efektif dan efisien serta akurat melalui pengkajian yang terinci dan hati-hati pada sebagian agregasi yang terpilih.

Agregasi (Keseluruhan) disebut populasi atau universe yang terdiri dari unit total informasi yang ingin diketahui. Dari populasi yang ingin dikaji kemudian ditentukan sampelnya, melalui prosedur sampling yang sesuai dengan karakteristik populasinya. Penelitian bidang sosial dan Pendidikan banyak dilakukan dengan menggunakan sampel (Sampling Methods), hal ini tidak hanya karena alasan biaya dan waktu, tapi juga untuk menghindari kekeliruan akibat pengumpulan, pemrosesan dan penganalisaan data dari agregasi yang sangat besar. Dengan penarikan sampel maka estimasi dapat dilakukan serta hipotesis dapat diuji yang hasilnya dapat berlaku terhadap populasi darimana sampel itu diambil.

Pengkajian terhadap sampel pada dasarnya dimaksudkan untuk menemukan generalisasi atas populasi atau karakteristik populasi (Parameter), sehingga dapat dilakukan penyimpulan (inferensi) tentang universe, oleh karena itu penarikan sampel jangan sampai bias dan harus menggambarkan seluruh unsur dalam populasi secara proporsional, hal ini bisa dilakukan dengan cara memberikan kesempatan yang sama pada seluruh elemen dalam populasi.