Analisis regresi linear adalah alat analisis yang digunakan untuk mempelajari hubungan antara variabel bebas (dependent variable) dengan variabel tak bebas (independent variable) melalui suatu persamaan. Hubungan tersebut dapat berupa hubungan sebab akibat. Jika variabel tak bebas yang digunakan lebih dari satu, maka disebut analisis regresi linear berganda.
Analisis regresi linear dapat digunakan untuk mengukur seberapa besar suatu variabel mempengaruhi variabel lainnya. Misalnya, kita dapat mengukur seberapa besar pengaruh biaya iklan terhadap penjualan suatu produk. Pada umumnya, semakin besar biaya iklan, maka penjualan produk tersebut tersebut akan semakin tinggi. Pada masalah yang lebih kompleks, misalkan, pemerintah suatu daerah ingin mengetahui variabel apa saja yang mempengaruhi pertumbuhan ekonomi (variabel tak bebas) di daerah tersebut. Maka, dapat dilakukan analisis regresi linear berganda dengan melibatkan variabel tingkat pengangguran, investasi, dan konsumsi masyarakat sebagai variabel bebasnya.
Selain untuk mengukur pengaruh suatu variabel terhadap variabel lain, persamaan yang terbentuk dari analisis regresi linear dapat kita gunakan untuk melakukan peramalan. Misalnya, melalui persamaan yang terbentuk, kita dapat memprediksi tingkat penjualan dengan biaya iklan tertentu. Secara umum, persamaan regresi berbentuk seperti berikut
Variabel Bebas : Variabel yang nilainya ditentukan oleh variabel lain. Diasumsikan bersifat random/stochastic. Contoh dari variabel yang dipengaruhi oleh variabel lain adalah tingkat penjualan.
- Variabel Y merupakan random variabel / bersifat stochastic (mempunyai distribusi tertentu).
- Variabel X bersifat fixed atau bukan merupakan random variabel dan tidak mengikuti distribusi tertentu.
- Asumsi LinearitasUntuk menguji apakah asumsi Linieritas terpenuhi, kita dapat menggunakan plot residual dengan fitted value (predicted value) atau bisa juga dengan plot residual dengan variable independent (John Neter, 1989:118).
- Varians dari error adalah tetap (Homoskedastisitas) ; E(εi2)=σ2. Yang dimaksud dengan homoskedastis adalah varians dari parameter tersebut telah efisien sehingga pendugaan paramater tersebut telah memiliki varians yang minimum.
- Kovarian dari error model adalah nol (Non-autokorelasi) E(εiεj)=0 ; autokorelasi dapat dikatakan hubungan antar objek. Untuk data cross-sectional, asumsi ini dapat diabaikan, namun lebih baik jika dapat dipenuhi.
- Error dari persamaan mengikuti distribusi normal;
- Jika pada regresi linear dengan lebih dari satu variabel bebas, maka asumsi lain yang harus dipenuhi adalah asumsi non-multikolinearitas atau tidak adanya hubungan antar variabel bebas.