KORELASI BIVARIAT ANTAR HUBUNGAN (INTERDEPENDENCY) ANTARA DUA VARIABEL VARIABEL A -- VARIABEL B ASUMSI POPULASI NORMAL BIVARIAT DUA VARIABEL RANDOM A DAN B SKALA INTERVAL ATAU RATIO 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 3
REGRESI HUBUNGAN DUA VARIABEL ADALAH KAUSAL VARIABEL A VARIABEL B ASUMSI GIVEN VARIABEL A, VARIABEL B TERDISTRIBUSI NORMAL UNIVARIAT VARIABEL A DAN B MASING-MASING SKALA INTERVAL ATAU RATIO 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 7
Given X, y is normally distributed X 1 X 2 X Y f(e) Garis Regresi 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 8
PRINSIP MODEL REGRESI MODEL REGRESI DIGUNAKAN UNTUK PERAMALAN MERAMAL NILAI PADA VARIABEL DEPENDEN BERDASARKAN NILAI DARI SEJUMLAH VARIABEL INDEPENDEN. VARIABEL DEPENDEN DISEBUT JUGA VARIABEL RESPON VARIABEL INDEPENDEN DISEBUT JUGA VARIABEL PREDIKTOR ATAU VARIABEL EKSPLANATORIK 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 9
PRINSIP MODEL REGRESI HUBUNGAN ANTARA VARIABEL DEPENDEN DAN INDEPENDEN ADALAH SATU ARAH (KAUSAL) BERBEDA DENGAN MODEL KORELASI DIMANA HUBUNGAN ANTARA DUA VARIABEL ADALAH TIMBAL BALIK. SELAIN UNTUK PERAMALAN, MODEL REGRESI BISA DIGUNAKAN UNTUK MENGESTIMASI PARAMETER KOEFISIEN REGRESI DAN UNTUK MENGUJI HIPOTESIS BAIK SECARA OVERALL MAUPUN SECARA PARSIAL 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 10
PRINSIP MODEL REGRESI LINIER DALAM MODEL REGRESI LINIER, HUBUNGAN ANTARA VARIABEL DEPENDEN DAN VARIABEL INDEPENDEN ADALAH LINIER. VARIABEL DEPENDEN MERUPAKAN FUNGSI LINIER DARI VARIABEL INDEPENDEN SECARA SEDERHANA MODEL REGRESI LINIER DINYATAKAN DENGAN : y = f (x) PERUBAHAN PADA x AKAN MERUBAH y SECARA LINIER PERUBAHAN DINYATAKAN DENGAN SUATU KOEFISIEN YANG DISEBUT KOEFISIEN SLOPE 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 12
CONTOH PLOT PENCAR MISALKAN KITA MEMPUNYAI SEKUMPULAN NILAI X DAN NILAI Y, KEMUDIAN KITA PLOT DALAM SUMBU X DAN SUMBU Y LIHAT HASIL PENGEPLOTAN DALAM GAMBAR BERIKUT PERTANYAAN : LEWAT SEJUMLAH TITIK YANG TERPENCAR, ADA BERAPA GARIS YANG BISA KITA BUAT ? 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 13
12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 14
12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 15
PEMILIHAN GARIS REGRESI DARI SEJUMLAH TAK TERHINGGA GARIS LINIER, KITA HANYA MEMILIH SATU GARIS LINIER YANG JARAKNYA TERHADAP SEMUA TITIK YANG ADA ADALAH YANG PALING DEKAT BILA JARAK MASING-MASING TITIK KE GARIS LINIER ADALAH SANGAT-SANGAT KECIL HINGGA NOL MAKA DIKATAKAN BAHWA GARIS REGRESI LINIER MELEWATI SEMUA TITIK YANG ADA, TERJADI HUBUNGAN LINIER YANG SEMPURNA NAMUN DALAM PRAKTEK TIDAK DEMIKIAN 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 16
12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 17 HUBUNGAN LINIER YANG SEMPURNA
12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 18
12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 19
PERUMUSAN MODEL HUBUNGAN ANTARA VARIABEL Y DAN X 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 20
Model regresi linier sederhana di populasi 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 21
MODEL REGRESI LINIER SEDERHANA 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 22 Intersep Y Slope GARIS LURUS MERUPAKAN “THE BEST FIT “ DENGAN DATA HUBUNGAN ANTAR VARIABEL MERUPAKAN FUNGSI LINIER Random Error Variabel dependen ( respon ) Variabel independen ( eksplanatorik )
e i = Random Error Y X MODEL REGRESI LINIER POPULASI 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 23 Nilai teramati Nilai teramati m b b YX i X = + 1 Y X i i i = + + b b e 1
Model regresi linier di sampel 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 24
Model regresi linier sampel 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 25 Ù Y i Ù = Nilai teramalkan Y untuk pengamatan ke i X i = Nilai X untuk pengamatan ke i b = Intersep Y sampel digunakan sebagai taksiran b Populasi b 1 = Slope sampel digunakan sebagai taksiran b 1 Populasi
Ukuran variasi : The Sum of Squares 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 26 SST = Total Sum of Squares Ukuran variasi nilai Y i di sekitar rerata Y SSR = Regression Sum of Squares Variasi terjelaskan yang disebabkan oleh hubungan antara X dan Y SSE = Error Sum of Squares variasi yang disebabkan oleh faktor lain dari pada hubungan antara X dan Y _
Ukuran variasi: The Sum of Squares 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 27 X i Y i = b + b 1 X i Y X Y SST = å ( Y i - Y ) 2 SSE = å ( Y i - Y i ) 2 Ù SSR = å ( Y i - Y ) 2 Ù Ù _ _ _
Koefisien determinasi SSR regression sum of squares SST total sum of squares r 2 = = Ukuran proporsi variasi yang dijelaskan oleh variabel independen X dalam model regresi
Misal SST = 10 SSR = 9 SSE = 10-9=1 R^2 = 9/10 = 90 % apa artinya 90 % adalah proporsi variasi dari variabel y ( dependen ) YANG DIJELASKAN OLEH VARIABEL X (VARIABEL INDEPENDEN) PELUANGNYA 90% BAHWA X SEBAGAI PENYEBAB y 10 % ADALAH PROPORSI variasi dari variabel y yang dijelaskan oleh VARIABEL LAIN SELAIN VARIABEL VARIABEL X. 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 29
koefisien Determinasi ( r 2 ) dan koefisien korelasi ( r ) r 2 = 1, r 2 = 1, r 2 = .8, r 2 = 0, Y Y i = b + b 1 X i X ^ Y Y i = b + b 1 X i X ^ Y Y i = b + b 1 X i X ^ Y Y i = b + b 1 X i X ^ r = +1 r = -1 r = +0.9 r = 0
Galat baku taksiran Ù = Standar deviasi variasi pengamatan di sekitar garis regresi GALAT BAKU TAKSIRAN MERUPAKAN TAKSIRAN DARI σ YX POPULASI
12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 32
12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 33
12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 34
ASUMSI YANG PERLU DIPERHATIKAN 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 35
ASUMSI REGRESI LINIER SEDERHANA 1. Normalitas Untuk masing-masing X, Y terdistribusi NORMAL Distribusi Probabilitas dari Random Error ( ε i ) adalah NORMAL 2. Linieritas 3. Homoskedastisitas (Varian Konstan ) 4 . Masing –masing Random Errors ( ε i ) satu sama lain adalah independent UNCORRELATED ERROR(random error satu sama lain tidak berkorelasi ) 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 36 Untuk Model Linier
Variasi Random Errors Di Sekitar Garis Regresi X 1 X 2 X Y f(e) Nilai y terdistribusi normal di sekitar garis regresi . Untuk masing masing nilai x, the “ spread ” atau varian di sekitar garis regresi adalah sama , Garis Regresi 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 38 HOMOSKEDASTISITAS
KORELASI DAN REGRESI PAKAI R 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 39
KORELASI KOEFISIEN KORELASI PEARSON ASUMSI DISTRIBUSI NORMAL BIVARIAT MASING-MASING VARIABEL DIUJI NORMALITAS MENGGUNAKAN; qqplot Saphiro -Wilk Kolmogorov-Smirnov 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 40
12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 53 > ks.test ( varcrp , ' pnorm ') Asymptotic one-sample Kolmogorov-Smirnov test data: varcrp D = 0.98744, p-value < 2.2e-16 alternative hypothesis: two-sided Warning message: In ks.test.default ( varcrp , " pnorm ") : ties should not be present for the Kolmogorov-Smirnov test
12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 54 > ks.test ( varalb , ' pnorm ') Asymptotic one-sample Kolmogorov-Smirnov test data: varalb D = 0.9761, p-value < 2.2e-16 alternative hypothesis: two-sided Warning message: In ks.test.default ( varalb , " pnorm ") : ties should not be present for the Kolmogorov-Smirnov test
12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 66 > library(car) Loading required package: carData Warning messages: 1: package ‘car’ was built under R version 4.2.3 2: package ‘ carData ’ was built under R version 4.2.3 > durbinWatsonTest (lm1) lag Autocorrelation D-W Statistic p-value 1 0.1048044 1.789019 0.03 Alternative hypothesis: rho != 0 >
PENYIMPULAN From the output we can see that the test statistic is 1.789019 and the corresponding p-value is 0.03 . Since this p-value is less than 0.05, we can reject the null hypothesis and conclude that the residuals in this regression model are autocorrelated. UNCORRELATED ERROR TIDAK DIPENUHI 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 67
12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 71 Residual standard error: 0.5969 on 398 degrees of freedom Multiple R-squared: 0.2919, Adjusted R-squared: 0.2901 F-statistic: 164 on 1 and 398 DF, p-value: < 2.2e-16
TABEL ANAVA DALAM ANALISIS REGRESI Sumber Variasi Sum of Square Degree of Freedom Variance F test Regression SSR p VR VR/VE Error SSE n-p VE Total SST n 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 72
Tabel tersebut menyatakan bahwa variabel independent secara bersama-sama mempengaruhi variabel dependen disebut Overall Test Untuk melihat variabel independent mana yang dominan menggunakan partial test , test thd masing2 variabel independent, pakai T test T = koefisien regresi /standard error dari koefisien regresi 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 73