aplikom korelasi regresi - aplikom R Studio

InasDiva 0 views 78 slides Aug 27, 2025
Slide 1
Slide 1 of 78
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31
Slide 32
32
Slide 33
33
Slide 34
34
Slide 35
35
Slide 36
36
Slide 37
37
Slide 38
38
Slide 39
39
Slide 40
40
Slide 41
41
Slide 42
42
Slide 43
43
Slide 44
44
Slide 45
45
Slide 46
46
Slide 47
47
Slide 48
48
Slide 49
49
Slide 50
50
Slide 51
51
Slide 52
52
Slide 53
53
Slide 54
54
Slide 55
55
Slide 56
56
Slide 57
57
Slide 58
58
Slide 59
59
Slide 60
60
Slide 61
61
Slide 62
62
Slide 63
63
Slide 64
64
Slide 65
65
Slide 66
66
Slide 67
67
Slide 68
68
Slide 69
69
Slide 70
70
Slide 71
71
Slide 72
72
Slide 73
73
Slide 74
74
Slide 75
75
Slide 76
76
Slide 77
77
Slide 78
78

About This Presentation

korelasi dan regresi


Slide Content

APLIKOM RSTUDIO KORELASI DAN REGRESI SEDERHANA 2023/2024 KUNTORO DIVISI BIOSTATISTIKA FKM UNAIR 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 1

KORELASI VS REGRESI 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 2

KORELASI BIVARIAT ANTAR HUBUNGAN (INTERDEPENDENCY) ANTARA DUA VARIABEL VARIABEL A -- VARIABEL B ASUMSI POPULASI NORMAL BIVARIAT DUA VARIABEL RANDOM A DAN B SKALA INTERVAL ATAU RATIO 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 3

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 4

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 5 KOEFISIEN KORELASI PEARSON

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 6

REGRESI HUBUNGAN DUA VARIABEL ADALAH KAUSAL VARIABEL A  VARIABEL B ASUMSI GIVEN VARIABEL A, VARIABEL B TERDISTRIBUSI NORMAL UNIVARIAT VARIABEL A DAN B MASING-MASING SKALA INTERVAL ATAU RATIO 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 7

Given X, y is normally distributed X 1 X 2 X Y f(e) Garis Regresi 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 8

PRINSIP MODEL REGRESI MODEL REGRESI DIGUNAKAN UNTUK PERAMALAN MERAMAL NILAI PADA VARIABEL DEPENDEN BERDASARKAN NILAI DARI SEJUMLAH VARIABEL INDEPENDEN. VARIABEL DEPENDEN DISEBUT JUGA VARIABEL RESPON VARIABEL INDEPENDEN DISEBUT JUGA VARIABEL PREDIKTOR ATAU VARIABEL EKSPLANATORIK 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 9

PRINSIP MODEL REGRESI HUBUNGAN ANTARA VARIABEL DEPENDEN DAN INDEPENDEN ADALAH SATU ARAH (KAUSAL) BERBEDA DENGAN MODEL KORELASI DIMANA HUBUNGAN ANTARA DUA VARIABEL ADALAH TIMBAL BALIK. SELAIN UNTUK PERAMALAN, MODEL REGRESI BISA DIGUNAKAN UNTUK MENGESTIMASI PARAMETER KOEFISIEN REGRESI DAN UNTUK MENGUJI HIPOTESIS BAIK SECARA OVERALL MAUPUN SECARA PARSIAL 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 10

MODEL REGRESI LINIER 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 11

PRINSIP MODEL REGRESI LINIER DALAM MODEL REGRESI LINIER, HUBUNGAN ANTARA VARIABEL DEPENDEN DAN VARIABEL INDEPENDEN ADALAH LINIER. VARIABEL DEPENDEN MERUPAKAN FUNGSI LINIER DARI VARIABEL INDEPENDEN SECARA SEDERHANA MODEL REGRESI LINIER DINYATAKAN DENGAN : y = f (x) PERUBAHAN PADA x AKAN MERUBAH y SECARA LINIER PERUBAHAN DINYATAKAN DENGAN SUATU KOEFISIEN YANG DISEBUT KOEFISIEN SLOPE 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 12

CONTOH PLOT PENCAR MISALKAN KITA MEMPUNYAI SEKUMPULAN NILAI X DAN NILAI Y, KEMUDIAN KITA PLOT DALAM SUMBU X DAN SUMBU Y LIHAT HASIL PENGEPLOTAN DALAM GAMBAR BERIKUT PERTANYAAN : LEWAT SEJUMLAH TITIK YANG TERPENCAR, ADA BERAPA GARIS YANG BISA KITA BUAT ? 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 13

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 14

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 15

PEMILIHAN GARIS REGRESI DARI SEJUMLAH TAK TERHINGGA GARIS LINIER, KITA HANYA MEMILIH SATU GARIS LINIER YANG JARAKNYA TERHADAP SEMUA TITIK YANG ADA ADALAH YANG PALING DEKAT BILA JARAK MASING-MASING TITIK KE GARIS LINIER ADALAH SANGAT-SANGAT KECIL HINGGA NOL MAKA DIKATAKAN BAHWA GARIS REGRESI LINIER MELEWATI SEMUA TITIK YANG ADA, TERJADI HUBUNGAN LINIER YANG SEMPURNA NAMUN DALAM PRAKTEK TIDAK DEMIKIAN 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 16

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 17 HUBUNGAN LINIER YANG SEMPURNA

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 18

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 19

PERUMUSAN MODEL HUBUNGAN ANTARA VARIABEL Y DAN X 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 20

Model regresi linier sederhana di populasi 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 21

MODEL REGRESI LINIER SEDERHANA 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 22 Intersep Y Slope GARIS LURUS MERUPAKAN “THE BEST FIT “ DENGAN DATA HUBUNGAN ANTAR VARIABEL MERUPAKAN FUNGSI LINIER Random Error Variabel dependen ( respon ) Variabel independen ( eksplanatorik )

e i = Random Error Y X MODEL REGRESI LINIER POPULASI 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 23 Nilai teramati Nilai teramati m b b YX i X = + 1 Y X i i i = + + b b e 1

Model regresi linier di sampel 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 24

Model regresi linier sampel 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 25 Ù Y i Ù = Nilai teramalkan Y untuk pengamatan ke i X i = Nilai X untuk pengamatan ke i b = Intersep Y sampel digunakan sebagai taksiran b Populasi b 1 = Slope sampel digunakan sebagai taksiran b 1 Populasi

Ukuran variasi : The Sum of Squares 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 26 SST = Total Sum of Squares Ukuran variasi nilai Y i di sekitar rerata Y SSR = Regression Sum of Squares Variasi terjelaskan yang disebabkan oleh hubungan antara X dan Y SSE = Error Sum of Squares variasi yang disebabkan oleh faktor lain dari pada hubungan antara X dan Y _

Ukuran variasi: The Sum of Squares 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 27 X i Y i = b + b 1 X i Y X Y SST = å ( Y i - Y ) 2 SSE = å ( Y i - Y i ) 2 Ù SSR = å ( Y i - Y ) 2 Ù Ù _ _ _

Koefisien determinasi SSR regression sum of squares SST total sum of squares r 2 = = Ukuran proporsi variasi yang dijelaskan oleh variabel independen X dalam model regresi

Misal SST = 10 SSR = 9 SSE = 10-9=1 R^2 = 9/10 = 90 % apa artinya 90 % adalah proporsi variasi dari variabel y ( dependen ) YANG DIJELASKAN OLEH VARIABEL X (VARIABEL INDEPENDEN)  PELUANGNYA 90% BAHWA X SEBAGAI PENYEBAB y 10 % ADALAH PROPORSI variasi dari variabel y yang dijelaskan oleh VARIABEL LAIN SELAIN VARIABEL VARIABEL X. 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 29

koefisien Determinasi ( r 2 ) dan koefisien korelasi ( r ) r 2 = 1, r 2 = 1, r 2 = .8, r 2 = 0, Y Y i = b + b 1 X i X ^ Y Y i = b + b 1 X i X ^ Y Y i = b + b 1 X i X ^ Y Y i = b + b 1 X i X ^ r = +1 r = -1 r = +0.9 r = 0

Galat baku taksiran Ù = Standar deviasi variasi pengamatan di sekitar garis regresi GALAT BAKU TAKSIRAN MERUPAKAN TAKSIRAN DARI σ YX POPULASI

  12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 32

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 33

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 34

ASUMSI YANG PERLU DIPERHATIKAN 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 35

ASUMSI REGRESI LINIER SEDERHANA 1. Normalitas Untuk masing-masing X, Y terdistribusi NORMAL Distribusi Probabilitas dari Random Error ( ε i ) adalah NORMAL 2. Linieritas 3. Homoskedastisitas (Varian Konstan ) 4 . Masing –masing Random Errors ( ε i ) satu sama lain adalah independent  UNCORRELATED ERROR(random error satu sama lain tidak berkorelasi ) 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 36 Untuk Model Linier

PENJELASAN ASUMSI KE 3 HOMOSKEDASTISITAS 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 37

Variasi Random Errors Di Sekitar Garis Regresi X 1 X 2 X Y f(e) Nilai y terdistribusi normal di sekitar garis regresi . Untuk masing masing nilai x, the “ spread ” atau varian di sekitar garis regresi adalah sama , Garis Regresi 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 38 HOMOSKEDASTISITAS

KORELASI DAN REGRESI PAKAI R 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 39

KORELASI KOEFISIEN KORELASI PEARSON ASUMSI DISTRIBUSI NORMAL BIVARIAT MASING-MASING VARIABEL DIUJI NORMALITAS MENGGUNAKAN; qqplot Saphiro -Wilk Kolmogorov-Smirnov 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 40

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 41 > library(haven) > aplikomkorreg <- read_sav ("D:/aplikomkorreg.SAV") > View( aplikomkorreg ) > varcrp = aplikomkorreg$CRP > varalb = aplikomkorreg$ALB

qq -plot 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 42

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 43 > qqnorm ( varcrp , main='Normal') > qqline ( varcrp )

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 44

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 45 > qqnorm ( varalb , main='Normal') > qqline ( varalb )

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 46

HISTOGRAM 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 47

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 48

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 49

SAPHIRO-WILK TEST 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 50

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 51 > shapiro.test ( varcrp ) Shapiro-Wilk normality test data: varcrp W = 0.97644, p-value = 4.326e-06 > shapiro.test ( varalb ) Shapiro-Wilk normality test data: varalb W = 0.98793, p-value = 0.002139

KOLMOGOROV-SMIRNOV 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 52

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 53 > ks.test ( varcrp , ' pnorm ') Asymptotic one-sample Kolmogorov-Smirnov test data: varcrp D = 0.98744, p-value < 2.2e-16 alternative hypothesis: two-sided Warning message: In ks.test.default ( varcrp , " pnorm ") : ties should not be present for the Kolmogorov-Smirnov test

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 54 > ks.test ( varalb , ' pnorm ') Asymptotic one-sample Kolmogorov-Smirnov test data: varalb D = 0.9761, p-value < 2.2e-16 alternative hypothesis: two-sided Warning message: In ks.test.default ( varalb , " pnorm ") : ties should not be present for the Kolmogorov-Smirnov test

KOEFISIEN KORELASI 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 55

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 56 > cor ( varcrp,varalb , method = c(" pearson ")) [1] 0.5402468 > cor.test ( varcrp , varalb , method=c(" pearson ")) Pearson's product-moment correlation data: varcrp and varalb t = 12.808, df = 398, p-value < 2.2e-16 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: 0.4669293 0.6061874 sample estimates: cor 0.5402468

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 57

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 58 > cor.test ( varcrp , varalb , method=c("spearman")) Spearman's rank correlation rho data: varcrp and varalb S = 5209271, p-value < 2.2e-16 alternative hypothesis: true rho is not equal to 0 sample estimates: rho 0.5116278 Warning message: In cor.test.default ( varcrp , varalb , method = c("spearman")) : Cannot compute exact p-value with ties >

REGRESI LINIER SEDERHANA 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 59

MENILAI PERSYARATAN ASUMSI 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 60

LINIERITAS 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 61

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 62 > lm1 <- lm ( varalb ~ varcrp , data = aplikomkorreg ) > plot( varalb ~ varcrp , data = aplikomkorreg ) > abline (lm1)

NORMALITAS DAN HOMOSKEDASTISITAS 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 63

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 64

UNCORRELATED ERROR 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 65

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 66 > library(car) Loading required package: carData Warning messages: 1: package ‘car’ was built under R version 4.2.3 2: package ‘ carData ’ was built under R version 4.2.3 > durbinWatsonTest (lm1) lag Autocorrelation D-W Statistic p-value 1 0.1048044 1.789019 0.03 Alternative hypothesis: rho != 0 >

PENYIMPULAN From the output we can see that the test statistic is    1.789019 and the corresponding p-value is  0.03 . Since this p-value is less than 0.05, we can reject the null hypothesis and conclude that the residuals in this regression model are autocorrelated. UNCORRELATED ERROR TIDAK DIPENUHI 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 67

HASIL ANALISIS REGRESI 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 68

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 69 > summary(lm1) Call: lm (formula = varalb ~ varcrp , data = aplikomkorreg ) Residuals: Min 1Q Median 3Q Max -1.76641 -0.37208 0.01089 0.38873 1.79033

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 70 Coefficients: Estimate Std. Error t value Pr (>|t|) (Intercept) 1.29406 0.20193 6.408 4.16e-10 *** varcrp 0.55674 0.04347 12.808 < 2e-16 *** --- Signif . codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 71 Residual standard error: 0.5969 on 398 degrees of freedom Multiple R-squared: 0.2919, Adjusted R-squared: 0.2901 F-statistic: 164 on 1 and 398 DF, p-value: < 2.2e-16

TABEL ANAVA DALAM ANALISIS REGRESI Sumber Variasi Sum of Square Degree of Freedom Variance F test Regression SSR p VR VR/VE Error SSE n-p VE Total SST n 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 72

Tabel tersebut menyatakan bahwa variabel independent secara bersama-sama mempengaruhi variabel dependen  disebut Overall Test Untuk melihat variabel independent mana yang dominan menggunakan partial test , test thd masing2 variabel independent, pakai T test  T = koefisien regresi /standard error dari koefisien regresi 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 73

MENGHITUNG STANDARDIZED COEFFICIENT 12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 74

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 75 > library(haven) > aplikomkorreg <- read_sav ("D:/aplikomkorreg.SAV") > View( aplikomkorreg ) > varcrp = aplikomkorreg$CRP > varalb = aplikomkorreg$ALB > model_std <- lm (scale( varalb ) ~ scale( varcrp ), data= aplikomkorreg )

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 76 > #turn off scientific notation > options( scipen =999) > #view model summary > summary( model_std ) Call: lm (formula = scale( varalb ) ~ scale( varcrp ), data = aplikomkorreg ) Residuals: Min 1Q Median 3Q Max -2.49322 -0.52518 0.01538 0.54868 2.52698

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 77 Coefficients: Estimate Std. Error t value Pr (>|t|) (Intercept) 0.0000000000000007214 0.0421281578378834495 0.00 1 scale( varcrp ) 0.5402467553181219406 0.0421809169792056252 12.81 <0.0000000000000002 *** --- Signif . codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.8426 on 398 degrees of freedom Multiple R-squared: 0.2919, Adjusted R-squared: 0.2901 F-statistic: 164 on 1 and 398 DF, p-value: < 0.00000000000000022

12/8/2023 KUNTORO S2 IKM MNT GZ REGRESI 78
Tags