Uji Signifikansi (uji t, uji f) untuk Kimia

KholidahUINWalisongo 1 views 31 slides Sep 23, 2025
Slide 1
Slide 1 of 31
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31

About This Presentation

Uji signifikansi


Slide Content

Significance Test UJI SIGNIFIKANSI PRODI KIMIA UIN WALISONGO SEMARANG

Outline Perkuliahan Kegunaan Uji Signifikansi Uji t Uji F Outliers ( Pencilan )

Kegunaan Uji Signifikansi Untuk menguji apakah nilai hasil pengukuran berbeda secara signifikan dengan nilai standard ( nilai yang sudah diketahui dengan pasti ) ‏ Untuk menguji apakah perbedaan hasil yang timbul oleh 2 macam pengukuran ( misal dengan metode yang berbeda ) signifikan atau hanya disebabkan oleh bervariasinya kesalahan random semata

1. Perbandingan nilai rata-rata (experimental mean) dengan suatu nilai yang diketahui (standard) Dalam uji signifikansi ini kita akan menguji hipotesis null (H o ): tidak ada perbedaan antara nilai teramati dengan nilai yang telah diketahui , kecuali hanya yang disebabkan variasi random Umumnya hipotesis null akan ditolak jika probabilitas terjadinya perbedaan secara kebetulan kurang dari 1 dalam 20 data ( yaitu 0,05 atau 5%). Dalam hal ini dikatakan bahwa perbedaan signifikan pada level 0,05 atau 5% (P=0,05), P= Probabilitas . Untuk memastikan bahwa kita telah membuat keputusan yang benar dapat digunakan tingkat signifikansi yang lebih tinggi yaitu0,01 atau 0,001 Uji-t

Tabel t- distibution

Untuk memutuskan apakah perbedaan antara mean sampel x dan mean populasi  ( nilai yang sesungguhnya ) signifikan , dilakukan uji H o menggunakan nilai statistik t sebagai berikut : t hitung : di mana s adl standard deviasi sample dan n = ukuran sampel Jika nilai statistik | t| perhitungan melebihi nilai kritis tertentu ( dicari dalam tabel statistik t untuk level signifikansi dan derajad kebebasan terkait ) maka hipotesis null ditolak artinya ada perbedaan signifikan antara x dan  Derajat kebebasan untuk t= n-1 Kesimpulan: jika t hitung < t tabel maka Ho diterima jika t hitung > t tabel maka Ho ditolak Contoh : Suatu metode baru digunakan untuk penentuan Selenourea dalam air kran (PAM) yang telah di- spike dengan 50 ng ml -1 selenourea dan diperoleh data sbb : 50,4 50,7 49,1 49,0 51,1 ng ml -1 (Aller, A.J. and Robles, L.C. 1998 Analyst 123:919) ‏ Buktikan apakah terdapat kesalahan sistematik dalam metode tsb ? Jawab: Nilai mean data=50,06 dan standard deviasinya = 0,956 Jika H o = tidak ada kesalahan sistematik (x=  ) ‏

Dengan persamaan di atas , diperoleh : t = (50,06 – 50) √5/0,956 = 0,14 Dari tabel statistik t untuk t 4 ( n-1 ) = 2,78 ( P = 0,05) ‏ karena nilai t terhitung lebih kecil dari nilai t kritis , maka hipotesis null diterima dan dapat disimpulkan bahwa metode baru tersebut tidak mengandung kesalahan sistematik

2.a Perbandingan rata-rata (experimental mean) dari 2 pengukuran dengan standar deviasi tidak berbeda signifikan Jika tidak terdapat material standard, metode baru biasanya diuji validitasnya dengan membandingkan nilai rata-rata ( x 1 ) yang diperoleh dari pengukuran metode baru dengan nilai rata-rata ( x 2 ) hasil pengukuran metode lain yang sudah baku . Dalam hal ini hipotesis null- nya : kedua metode memberikan hasil yang sama atau H o :  1  =  2 dan kita akan menguji apakah ( x 1 – x 2 ) berbeda secara nyata dari nol.

Jika kedua sampel mempunyai standard deviasi yang tidak berbeda secara signifikan ( cara mengujinya akan dibahas pada bab berikutnya ), estimasi standard deviasi gabungan , s untuk 2 eksperimen tsb dapat dihitung menggunakan standard deviasi masing-masing eksperimen , s 1 dan s 2 Untuk memutuskan apakah x 1 dan x 2 berbeda secara signifikan , kita perlu menghitung nilai statistik t sebagai berikut : derajad kebebasan t adalah n 1 +n 2 -2 ( ingat metode ini mengasumsikan bahwa sampel diperoleh dari populasi yang sama dengan standard deviasi yang tidak berbeda signifikan ) ‏

Contoh-1 Dalam rangka membandingkan 2 metode penentuan krom pada sampel rumput , diperoleh data sbb : metode 1: mean=1,48, standar deviasi 0,28 metode 2: mean=2,33, standar deviasi 0,31 untuk tiap metode penentuan dilakukan sebanyak 5 kali ( Sahuquillo , A, et al., 1999. Analyst 124:1) ‏ Ujilah apakah kedua metode tsb mempunyai mean yang berbeda nyata ? Jawab: Hipotesis null (H o ) = mean kedua metode sama Standar deviasi gabungan : s 2 = (4 x 0,28 2 + 4 x 0,31 2 )/(5 + 5 -2) = 0.08725 s = 0,295 Nilai statistik t hitung = (2,33 – 1,48)/0,295 (1/5 + 1/5) 1/2 = 4,56 derajad kebebasan t adalah 5+5-2=8 dan nilai kritis untuk t 8 = 2,31 ( P =0,05), Karena t terhitung > t tabel H o ditolak atau kedua metode menghasilkan konsentrasi krom yang berbeda

Contoh-2 Dalam suatu seri eksperimen penentuan konsentrai timah dalam bahan makanan , sampel direfluks dengan asam klorida dengan waktu refluks yang berbeda . Berikut adalah beberapa hasil penentuan : Waktu refluks ( menit ) Konst . Timah (mg kg -1 ) ‏ 30 55, 57, 59, 56, 56, 59 75 57, 55, 58, 59, 59, 59 (Analytical Methods Committee. 1983. Analyst 108: 109) ‏ Ujilah apakah mean konsentrasi timah pada kedua variasi waktu refluks berbeda secara signifikan ? Mean dan variansi data untuk kedua variasi waktu refluks adalah : 30 menit : x 1 = 57.00 s 1 2 = 2.80 75 menit : x 2 = 57.83 s 2 2 = 2.57 Hipotesis null (H o )= waktu refluks tidak berpengaruh pada konsentrasi timah . Standar deviasi gabungan 2 variasi waktu refluks dapat dihitung : s 2 = (5 x 2,80 + 5 x 2.57)/10 = 2,685 s = 1,64 Nilai statistik t = (57,00 – 57,83)/{1,64(1/6 +1/6) 1/2 } = -0,88 Nilai kritis untuk t 10 = 2,23 (P = 0,05), Jadi H o diterima atau lama waktu refluks tidak berpengaruh secara signifikanpada tingkat kandungan timah dalam makanan

2.b Perbandingan dua mean dari populasi dengan standar deviasi berbeda Statistik t dihitung dari : t = ( x 1 - x 2 )/( s 1 2 / n 1 + s 2 2 / n 2 ) 1/2 dengan derajad kebebasan t = ( s 1 2 / n 1 + s 2 2 / n 2 ) 2 / {( s 1 4 / n 1 2 ( n 1 -1) + ( s 2 4 / n 2 2 ( n 2 -1)} dengan nilai yang diperoleh dibulatkan menjadi integer. Minitab: dibulatkan ke integer yang lebih kecil (4,7 → 4) ‏ Excel: dibulatkan ke integer terdekat ( 4,7 → 5).

Contoh Data berikut adalah konsentrasi thiol (mM) dalam lysate darah dari dua kelompok volunteer. Group I adalah kelompok normal sedangkan group II adalah kelompok pasien pengidap rheumatoid arthritis: Normal: 1,84 1,92 1,94 1,92 1,85 1,91 2,07 Rheumatoid: 2,81 4,06 3,62 3,27 3,27 3,76 ( Banford , et al., 1983. Analyst . 107: 195) ‏ Ujilah apakah mean konsentrasi thiol kedua group sama ? Jawab: Hipotesis null (H o ): Mean konsentrasi thiol kedua group adalah sama Jika kita lakukan perhitungan thd 2 kelompok data di atas diperoleh : Normal: n 1 = 7 x 1 = 1,921 s 1 = 0,076 Rheumatoid: n 2 = 6 x 2 = 3,465 s 2 = 0,440

Normal (Xi-X) (Xi-X)^2 1.84 -0.081 0.006561 1.92 -0.001 1E-06 1.94 0.019 0.000361 1.92 -0.001 1E-06 1.85 -0.071 0.005041 1.91 -0.011 0.000121 2.07 0.149 0.022201 Rheumatoid (Xi-X) (Xi-X)^2 2.81 -0.655 0.429025 4.06 0.595 0.354025 3.62 0.155 0.024025 3.27 -0.195 0.038025 3.27 -0.195 0.038025 3.76 0.295 0.087025 x 1 = 13,45/7 = 1,921 s 1 = = 0,076   x 2 = 20,79/6 = 3,465 s 2 = = 0,440   t = ( x 1 - x 2 )/( s 1 2 / n 1 + s 2 2 / n 2 ) 1/2 dengan derajad kebebasan t = ( s 1 2 / n 1 + s 2 2 / n 2 ) 2 / {( s 1 4 / n 1 2 ( n 1 -1) + ( s 2 4 / n 2 2 ( n 2 -1)}

t hitung = 8,48 derajat kebebasan = 5,3 ( dibulatkan menjadi 5) Nilai kritis untuk t 5 = 4,03 ( P = 0,01) Karena t hitung > t kritis , maka H o ditolak yakni terdapat cukup bukti bahwa mean konsentrasi thiol untuk kedua kelompok berbeda secara signifikan pada level 1%.

3. Paired t-test (Uji-t berpasangan ) ‏ Digunakan untuk membandingan dua kelompok pengukuran ( misal dengan metode yang berbeda ) untuk berbagai sampel yang juga berbeda , sehingga data tidak dapat dirata -rata. Digunakan rata-rata perbedaan ( d ) dari masing-masing pasangan data. Jika H o :  d = 0 diterima , berarti dua set penentuan terhadap berbagai sampel dengan 2 metode yang berbeda tersebut tidak berbeda secara signifikan . Untuk menguji H o , kita harus menguji apakah nilai d berbeda nyata dari dengan cara menghitung harga statistik t sbb : derajad kebebasan t adalah n -1

Contoh Ujilah apakah ada perbedaan yang signifikan dari hasil penentuan konsentrasi paracetamol dalam tablet obat menggunakan dua metode yang berbeda ? Jawab: Data tsb mempunyai rata-rata d = 0,159 dan standard deviasi , s d = 0,570 Nilai statistik t terhitung untuk n = 10 adalah 0,88, sedangkan nilai kritis untuk t 9 = 2,26 ( P = 0,05). Karena t terhitung < t table berarti H o diterima yang berarti bahwa kedua metode tidak memberikan hasil yang berbeda -0,21 84,24 84,03 10 -0.07 84,13 84,06 9 +0.09 83,60 83,69 8 -0,10 84,02 83,92 7 -0,61 84,16 83,55 6 -0,10 83,92 83,82 5 +0,21 84,20 84,41 4 +0,24 83,84 84,08 3 +0,66 83,72 84,38 2 +1,48 83,15 84,63 1 d NIR Spectr UV-Vis Spectr. Batch

4. One sided and two-sided tests (Uji dua sisi dan satu sisi ) ‏ Metode yg dibicarakan sejauh ini menyangkut uji perbedaan 2 mean pada 2 arah , yakni tidak memandang perbedaan positif atau negatif karena sebelum analisis dilakukan tidak terdapat “ praduga ” bahwa perbedaannya akan positif atau negatif . Karena itu uji yang dilakukan harus mencakup kedua sisi tersebut ( baik perbedaan positif maupun negatif ). Uji semacam ini disebut uji 2-sisi ( two-sided ) atau 2-ekor ( two-tailed ) ‏ Dalam beberapa kasus , kita hanya menghendaki uji perbedaan positif saja atau sebaliknya : misal percobaan menaikkan laju suatu reaksi dengan penambahan katalis . Dalam hal ini , sebelum percobaan dilakukan kita sudah mempunyai asumsi bahwa laju reaksi akan naik, sehingga uji yang dilakukan adalah mengetahui apakah laju reaksi sesudah penambahan katalis berubah (naik) secara signifikan . Uji semacam ini disebut uji satu-sisi ( one-sided ) atau satu-ekor ( one-tailed ) ‏ Untuk uji satu-sisi probabilitasnya adalah 2 kali uji dua-sisi , sehingga untuk uji dengan level P =0,05, nilai kritisnya diperoleh dari harga t untuk P = 0,1 pada tabel , sedangkan untuk level P=0,01, nilai t kritis diperoleh pada tabel dengan P = 0,02

Contoh Suatu metode titrasi asam-basa ditengarai mempunyai kesalahan indikator sehingga cenderung untuk memberikan hasil dengan kesalahan sistematik positif (bias positif ). Untuk menguji hal ini dilakukan titrasi terhadap 25,00 mL larutan basa 0,1 M dengan larutan asam 0,1 M sebanyak 6 kali dengan hasil sbb : 25,06 25,18 24,87 25,51 25,34 25,41 Ujilah apakah terdapat bias positif pada data tersebut ! Jawab: x= 151,37/6= 25,228 s= = 0,238   Volume (mL) (xi-x) (xi-x)^2 25.06 -0.168 0.028224 25.18 -0.048 0.002304 24.87 -0.358 0.128164 25.51 0.282 0.079524 25.34 0.112 0.012544 25.41 0.182 0.033124

untuk data tersebut diperoleh mean=25,228 mL dan standar deviasi = 0,238 mL Jika hipotesis null: tidak ada bias pada data, H o :  = 25,00 ml, menggunakan pers : t = {(x –  ) √n}/s , diperoleh : t = (25,228-25,00)x√6)/0,238 = 2,35 dari tabel t kritis diperoleh t 5 = 2,02 (P=0,05, uji satu-sisi ). Karena nilai t terhitung > dari t kritis maka hipotesis null ditolak atau terdapat bukti adanya bias positif pada data titrasi di atas .

F-test for the comparison of standard deviations (Uji- F untuk membandingkan 2 standar deviasi ) ‏ Sejauh ini uji yg telah dibahas adalah perbandingan mean, jadi merupakan deteksi kesalahan sistematik . Dalam hal tertentu kadang juga diperlukan perbandingan standar deviasi , yaitu kesalahan random dari 2-set data. Sebagaimana uji mean, uji ini juga mempunyai 2 bentuk , yaitu menguji apakah metode A lebih teliti ( precise ) dibanding Metode B ( one-sided test ) atau menguji apakah presisi metode A berbeda dari presisi metode B ( two-sided test ) ‏ Jadi jika kita ingin menguji apakah suatu metode analitik lebih teliti dari metode standard kita gunakan uji satu-sisi , sedangkan jika ingin menguji apakah 2 standar deviasi berbeda secara signifikan kita gunakan uji dua-sisi Uji-F

Prosedur Uji - F Untuk menguji apakah perbedaan 2 variansi sampel signifikan , yaitu uji H o :  1 2 =  2 2 , dihitung nilai statistik F sbb : F = s 1 2 / s 2 2 dimana penempatan 1 dan 2 diatur sedemikian rupa sehingga nilai F ≥ 1. degree of freedom pembilang dan penyebut masing-masing adalah n 1 – 1 dan n 2 – 1 . Uji mengasumsikan bahwa sampel diambil dari suatu populasi yang berdistribusi normal. Jika hipotesis null benar maka nilai F akan mendekati 1 dan jika nilai F terhitung melampaui nilai kritis F tertentu maka hipotesis null tertolak

Contoh-1 ( One sided-test ): Suatu metode usulan untuk penentuan COD ( chemical oxygen demand ) dalam air limbah dibandingkan ketelitiannya dengan hasil penentuan menggunakan metode standard (garam merkuri ) dan diperoleh data sbb : Mean (mg L -1 ) Standard deviasi (mg L -1 ) ‏ Metode standar 72 3,31 (n=8) ‏ Metode usulan 72 1,51 (n=8) ‏ Ujilah apakah metode usulan lebih teliti (precise) dibanding metode standard? (Ballinger, et al., 1982, Analyst , 107:1047) Jawab: Kita harus memutuskan apakah tingkat presisi metode usulan lebih baik dari metode standard. Nilai F diberikan oleh rasio variansi kedua metode : F = 3,31 2 /1,51 2 = 4,8 Dalam hal ini dipergunakan uji 1-sisi (one-sided). Pada Tabel derajat kebebasan penyebut diberikan pada kolom bagian kiri , sedangkan derajad kebebasan pembilang diberikan di sebelah atas . Karena ukuran kedua sampel 8 (n = 8), maka kita akan mencari nilai kritis F 7,7 = 3,787 ( P = 0,05). Terlihat bahwa nilai F terhitung > nilai F tabel , jadi tingkat presisi metode usulan lebih baik dari metode standard pada tingkat probabilitas 5%.

Pada contoh sebelumnya ( Contoh 1-slide 10) untuk kasus di bawah ini telah diasumsikan bahwa variansi kedua metode tidak berbeda secara signifikan . Ujilah apakah benar variansi kedua metode tidak berbeda secara signifikan : Dalam rangka membandingkan 2 metode penentuan krom pada sampel rumput , diperoleh data sbb : metode 1: mean=1,48, standar deviasi 0,28 metode 2: mean=2,33, standar deviasi 0,31 untuk tiap metode penentuan dilakukan sebanyak 5 kali ( Sahuquillo , A, et al., 1999. Analyst 124:1)” Jawab: Nilai F untuk menguji variansi kedua metode dihitung : F = 0,31 2 /0,28 2 = 1,23 Dalam hal ini kita tidak punya pengetahuan awal apakah presisi satu metode lebih baik dari metode yang lain. Oleh karena itu uji yang paling tepat adalah uji- F dua-sisi . Dari Tabel harga F untuk uji dua-ekor ( two-tailed ) diperoleh harga F untuk F 4,4 = 9,605 yang ternyata > dari harga F terhitung sehingga disimpulkan tidak ada perbedaan signifikan antara dua variansi dari dua metode tersebut pada level 5%. Contoh-2 ( Two sided-test ):

Outliers ( Pencilan ) ‏ Pada data hasil eksperimen sering dijumpai hasil yang sangat ekstrim berbeda dari data-data yang lain. Data seperti ini disebut dengan Outliers ( Pencilan ) ‏ Untuk menguji apakah data yang ekstrim tersebut termasuk outliers dapat dilakukan : 1. Uji Dixon 2. Uji Grubbs

Uji Dixon ( Q-test ) Uji Grubbs ( G-test )

Uji Dixon ( Q-test ) untuk Outliers Uji ini berlaku untuk sampel ukuran kecil (3 – 7 data) dan diasumsikan data berdistribusi normal. Prosedur uji ini adalah menguji hipotesis null, H o : semua hasil pengukuran berasal dari populasi yang sama . Nilai statistik Q dihitung dari : Q = | nilai yang dicurigai – nilai terdekat |/( nilai terbesar – nilai terkecil ) ‏ Nilai kritis Q pada berbagai tingkat signifikansi diberikan pada Tabel Q ( untuk two-sided) . Jika nilai terhitung > nilai tabel , H o ditolak dan data yang dicurigai dikeluarkan dari perhitungan ( outliers ) ‏ Contoh : data-data berikut diperoleh dari penentuan konsentrasi nitrat (mg L -1 ) dalam sampel air sungai : 0,403 0,410 0,401 0,380 Data terakhir dicurigai sebagai pencilan , tujukkan apakah data tersebut harus dikeluarkan ! Nilai Q = |0,380-0,401|/(0,410-0,380) = 0,021/0,03 = 0,7 Nilai kritis Q untuk sampel berukuran 4 adalah 0,831 ( P = 0,05) ‏ Jadi data harus dipertahankan karena Q terhitung < Q tabel .

Dalam situasi seperti contoh diatas biasanya akan dilakukan pengukuran tambahan untuk memastikan apakah data yang dicurigai harus ditolak , dan apabila setelah diuji lagi ternyata harus dipertahankan akan mengurangi pengaruhnya baik terhadap mean maupun terhadap standar deviasi . Jika 3 pengukuran ditambahkan pada data contoh di atas sehingga diperoleh : 0,403 0,410 0,401 0,380 0,400 0,413 0,411 Tunjukkan apakah data yang dicurigai (0,380) dapat dipertahankan ? Nilai Q untuk 7 data: Q = |0,380-0,400|/(0,413-0,380) = 0,606 Nilai kritis untuk sampel berukuran 7 pada P = 0,05 adalah 0,570. dengan demikian data 0,380 adalah outliers dan harus ditolak Terlihat bahwa penambahan data ( pengulangan ) akan menyebabkan data yang dicurigai lebih mantap untuk ditolak

Grubbs’ test untuk Outliers Uji ini mambandingkan penyimpangan data tercurigai dari nilai mean dengan standard deviasi sampel . Uji ini lebih direkomendasikan oleh ISO untuk digunakan dari pada Dixons’ test Grubbs’ test menguji hipotesis null, H o : semua pengukuran berasal dari populasi yang sama , nilai statistik G dihitung dari : G = | nilai yang dicurigai – x | / s dimana s dihitung dengan memasukkan nilai yang dicurigai , sedangkan data diasumsikan berdistribusi normal Contoh : Pakailah Uji Grubbs untuk menguji outliers pada data sebelumnya ? Tujuh data di atas mempunyai nilai rata-rata ( x ) = 0,4026 dan s = 0,01121 G = |0,380-0,4026|/0,01121 = 2,016 Nilai kritis G untuk P = 0,05 adalah 2,02, jadi data yang dicurigai hanya mendekati ditolak , tetapi masih harus tetap dipertahankan karena G hitung masih < dari G tabel . Terlihat dengan menggunakan uji yang berbeda juga dapat diperoleh hasil yang berbeda meskipun menggunakan data yang sama .
Tags