Biostatistik Sesi 4 dan 5, Distribusi Sampling dan Estimasi Oleh: Hadi Nugroho, SKM., M.Epid.
a. Pendahuluan Dalam statistik deskriptif dibicarakan mengenai bagaimana mendapatkan deskripsi dari data yang diolah atau sengaja dikumpulkan untuk mendapatkan informasi yang terkandung di dalamnya. Dalam statistik inferens kita akan membicarakan bagaimana menggenarilisasi informasi yang telah didapatkan. Misalnya: dalam suatu survei di Tangerang dilakukan wawancara sebanyak 210 orang yang mempunyai balita bahwa yang melakukan pemeriksaan sampai K4 sebanyak 20%. Data dari pengumpulan sebanyak 210 ibu tersebut ingin kita perlakukan menjadi informasi untuk populasinya (Tangerang). Untuk itu akan dipakai metode statistik inferens.
Sebelum membicarakan materi estimasi dan uji hipotesis perlu memahami apa yang disebut distribusi sampling. Dasar-dasar di dalam statistik inferens ini adalah “distribusi sampling”. Distribusi sampling adalah distribusi dari mean-mean sampel yang diambil secara berulang kali dari suatu populasi. Untuk itu perlu kita ketahui suatu ketentuan yang dapat membedakan beberapa ukuran antara sampel dan populasi Ukuran sampel dan populasi SAMPEL POPULASI Nilai (karakteristik) statistik parameter Mean (rata-rata hitung) x ̅ μ Standar Deviasi s σ Jumlah Unit n N
Sifat-sifat distribusi sampling Sifat distribusi sampling disebut juga Central Limit Theorem (teorama limit pusat). Sifat inilah yang mendasari teori inferens. Sifat-sifat tersebut adalah: Sifat 1: apabila sampel-sampel random dengan n elemen masing-masing diambil dari suatu populasi normal, yang mempunyai mean = μ varian , (nilai mean pada distribusi sampling sama dengan μ dan varian σ 2 /n, atau standar deviasi σ /√n). Standar deviasi distribusi sampling harga mean ini dikenal sebagai “ Standar Eror ” (SE)
Sifat 2 Apabila populasi berdistribusi normal, distribusi sampling harga mean juga akan berdistribusi normal. Maka, berlaku sifat seperti persamaan di bawah ini (Z score adalah nilai deviasi relatif antara nilai sampel dan populasi = nilai distribusi normal standar): Z=
Sifat 3 Contoh: Dipunyai populasi lima (5) orang penderita penyakit “D”, diambil sampel dengan besar n = 2, kemungkinan sampel yang terjadi adalah 5 2 = 25, yang masa inkubasinya sebagai berikut: μ = 6 hari berasal dari 2+3+6+8+11/5 σ 2 = 13,5 hari berasal dari σ = √13,5 = 3,67 No. Pasien Masa Inkubasi (hari) 1 2 2 3 3 6 4 8 5 11
Dari distribusi sampling pada data didapatkan = 6 Varian (SE 2 ) = = 43,875, SE= V43,875 = 6,62 Distribusi sampling harga mean dari kedua puluh lima sampel yang diperoleh dari lima populasi diatas kalau digambarkan dalam bentuk kurva akan membentuk kurva yang simetris (kurva normal umum). Sebagai sifat dari distribusi sampling, maka sifat-sifat kurva normal dapat diperlakukan.
Contoh soal Selama ini diyakini bahwa kadar Hb orang sehat( μ )= 12gr% dan ( σ ) = 2,5 gr%. Seorang mahasiswa telah mengambil sebanyak 25 orang pengunjung suatu Pusksesmas. Hitunglah probabilitas dari rata-rata Hb sampel tadi: > 13 gr% Antara 11 - 13,5 gr%
PR Selama ini diyakini bahwa kadar Hb orang sehat( μ )= 12gr% dan ( σ ) = 2,5 gr%. Seorang mahasiswa telah mengambil sebanyak 25 orang pengunjung suatu Pusksesmas. Hitunglah probabilitas dari rata-rata Hb sampel tadi: >12,1 11 – 12,1 <11 & >12,1 > 11
Jawab a) μ = 12 gr% σ = 2,5 gr% n= 25 SE = σ /√n = 2,5/ √25 = 0,5 gr% Z= 13 – 12 = 2 tabel = 0,4772 0,5 Jadi p(x> 13 gr%) = 0,5 – 0,4772 0,0228 b) Z 1 = 11 – 12 = 2 tabel 0,4772 0,5 Z 2 = 13,5 – 12 = 3 tabel 0,4987 + 0,5 0,9759 Jadi p ( μ gr < < 13,5 gr%) 0,9759
PERTEMUAN 5 ESTIMASI Pengertian: Estimasi adalah suatu metode di mana kita dapat memperkirakan nilai populasi (parameter) dengan memakai nilai sampel (statistik)
Ciri-ciri estimator yang baik Estimator adalah nilai statistik yang dipakai untuk menduga nilai populasi atau parameter Hasil dari pendugaan disebut estimasi secara statistik (statistical estimate). Estimator yang baik haruslah mempunyai sifat: Tidak bias Efisien, dan Konsisten
Estimator tidak bias Adalah estimator yang hasil estimasinya mengandung nilai parameter yang diestimasi Efisien Efisien apabila hasil estimasi memakai nilai tersebut pada rentang yang kecil saja sudah mengandung nilai parameter. Konsisten Adalah berapa pun besarnya sampel pada rentangnya akan mengandung nilai parameter yang sedang diestimasi
Bentuk estimasi Estimasi titik (point estimation) Nilai statististik (nilai-nilai sampel) digunakan sebagai pendugaan nilai parameter, karena nilai-nilai ini merupakan estimator yang baik untuk menduga atau mengestimasi nilai parameter Misalnya kita menduga nilai mean sampel kita anggap sebagai nilai populasi. Contoh: suatu penelitian terhadap suatu sampel ibu hamil di Kab. Cianjur dari 210 ibu didapatkan kadar Hb rata-rata adalah 7,5 gr%. Maka bila kita menggunakan estimasi titik, kita bisa katakan kadar Hb ibu hamil di Kab. Cianjur adalah 7,5 gr%
Kelemahan estimasi titik adalah kita tidak dapat mengetahui berapa kuat kebenaran dugaan kita itu. Dan kemungkinan besar akan salah. Kelemahan estimasi titk ini dapat dihilangkan dengan melakukan estimasi silang (interval)
Estimasi silang (interval estimation) Dasar estimasi interval ini adlah bahwa sampel-sampel yang diambil dari suatu populasi akan berdistribusi (normal) sekitar μ , dengan simpangan baku = SE Dengann ini kita menentukan batas minimum dan maksimum terletaknya nilai μ . Jarak dari batas tertinggi dan terendah ini ditentukan sebagai confidence interval = confidence limit, yaitu luas daerah di bawah kurva normal ditentukan dengan presentase , misalnya 90%, 95%, 99%
Rumus Umum St – Z 1/2 α SE ≤ PARAMETER ≤ St + Z 1/2 α SE St = nilai statistik (sampel = ) Z = deviasi relatif (standar score, besarnya ditentukan oleh confidence interval) SE = standard error Parameter = nilai populasi yang diduga = μ Atau - Z. SE ≤ ≤ + Z. SE
Contoh Interval Estimation Dari suatu sampel random sebanyak 100 orang ibu hamil di Kabupaten Cianjur didapatkan Hb 9,5 gr%. Simpangan baku di dalam populasi 5gr%. Confidence Interval 95% akan dihasilkan kadar Hb ibu hamil di kabupaten Cianjur adalah? Dari suatu sampel random sebanyak 3 0 orang ibu hamil di Kabupaten Cianjur didapatkan Hb 9,5 gr%. Simpangan baku di dalam sampel 8 gr%. Confidence Interval 95% akan dihasilkan kadar Hb ibu hamil di kabupaten Cianjur adalah?
Contoh Interval Estimation Dari suatu sampel random sebanyak 100 orang ibu hamil di Kabupaten Cianjur didapatkan Hb 9,5 gr%. Simpangan baku di dalam populasi 5gr%. Confidence Interval 95% akan dihasilkan kadar Hb ibu hamil di kabupaten Cianjur adalah? Jawab: St = nilai statistik (sampel = ) 9,5 gr% n sampel = 100 σ = 5 gr% SE = 5/√100 = 0,5 gr% CI = 95% Z = 1,96 9,5 gr% - 1,96 X 0,5 gr% ≤ ≤ 9,5 gr% + 1,96 X 0,5 gr% 8,5 gr% ≤ ≤ 10,48% Artinya: Kita yakin 95% bahwa Hb ibu hamil di Cianjur terletak diantara 8,52 gr% sampai 10,48% Kalau kita ambil berulang kali sampel yang besarnya 100 ibu di daerah itu, maka 95% dari mean sampel-sampel tersebut berada pada nilai 8,52 gr% sampai 10,48%
Bagaimana bila didalam soal tidak ada nilai simpangan baku dalam populasi ? Maka distribusi sampling kita asumsikan berdistribusi seperti distribusi “student t” dimana untuk menentukan nilai “t” diperlukan, disamping α , dan juga derajat kebebasan (degree of freedom) yang besarnya n – 1, dengan demikian didapatkan rumus: St – t.SE ≤ ≤ St + t.SE – t.SE ≤ ≤ + t.SE
Contoh: kalau dari 25 ibu hamil yang diambil secara random di dapatkan kadar Hb = 9 gr%, simpangan baku sampel 7,7 gr%. Maka nilai pendugaan akan menjadi – t.SE ≤ ≤ + t.SE SE = 7,7/√25 = 1,54 gr% 9-(2,064x1,54) ≤ ≤ 9 + (2,064x1,54) CI: 95%= 5,82≤ ≤ 12,17
Contoh: kalau dari 25 ibu hamil yang diambil secara random di dapatkan kadar Hb = 9 gr%, simpangan baku sampel 7,7 gr%. Maka nilai pendugaan akan menjadi
Tugas distribusi sampling dan estimasi Soal sampling Tinggi badan dari laki2 muda diketahui berdistribusi normal dengan mean 60 inchi, dan standar deviasi 10 inchi. Suatu sampel diambil dari populasi tersebut yang besarnya 25. berapa persentase sampel yang diambil dengan rata-rata berikut? Antara 57 dan 63 Kurang dari 55 64 atau lebih 65 atau lebih Soal estimasi Besarnya kadar Hb. laki-laki dewasa normal diketahui 15gr/100ml dengan standar deviasi 2 gr. Dari penelitian terhadap kelompok pekerja tertentu didapatkan 25 orang pekerja tersebut kadar Hb= 16,0gr/100ml. Tentukan 95% Confidence Interval (CI) berapa kadar Hb di Kelompok Pekerja , bandingkan dengan kadar Hb Laki-laki dewasa , dan apa interpretasinya.
Interpretasi Kadar Hb kelompok pekerja berada diantara 15,216 ; 16,784 (CI: 95%) Kadar Hb laki-laki dewasa normal berada diantara 14,216 ; 15,784 (CI: 95%)