Statistik dasar Fanny Kartika Fajriyani S2 ilmu Kesehatan Masyarakat Univesitas Sebelas Maret Surakarta
Statistik deskriptif
Empat jenis tindakan deskriptif biasanya digunakan untuk mencirikan fitur yang mendasari data: Ukuran Tendensi sentral Ukuran Kurtosis Ukuran Kemiringan Ukuran Dispers i
Ukuran Tendensi Sentral Ukuran kecenderungan sentral dianggap sebagai nilai khas (atau representatif)dari kumpulan data secara keseluruhan 1. Mean adalah Nilai rata-rata dari keseluruhan data 3. Modus Adalah nilai yang paling sering muncul 2. Median Adalah nilai tengah yang membagi keseluruhan data menjadi 2 bagian
MEAN (i) Kesederhanaan : mudah dipahami dan mudah dihitung. (ii) Keunikan : hanya ada satu rata-rata untuk satu set data yang diberikan. (iii) Nilai tengah memperhitungkan semua nilai data. (i) B ahwa nilai-nilai ekstrim memiliki pengaruh terhadap rata-rata. rata-rata dapat terdistorsi oleh nilai ekstrem . (ii) Mean aritmatika tidak dapat digunakan untuk data kualitatif .
Contoh perhitungan MEAN NO JUMLAH ANAK YANG PERNAH DILAHIRKAN JUMLAH WANITA 1 1 2 1 5 3 2 8 4 3 4 5 4 2 JUMLAH 20
MEDIAN Jika ukuran sampel (n) adalah angka ganjil, hanya ada satu nilai di tengah, dan pangkat akan menjadi bilangan bulat: Jika ukuran sampel (n) adalah bilangan genap, ada dua nilai di tengah, dan pangkat akan menjadi bilangan bulat ditambah 0,5: median = n+1 = m+0,5 2 median = n+1 2
MEDIAN (i)Kesederhanaan: Median mudah dipahami dan mudah dihitung. (ii)Keunikan: Hanya ada satu median untuk satu set data yang diberikan. (iii)Median tidak dipengaruhi secara drastis oleh nilai-nilai ekstrem seperti rata-rata. (i) Median tidak memperhitungkan semua nilai sampel setelah data di urut k an menaik. (ii) median hanya untuk variabel kuantitatif dan variabel kualitatif ordinal
MODUS Contoh modus Set Data Type Modus 26, 25, 25, 34 Kuantitatif 25 3, 7, 12, 6, 19 Kuantitatif tidak ada modus 3, 3, 7, 7, 12, 12, 6, 6, 19, 19 Kuantitatif tidak ada modus 3, 3, 12, 6, 8, 8 Kuantitatif 3 dan 8 B C A B B B C B B Kualitatif B B C A B A B C A C Kualitatif tidak ada modus B C A B B C B C C Kualitatif B dan C
MODUS (i) Kesederhanaan : mudah dimengerti dan mudah untuk dihitung. (ii) tidak dipengaruhi secara drastis oleh nilai ekstrim seperti rata-rata (iii ) dapat ditemukan untuk variabel kuantitatif dan kualitatif. ((i) bukan ukuran lokasi yang baik, karena itu tergantung pada beberapa nilai data. (ii) tidak memperhitungkan semua nilai sampel. (iii)Mungkin tidak ada mod us untuk kumpulan data. (iv)Mungkin ada lebih dari satu mode untuk satu set data.
Ukuran dispersi menyampaikan informasi mengenai jumlah variabilitas yang hadir dalam satu set data Variasi atau dispersi dalam satu set nilai mengacu pada bagaimana menyebar nilai-nilai adalah dari satu sama lain. dispersi kecil ketika nilai-nilai yang berdekatan . Tidak ada dispersi jika nilai-nilai yang sama
- Range / Rentang
Deviasi Nilai Sampel dari rata-rata sampel Misalkan x1; x2; ...; xn menjadi nilai sampel, dan x menjadi mean sampel. .
Variasi Populasi & Variasi Sampel Variasi Populasi Jika X1; X2; . . .; XN adalah nilai populasi . The variasi populasi , r2, adalah Variasi Sampel Jika x1; x2; . . .; xn adalah nilai sampel . Variasi sampel s2 adalah
Ukuran Dispersi
adalah ukuran lain dari dispersi. Simpangan baku adalah akar kuadrat positif dari varians dan dinyatakan dalam satuan asli data. Standar deviasi
Koefisien Vasriasi (C.V) -
UKURAN DISPERSI mean dipengaruhi oleh kedua perubahan dalam skala dan pergeseran asal tetapi standar deviasi dan varians dipengaruhi karena perubahan dalam skala saja . contoh 2,17 Mari kita mempertimbangkan sampel berukuran 5 sebagai berikut : 5, 3, 2, 4, 1. Misalkan a = 3 dan b = 5 . Kemudian , mean, varians , dan standar deviasi dari data asli x1, x2 , x3, x4 , and x5 = skala diubah maka kumpulan data baru ax 1; ax 2; . . .; axn . Sini, a = 3 dan n = 5; karenanya , mean, varians , dan standar deviasi =
Jarak Interkuartil - Kisaran interkuartil didefinisikan sebagai IQR = Q3 – Q1 di mana Q3 adalah kuartil ketiga dan Q1 adalah kuartil pertama. Karena nilai-nilai ekstrem tidak dipertimbangkan, IQR adalah ukuran variasi yang lebih kuat dalam data dan tidak terpengaruh oleh pencilan. Kisaran semi-interkuartil didefinisikan sebagai (Q3 – Q1) /2
Box-and-Whisker Plot -
Langkah-langkah membangun plot kotak dan kumis dirangkum di bawah ini.
-
M isalkan x1; x2; ...; xn menjadi nilai n yang diasumsikan oleh variabel, X, maka kuantitas Disebut rth sample moment mentah dari variable X.
Distribusi Moments jika x1; x2; . . .; xk terjadi dengan frekuensi f1; f2; . . .; fk , momen atas nya adalah If x1; x2; . . .; xk terjadi dengan frekuensi f1 ; f2; . . .; fk , respectively, then momen kedua , mr Relation between Moments
Skewness - Skewness adalah tingkat asimetri atau kepergian simetri suatu distribusi. Dalam distribusi miring, rerata cenderung berada di sisi yang sama dengan mode seperti ekor yang lebih panjang. Dalam distribusi simetris, mean, mode, dan median bertepatan. Beberapa ukuran kemiringan yang umum digunakan dibahas seperti yang ditunjukkan pada Gambar : Kurva simetris, condong negatif, dan condong positif
Kurtosis . - Kurtosis adalah puncak dari suatu distribusi, biasanya diambil relatif terhadap distribusi normal. Distribusi dengan puncak yang relatif tinggi disebut leptokurtik . K urva yang relatif rata atasnya disebut platykurtic . K urva yang tidak terlalu memuncak atau rata atasnya disebut mesokurtik.