Ilmu statistika dibagi atas 2 jenis , yaitu : Statistika Deskriptif Metoda yang berkaitan dengan pengumpulan dan penyajian sekumpulan observasi (data) sehingga memberikan informasi yang berguna . Metoda ini berkaitan dengan penggunaan tabel , grafik , dan ringkasan numerik untuk : Mengenali pola dalam himpunan observasi (data). Merangkum informasi yang didapat dalam himpunan observasi (data). Menyajikan informasi dengan cara yang mudah . 2 . Statistika Informasi Metode yang berkaitan dengan penggunaan data sampel untuk menaksir , membuat keputusan , melakukan peramalan , dan generalisasi untuk himpunan data yang lebih besar yaitu populasi .
Selanjutnya kita akan membahas lebih detail kedua ilmu statistika berikut . Pertama-tama kita akan membahas mengenai statistika deskriptif terlebih dahulu , baru kemudian membahas statistika informasi .
Statistika Deskriptif Berikut ini akan dijelaskan salah satu metode dalam statistika deskriptif , yaitu meringkas data dengan cara mengelompokan data kedalam beberapa kelas setelah data dikelompokan , kemudian akan dihitung banyaknya pengamatan yang masuk dalam setiap kelas . Susunan demikian ( dalam bentuk tabel ) disebut dengan Tabel Distribusi Frekuensi . Untuk lebih jelasnya bagaimana meringkas data dalam bentuk tabel distribusi frekuensi , perhatikan contoh berikut ini .
Misalkan disajikan umur dari 40 buah aki mobil yang serupa jenisnya dan dicatat sampai sepersepuluhan terdekat . Aki- aki mobil tersebut dijamin mencapai umur 3 tahun . UMUR AKI MOBIL 2.2 4.1 3.5 4.5 3.2 3.7 3 2.6 3.4 1.6 3.1 3.3 3.8 3.1 4.7 3.7 2. 5 4.3 3.4 3.6 2.9 3.3 3.9 3.1 3.3 3.1 3.7 4.4 3.2 4.1 1.9 3.4 4.7 3.8 3.2 2.6 3.9 3 4.2 3.5
Berikut ini langkah-langkah dalam menentukan tabel distribusi frekuensi Tentukan interval kelas yang diperlukan Tentukan wilayah data tersebut Bagilah wilayah data dengan banyaknya interval kelas untuk menduga lebar interval kelas Tentukan limit bawah kelas bagi interval yang pertama dan kemudian batas bawah kelasnya . Tambahkan lebar kelas pada batas bawah kelas untuk mendapatkan batas atas kelasnya . Daftar semua limit kelas dan batas kelas dengan cara menambahkan lebar kelas pada limit dan batas interval sebelumnya . Tentukan titik tengah kelas pada masing-masing interval dengan cara merata-ratakan limit kelas atau batas kelasnya . Tentukan frekuensi bagi masing-masing kelas . Jumlahkan kolom frekuensi dan periksa apakah hasilnya sama dengan banyaknya total pengamatan atau observasi .
Sekarang akan diterapkan langkah-langkah diatas pada contoh diatas . Dalam hal ini dimisalkan banyaknya interval kelas adalah 7 atau 2) Wilayah data . 3) Lebar interval kelas Interval Kelas Batas Kelas Titik Tengah Kelas Frekuensi (f) 1.5 - 1.9 1.45 - 1.95 1.7 2 2.0 - 2.4 1.96 - 2.45 2.2 1 2.5 - 2.9 2.45 - 2.95 2.7 4 3.0 - 3.4 2.95 - 3.45 3.2 15 3.5 - 3.9 3.45 - 3.95 3.7 10 4.0 - 4.4 3.95 - 4.45 4.2 5 4.5 - 4.9 4.45 - 4.95 4.7 3 Jadi tabel distribusi frekuensinya adalah sebagai berikut
Selanjutnya dari tabel distribusi frekuensi tersebut akan digambar grafik diagram Perbedaan antara diagram balok dengan histogram adalah jika diagram balok menggunakan interval kelas sedangkan grafik histogram menggunakan batas kelasm balok dan grafik histogram. 2 .4 1.9 2 .9 3 .4 3.9 4.4 4.9 4.5 1.5 2 .0 3 .0 3 .5 4 .0
Histogram frekuensi kumulatif dibentuk dengan cara yang sama dengan histogram frekuensi . Histogram untuk umur aki 2 .45 2 .95 3.95 4.95 3.45 4 .45
Selanjutnya , selain grafik diagram balok dan histogram, ada grafik lain yang dapat digunakan untuk menyajikan data. Grafik tersebut adalah poligon frekuensi . Poligon frekuensi dibentuk dengan memplotkan frekuensi kelas dengan terhadap titik tengah kelas dan kemudian menghubungkan titik-titik yang berurutan dengan garis lurus .
Poligon Frekuensi : Poligon Frekuensi Kumulatif : Poligon Frekuensi Kumulatif di sebut dengan ogif Penjelasan-penjelasan diatas menggunakan frekuensi.Bisa juga kita menggunakan frekuensi relatif atau presentase , maka kumulatifnya juga dalam bentuk persentase . Cara buat grafiknya sama dengan cara buat grafik untuk frekuensi .
Selain diagram balok , histogram dan poligon berikut ini akan diperkenalkan juga diagram lingkaran (pie chart) Perhatikan contoh berikut ini : Misalkan diketahui tabel distribusi frekuensi hasil pemungutan suara mahasiswa : Tanggapan Mahasiswa Frekuensi Frekuensi Relatif Menentang 152 0.543 Netral 77 0.275 Mendukung 51 0.182 Total 280 1
Diagram lingkarannya adalah :
Diagram garis (line chart), bisa dipelajari sendiri . Bentuknya mirip dengan poligon Selanjutnya akan dibahas diagram batang dan daun Perhatikan ilustrasi berikut ini : Berikut ini adalah daftar nilai ujian Bahasa Inggris dan Bahasa Prancis siswa untuk suatu kelas disekolah . Datanya adalah sebagai berikut : Siswa Nilai Bahasa Perancis Nilai Bahasa Inggris 1 75 52 2 69 58 3 58 68 4 58 77 5 46 38 6 44 85 7 52 43 8 50 44 9 57 56 10 78 65 11 81 65 12 61 79 13 61 44 14 45 71 15 31 84 16 44 72 17 53 63 18 66 69 19 47 72 20 57 79
Diagram batang dan daunya adalah sebagai berikut : Bahasa Perancis Batang : Puluhan Daun : Satuan Bahasa Inggris Batang : Puluhan Daun : Satuan 3 4 5 6 7 8 1 4 1 5 1 2 5 3 1 8 5 3 6 6 7 9 7 8 8 3 4 5 6 7 8 8 3 2 3 1 4 4 6 5 2 5 4 8 5 2 8 7 8 9 9
Ringkasan Numerik pada Statistika Deskriptif: Untuk mendeskripsikan himpunan data secara numerik, dapat menggunakan ringkasan statistik antara lain: Ukuran tendensi sentral (ukuran pemusatan). Seperti : mean, median, modus, kuartil, desil dan persentil Ukuran variabilitas (penyebaran). Seperti : range, standar deviasi, variansi dan koefisien variansi.
Ukuran Tendensi Sentral Menunjukan letak dari pusat data. Beberapa ukuran dari tendensi sentral akan dibahas disini , yaitu : mean, median, modus, kuartil , desil dan persentil . Mean dari data numerik : adalah : Mean dari data yang dikelompokan : dimana : k = banyaknya kelas fi = frekuensi kelas xi = nilai tengah kelas
Median Median adalah suatu bilangan yang menbagi data yang sudah diurutkan menjadi dua bagian yng sama banyaknya sedemikian sehingga setengah data lebih besar dan setengah lainya lebih kecil dari bilangan tersebut . Jika n ganjil : Jika n genap : Untuk data yang dikelompokkan : dengan = batas bawah kelas median = lebar interval kelas = banyak pengamatan = jumlah frekuensi sebelum kelas median = frekuensi kelas median Untuk data numerik
Modus Modus dari sekumpulan pengamatan atau observasi adalah pengamatan yang paling sering muncul atau memiliki nilai frekuensi terbesar.Untuk data yang dikelompokkan: dengan = batas bawah kelas modus = lebar interval kelas = banyak pengamatan = Selisih antara frekuensi kelas modus dengan frekuensi kelas sebelum kelas modus = Selisih antara frekuensi kelas modus dengan frekuensi kelas setelah kelas modus
Masih ada beberapa ukuran lokasi lain yang digunakan untuk menjelaskan atau menunjukkan lokasi sebagaian data relatif terhadap keseluruhan data. Ukuran-ukuran tersebut disebut fraktil atau kuantil . Fraktil atau kuantil adalah nilai-nilai yang dibawahnya terdapat sejumlah persentase tertentu dari seluruh pengamatan . Fraktil atau kuantil yang sering digunakan adalah persentil , desil dan kuartil . Satu persatu akan dibahas hal tersebut .
Persentil Persentil adalah nilai-nilai yang membagi segugus pengamatan menjadi 100 bagian yang sama . Nilai- nilai tersebut dinotasikan dengan , ,..., , masing-masing bersifat 1% dari seluruh data terletak dibawah , 2% terletak dibawah , ..., 99% terletak dibawah . Desil Desil adalah nilai-nilai yang membagi segugus pengamatan menjadi 10 bagian yang sama . Nilai- nilai dinotasikan oleh , ,..., masing masing bersifat 10% data terletak dibawah , ... , 90% data terletak dibawah . Kuartil Kuartil adalah nilai-nilai yang membagi segugus pengamatan menjadi 4 bagian yang sama . Nilai- nilai itu dinotasikan dengan , dan , masing-masing bersifat 25% data terletak dibawah , 50% data terletak dibawah , dan 25% data terletak dibawah .
Akan dihitung mean, median, modus dan kuartil untuk data dikelompokkan diatas. Mean : Median : Jumlah pengamatan 40. Berarti nilai median ada diurutan ke-20. Jadi kelas mediannya ada di 2.95 - 3.45. Berarti = 2.95, dan frekuensi kelas median = = 15
Modus Kelas modus : 2.95 – 3.45 Batas bawah kelas modus = 0.5 = 11 = 5 Modus
Kuartil Dalam hal ini kita akan menentukan , dan . Akan dicari 25% data ada di , n = 40 Artinya dibawah ada 10 pengamatan Dari tabel distribusi frekuensi diatas , 7 pengamatan ada dikelas 2.45-2.95. Artinya 3 pengamatan lagi ada di kelas 2.95 - 3.45. Jadi kita butuh 3 pengamatan dari 15 pengamatan yang ada dikelas tersebut
Rumus : = batas bawah kelas kuartil 1 = lebar interval kelas = banyak pengamatan Jumlah pengamatan ada 40. Berarti nilai ada di urutan ke-10
Akan dicari 50% data ada dibawah Nilai ada diurutan ke-20 Rumus : Batas kelas kuartil adalah : 2.95 - 3.45 Batas bawah kelas kuartil : = 2.95 = 7 = 15
Akan dicari 75% data ada dibawah Nilai ada diurutan ke-30 Rumus : Batas kelas kuartil adalah :3.45 - 3.95 Batas bawah kelas kuartil : = 3.45 = 22 = 10
Ukuran Variabilitas ( penyebaran ) Ukuran tendensi sentral kurang lengkap jika tidak disertai dengan ukuran penyebaran . Jika penyebaran kecil artinya data terletak disekitar pusat data dan dapat dikatakan bahwa pusat data dapat mewakili data dengan baik . Jika penyebaran besar , berarti data terletak jauh dari pusat data atau pusat data kurang mewakili data.
Beberapa ukuran penyebaran : Range : Perbedaan antara nilai observasi terbesar dengan nilai observasi terkecil yang terdapat dalam data. Variansi : Mengukur penyebaran data terhadap mean data. Standar deviasi : Ukuran penyebaran yang memperhitungkan deviasi dari setiap observasi terhadap meannya . Interquantile Range ( Deviasi Kuartil ) dimana = kuartil atas , = kuartil bawah Koefisien Variansi
Contoh : Dalam hal ini akan digunakan contoh dari umur aki ( tabel distribusi frekuensinya bisa dilihat lagi ) Range = r = 4.7 - 1.6 = 3.1 Karena ini adalah data yang sudah dikelompokkan , maka kita menggunakan rumus : Variansi = Standar deviasi = Interquantile Range ( Deviasi Kuartil ) Koefisien Variansi Interval Kelas Batas Kelas Titik Tengah Kelas Frekuensi 1.5 - 1.9 1.45 - 1.95 1.7 2 2.89 3.4 5.78 2.0 - 2.4 1.96 - 2.45 2.2 1 4.84 2.2 4.84 2.5 - 2.9 2.45 - 2.95 2.7 4 7.29 10.8 29.16 3.0 - 3.4 2.95 - 3.45 3.2 15 10.24 48 153.6 3.5 - 3.9 3.45 - 3.95 3.7 10 13.69 37 136.9 4.0 - 4.4 3.95 - 4.45 4.2 5 17.64 21 88.2 4.5 - 4.9 4.45 - 4.95 4.7 3 22.09 14.1 66.27 Interval Kelas Batas Kelas Titik Tengah Kelas Frekuensi 1.5 - 1.9 1.45 - 1.95 1.7 2 2.89 3.4 5.78 2.0 - 2.4 1.96 - 2.45 2.2 1 4.84 2.2 4.84 2.5 - 2.9 2.45 - 2.95 2.7 4 7.29 10.8 29.16 3.0 - 3.4 2.95 - 3.45 3.2 15 10.24 48 153.6 3.5 - 3.9 3.45 - 3.95 3.7 10 13.69 37 136.9 4.0 - 4.4 3.95 - 4.45 4.2 5 17.64 21 88.2 4.5 - 4.9 4.45 - 4.95 4.7 3 22.09 14.1 66.27
Simetris dan Kemencengan Untuk melihat apakah suatu data adalah menceng kiri , menceng kanan atau simetris , akan digunakan ukuran kemencengan Pearson. Simetris Menceng Kanan Menceng Kiri
Rumusnya adalah sebagai berikut : = Mean = Modus = Standar deviasi Jika KM = 0 -> distribusi simetrik Jika KM > 0 -> distribusi menceng kanan Jika KM < 0 -> distribusi menceng kiri
Contoh : Akan dilihat bagaimana kemencengan distribusi data umur aki = 3.4125 = 3.29 = 0.697 Distribusi datanya menceng kanan artinya umur aki kebanyakan berumur pendek
Diagram Kotak (Box Plot) Untuk menggambar diagram kotak , kita memerlukan 5 nilai yang dianggap dapata mewakili data, yaitu : Kuartil bawah , Kuartil atas , Median atau kuartil tengah , ekstrim bawah ( nilai terkecil ), ekstrim atas ( nilai terbesar ).Pada diagram kotak , data memiliki distribusi dimetris , apabila : Garis dalam kotak terletak ditengah Nilai terkecil - kuartil bawah = Nilai terbesar - kuartil atas Banyaknya pengamatan disekitar nilai ekstrim harus kecil . kuartil bawah - nilai terkecil
Contoh : Akan dibuat diagram kotak (box plot) untuk data umur aki . Diatas sudah dihitung : = 3.05 = 3.38 = 3.85 Nilai terbesar = = 4.7 Nilai terkecil = = 1.6 1 2 3 4 5