Tugas Kuliah Dewi Siti Fatimah: April 2014

Minggu, 13 April 2014

TUGAS BAB VI. DISTRIBUSI NORMAL, DISTRIBUSI T, dan DISTRIBUSI F

BAB VI. DISTRIBUSI NORMAL, DISTRIBUSI T, dan DISTRIBUSI F DISTRIBUSI NORMAL Distribusi normal adalah distribusi dari variabel acak kontinu. Kadang-kadang distribusi normal disebut juga dengan distribusi Gauss. Distribusi ini merupakan distribusi yang paling penting dan paling banyak digunakan di bidang statistika. Fungsi densitas distribusi normal diperoleh dengan persamaan sebagai berikut: dimana π = 3,1416 e = 2,7183 µ = rata-rata σ = simpangan baku Persamaan di atas bila dihitung dan diplot pada grafik akan terlihat seperti pada Gambar 1 berikut: Gambar 1. kurva distribusi normal umum Sifat-sifat penting distribusi normal adalah sebagai berikut: 1. Grafiknya selalu berada di atas sumbu x 2. Bentuknya simetris pada x = µ 3. Mempunyai satu buah modus, yaitu pada x = µ 4. Luas grafiknya sama dengan satu unit persegi, dengan rincian a. Kira-kira 68% luasnya berada di antara daerah µ – σ dan µ + σ b. Kira-kira 95% luasnya berada di antara daerah µ – 2σ dan µ + 2σ c. Kira-kira 99% luasnya berada di antara daerah µ – 3σ dan µ + 3σ Membuat kurva normal umum bukanlah suatu pekerjaan yang mudah. Lihat saja rumus untuk mencari fungsi densitasnya (nilai pada sumbu Y) begitu rumit. Oleh karena itu, orang tidak banyak menggunakannya. Orang lebih banyak menggunakan DISTIBUSI NORMAL BAKU. Kurva distribusi normal baku diperoleh dari distribusi normal umum dengan cara transformasi nilai x menjadi nilai z, dengan formula sbb: Kurva distribusi normal baku disajikan pada Gambar 2 berikut ini. Gambar 2. Kurva distribusi normal baku Kurva distribusi normal baku lebih sederhana dibanding kurva normal umum. Pada kurva distribusi normal baku, nilai µ = 0 dan nilai σ=1, sehingga terlihat lebih menyenangkan. Namun, sifat-sifatnya persis sama dengan sifat-sifat distribusi normal umum. Untuk keperluan praktis, para ahli statistika telah menyusun Tabel distribusi normal baku dan tabel tersebut dapat ditemukan hampir di semua buku teks Statistika. Tabel distribusi normal bakui disebut juga dengan Tabel Z dan dapat digunakan untuk mencari peluang di bawah kurva normal secara umum, asal saja nilai µ dan σ diketahui. Sebagai catatan nilai µ dan σ dapat diganti masing-masing dengan nilai dan S. Distribusi t Distribusi t merupakan salah satu pengembangan dari Distribusi z. Secara prinsip penggunaan Distribusi t digunakan untuk membandingkan rata-rata dari dua sampel. Rata-rata dua sampel tersebut dibandingkan untuk mengetahui apakah dua data tersebut mempunyai beda. Distribusi biasanya digunakan untuk data yang banyak sampelnya kurang dari sama dengan 30. t di definisikan sebagai berikut: Dari definisi nilai t di atas, ada beberapa nilai yang perlu kita ketahui: sehingga inputan data di atas sebaiknya anda tahu. Contoh ada nilai siswa sebagai berikut: Nilai 66 40 75 64 65 71 66 81 65 50 Apakah nilai data tersebut rata-ratanya sama dengan data yang lain yang rata-ratanya 60? Dari data di atas diperoleh nilai sebagai berikut: Misalkan taraf signifikansinya 0.05, nilai derajat kebebasan data tersebut dk = 10 - 1 = 9. Dari tabel distribusi t didapatkan : Sedangkan nilai t hitung bisa diperoleh dari : Dari nilai tersebut diperoleh Kesimpulannya data diatas tidak berbeda signifikan dengan data yang rata-rata populasinya 60. Distribusi F (ANOVA) ANOVA kepanjangan dari Analysis of Variance. Distribusi yang ditemukan oleh seorang ahli statistika bernama R.A Fisher pada tahun 1920. Distribusi F (ANOVA) adalah prosedur statistika untuk menghitung apakah rata-rata hitung drai 3 populasi atau lebih sama atau tidak. Distribusi ini digunakan untuk menguji rata-rata dari tiga atau lebih populasi sekaligus untuk menentukan apakah rata-rata itu sama atau tidak. Distribusi F (ANOVA) terbagi menjadi 2 klasifikasi: 1. Klasifikasi satu arah Klasifikasi satu arah adalah sebuah klasifikasi pengmatan yang hanya didasarkan pada satu kriteria. 2. Klasifikasi dua arah Klasifikasi dua arah adalah suatu pengamatan yang didasarkan pada dua kriteria seperti varietas dan jenis pupuk.suatu pengamatan dapat diklasifikasikan menurut dua criteria dengan menyusun data tersebut menjadi baris dan kolom, kolom menyatakan kriterika klasifikasi yang satu sedangkan baris menyatakan criteria klasifikasi yang lainnya.

TUGAS BAB V. MOMENT, KEMIRINGAN DAN KURTOSIS

BAB V. MOMENT, KEMIRINGAN DAN KURTOSIS Skewness and Kurtosis Rata-rata dan ukuran penyebaran dapat menggambarkan distribusi data tetapi tidak cukup untuk menggambarkan sifat distribusi. Untuk dapat menggambarkan karakteristik dari suatu distribusi data, kita menggunakan konsep-konsep lain yang dikenal sebagai kemiringan (skewness) dan keruncingan (kurtosis). Skewness Kemiringan (skewness) berarti ketidaksimetrisan. Sebuah distribusi dikatakan simetris apabila nilai-nilainya tersebar merata disekitar nilai rata-ratanya. Sebagai contoh, distribusi data berikut simetris terhadap nilai rata-ratanya, 3. x 1 2 3 4 5 frek f) 5 9 12 9 5 Pada contoh gambar berikut, distribusi data tidak simetris. Gambar pertama miring (menjulur) ke arah kiri dan gambar ke-2 miring ke arah kanan. Pada distribusi data yang simetris, mean, median dan modus bernilai sama. Beberapa langkah-langkah perhitungan digunakan untuk menyatakan arah dan tingkat kemiringan dari sebaran data. Langkah-langkah tersebut diperkenalkan oleh Pearson. Koefisien kemiringan(Coefficient of Skewness): Interpretasi: Untuk distribusi data yang simetris, Sk = 0. Apabila distribusi data menjulur ke kiri (negatively skewed), Sk bernilai negatif, dan apabila menjulur ke kanan (positively skewed), SK bernilai positif. Kisaran untuk SK antara -3 dan 3. Ukuran kemiringan yang lain adalah koefisien β1 (baca 'beta-satu'): dimana: Interpretasi: Distribusi dikatakan simetris apabila nilai b1 = 0. Skewness positif atau negatif tergantung pada nilai b1 apakah bernilai positif atau negatif. Ukuran Skewness yang sering digunakan: Skewness Populasi: Skewness Sampel: Source: D. N. Joanes and C. A. Gill. "Comparing Measures of Sample Skewness and Kurtosis". The Statistician 47(1):183–189. atau formula berikut (MS Excel): s = standar deviasi NB: kedua formula di atas menghasilkan nilai skewness yang sama Interpretasi: Distribusi dikatakan simetris apabila nilai g1 = 0. Skewness positif atau negatif tergantung pada nilai g1 apakah bernilai positif atau negatif. Menurut Bulmer, M. G., Principles of Statistics (Dover, 1979): • highly skewed: jika skewness kurang dari −1 atau lebih dari +1 • moderately skewed: jika skewness antara −1 dan −½ atau antara +½ dan +1. • approximately symmetric: jika skewness is berada di antara −½ dan +½. Kurtosis Kurtosis merupakan ukuran untuk mengukur keruncingan distribusi data. Distribusi pada gambar di atas semuanya simetris terhadap nilai rata-ratanya. Namun bentuk ketiganya tidak sama. Kurva berwarna biru dikenal sebagai mesokurtik (kurva normal), kurva berwarna merah dikenal sebagai leptokurtik (kurva runcing) dan kurva berwarna hijau dikenal sebagai platikurtik (kurva datar). Kurtosis dihitung dengan menggunakan koefisien Pearson, β2 (baca 'beta - dua'). dimana: Ukuran Kurtosis yang sering digunakan: Kurtosis Populasi: Kurtosis: Excess Kurtosis: Kurtosis Sampel: atau formula berikut (MS Excel): s = standar deviasi NB: Excel menggunakan nilai Excess Kurtosis. Hasil perhitungan dari kedua formula di atas, menghasilkan nilai yang sama Interpretasi: Distribusi dikatakan: • Mesokurtik (Normal) jika b2 = 3 • Leptokurtik jika b2 > 3 • platikurtik jika b2 < 3 Analisis Korelasi Product Moment dalam Statistika Analisis korelasi merupakan salah satu teknik statistik yang digunakan untuk menganalisis hubungan antara dua variabel atau lebih yang bersifat kuantitatif. Salah satu dari analisis korelasi tersebut adalah analisis korelasi product moment (Pearson). Variabel yang digunakan disini terbagi dua yaitu variabel bebas (x) dengan variabel terikat (y), dengan ketentuan data memiliki syarat-syarat tertentu. Korelasi Pearson Product Moment (r) dapat diformulasikan sbb: dengan ketentuan −1 ≤ r ≤ r . Dan interpretasi koefisien korelasi nilai r ini dapat dirangkum dalam tabel berikut: Langkah-langkah yang diperlukan untuk uji korelasi Pearson Product Moment adalah sebagai berikut : 1. Rumuskan hipotesis Ha dan Ho dalam bentuk kalimat. 2. Rumuskan hipotesis Ha dan Ho dalam bentuk statistik. 3. Buat tabel pembantu. 4. Tentukan r 5. Tentukan nilai KP 6. Lakukan uji signifikansi. 7. Tentukan α , dengan derajat bebas db = n − 2 . 8. Tentukan konklus

TUGAS BAB 4 UKURAN PENYIMPANGAN

PENGUKURAN PENYIMPANGAN Pengukuran penyimpangan adalah suatu ukuran yang menunjukkan tinggi rendahnya perbedaan data yang diperoleh dari rata-ratanya. Ukuran penyimpangan digunakan untuk mengetahui luas penyimpangan data atau homogenitas data. Dua variabel data yang memiliki mean sama belum tentu memiliki kualitas yang sama, tergantung dari besar atau kecil ukuran penyebaran datanya. Ada bebarapa macam ukuran penyebaran data, namun yang umum digunakan adalah standar deviasi. Macam-macam ukuran penyimpangan data adalah : 1. Jangkauan (range) 2. Simpangan rata-rata (mean deviation) 3. Simpangan baku (standard deviation) 4. Varians (variance) 5. Koefisien variasi (Coefficient of variation) 1. Jangkauan (range) Range adalah salah satu ukuran statistik yang menunjukan jarak penyebaran data antara nilai terendah (Xmin) dengan nilai tertinggi (Xmax). Ukuran ini sudah digunakan pada pembahasan daftar distribusi frekuensi. Adapun rumusnya adalah Contoh : Berikut ini nilai ujian semester dari 3 mahasiswa A = 60 55 70 65 50 80 40 B = 50 55 60 65 70 65 55 C = 60 60 60 60 60 60 60 Dari data diatas dapat diketahui bahwa A = memiliki Xmax=80, Xmin= 40 , R = 40 , meanya 60 B = memiliki Xmax=70, Xmin= 50 , R = 20 , meanya 60 C = memiliki Xmax=60, Xmin= 60 , R = 0 , meanya 60 Dari contoh di atas dapat disimpulkan bahwa : a. Semakin kecil rangenya maka semakin homogen distribusinya b. Semakin besar rangenya maka semakin heterogen distribusinya c. Semakin kecil rangenya, maka meannya merupakan wakil yang representatif d. Semakin besar rangenya maka meannya semakin kurang representatif 2. Simpangan Rata-rata (mean deviation) Simpangan rata-rata merupakan penyimpangan nilai-nilai individu dari nilai rata-ratanya. Rata-rata bisa berupa mean atau median. Untuk data mentah simpangan rata-rata dari median cukup kecil sehingga simpangan ini dianggap paling sesuai untuk data mentah. Namun pada umumnya, simpangan rata-rata yang dihitung dari mean yang sering digunakan untuk nilai simpangan rata-rata. § Data tunggal dengan seluruh skornya berfrekuensi satu dimana xi merupakan nilai data § Data tunggal sebagian atau seluluh skornya berfrekuensi lebih dari satu dimana xi merupakan nilai data § Data kelompok ( dalam distribusi frekuensi) dimana xi merupakan tanda kelas dari interval ke-i dan fi merupakan frekuensi interval ke-i Contoh : Dari tabel diperoleh 3. Simpangan Baku (standard deviation) Standar deviasi merupakan ukuran penyebaran yang paling banyak digunakan. Semua gugus data dipertimbangkan sehingga lebih stabil dibandingkan dengan ukuran lainnya. Namun, apabila dalam gugus data tersebut terdapat nilai ekstrem, standar deviasi menjadi tidak sensitif lagi, sama halnya seperti mean. Standar Deviasi memiliki beberapa karakteristik khusus lainnya. SD tidak berubah apabila setiap unsur pada gugus datanya di tambahkan atau dikurangkan dengan nilai konstan tertentu. SD berubah apabila setiap unsur pada gugus datanya dikali/dibagi dengan nilai konstan tertentu. Bila dikalikan dengan nilai konstan, standar deviasi yang dihasilkan akan setara dengan hasilkali dari nilai standar deviasi aktual dengan konstan. Rumus Simpangan Baku untuk Data Tunggal § untuk data sample menggunakan rumus § untuk data populasi menggunkan rumus Contoh : Selama 10 kali ulangan semester ini sobat mendapat nilai 91, 79, 86, 80, 75, 100, 87, 93, 90,dan 88. Berapa simpangan baku dari nilai ulangan sobat? Jawab Soal di atas menanyakan simpangan baku dari data populasi jadi menggunakan rumus simpangan baku untuk populasi. Kita cari dulu rata-ratanya rata-rata = (91+79+86+80+75+100+87+93+90+88)/10 = 869/10 = 85,9 Kita masukkan ke rumus Rumus Simpangan Baku Untuk Data Kelompok § untuk sample menggunakan rumus § untuk populasi menggunakan rumus Contoh :Diketahui data tinggi badan 50 siswa samapta kelas c adalah sebagai berikut hitunglah berapa simpangan bakunya 1. Kita cari dulu rata-rata data kelompok tersebut 2. Setelah ketemu rata-rata dari data kelompok tersebut kita bikin tabel untuk memasukkannya ke rumus simpangan baku 4. Varians (variance) Varians adalah salah satu ukuran dispersi atau ukuran variasi. Varians dapat menggambarkan bagaimana berpencarnya suatu data kuantitatif. Varians diberi simbol σ2 (baca: sigma kuadrat) untuk populasi dan untuk s2 sampel. Selanjutnya kita akan menggunakan simbol s2 untuk varians karena umumnya kita hampir selalu berkutat dengan sampel dan jarang sekali berkecimpung dengan populasi. Rumus varian atau ragam data tunggal untuk populasi Rumus varian atau ragam data tunggal untuk sampel Rumus varian atau ragam data kelompok untuk populasi Rumus varian atau ragam data kelompok untuk sampel Keterangan: σ2 = varians atau ragam untuk populasi S2 = varians atau ragam untuk sampel fi = Frekuensi xi = Titik tengah x¯ = Rata-rata (mean) sampel dan μ = rata-rata populasi n = Jumlah data 5. Koefisien variasi (Coefficient of variation) Koefisien variasi merupakan suatu ukuran variansi yang dapat digunakan untuk membandingkan suatu distribusi data yang mempunyai satuan yang berbeda. Kalau kita membandingkan berbagai variansi atau dua variabel yang mempunyai satuan yang berbeda maka tidak dapat dilakukan dengan menghitung ukuran penyebaran yang sifatnya absolut. Koefisien variasi adalah suatu perbandingan antara simpangan baku dengan nilai rata-rata dan dinyatakan dengan persentase. Besarnya koefisien variasi akan berpengaruh terhadap kualitas sebaran data. Jadi jika koefisien variasi semakin kecil maka datanya semakin homogen dan jika koefisien korelasi semakin besar maka datanya semakin heterogen. Daftas Pustaka : Suharyadi, & Purwanto. (2009). In Statistika untuk Ekonomi dan Keuangan Modern. Jakarta: Salemba Empat.

TUGAS BAB III UKURAN PEMUSATAN

TUGAS BAB III UKURAN PEMUSATAN

UKURAN PEMUSATAN : mean, modus, median Salah satu aspek yang paling penting untuk menggambarkan distribusi data adalah nilai pusat data pengamatan (Central Tendency). Setiap pengukuran aritmatika yang ditujukan untuk menggambarkan suatu nilai yang mewakili nilai pusat atau nilai sentral dari suatu gugus data (himpunan pengamatan) dikenal sebagai ukuran pemusatan data (tendensi sentral). Terdapat tiga ukuran pemusatan data yang sering digunakan, yaitu: • Mean (Rata-rata hitung/rata-rata aritmetika) • Median • Mode Pada artikel ini akan di bahas mengenai pengertian beberapa ukuran pemusatan data yang dilengkapi dengan contoh perhitungan, baik untuk data tunggal ataupun data yang sudah dikelompokkan dalam tabel distribusi frekuensi. Selain ukuran statistik di atas, akan dibahas juga mengenai beberapa ukuran statistik lainnya, seperti Rata-rata Ukur (Geometric Mean),Rata-rata Harmonik (H) serta beberapa karakteristik penting yang perlu dipahami untuk ukuran tendensi sentral yang baik serta bagaimana memilih atau menggunakan nilai tendensi sentral yang tepat. (1) Mean (arithmetic mean) Rata-rata hitung atau arithmetic mean atau sering disebut dengan istilah mean saja merupakan metode yang paling banyak digunakan untuk menggambarkan ukuran tendensi sentral. Mean dihitung dengan menjumlahkan semua nilai data pengamatan kemudian dibagi dengan banyaknya data. Definisi tersebut dapat di nyatakan dengan persamaan berikut: Sampel: Populasi: Keterangan: ∑ = lambang penjumlahan semua gugus data pengamatan n = banyaknya sampel data N = banyaknya data populasi = nilai rata-rata sampel μ = nilai rata-rata populasi Meandilambangkan dengan (dibaca "x-bar") jika kumpulan data ini merupakan contoh (sampel) dari populasi, sedangkan jika semua data berasal dari populasi, mean dilambangkan dengan μ(huruf kecil Yunani mu). Sampel statistik biasanya dilambangkan dengan huruf Inggris, , sementara parameter-parameter populasi biasanya dilambangkan dengan huruf Yunani, misalnya μ a. Rata-rata hitung (Mean) untuk data tunggal Contoh 1: Hitunglah nilai rata-rata dari nilai ujian matematika kelas 3 SMU berikut ini: 2; 4; 5; 6; 6; 7; 7; 7; 8; 9 Jawab: Nilai rata-rata dari data yang sudah dikelompokkan bisa dihitung dengan menggunakan formula berikut: Keterangan: ∑ = lambang penjumlahan semua gugus data pengamatan fi = frekuensi data ke-i n = banyaknya sampel data = nilai rata-rata sampel Contoh 2: Berapa rata-rata hitung pada tabel frekuensi berikut: xi fi 70 5 69 6 45 3 80 1 56 1 Catatan: Tabel frekuensi pada tabel di atas merupakan tabel frekuensi untuk data tunggal, bukan tabel frekuensi dari data yang sudah dikelompokkan berdasarkan selang/kelas tertentu. Jawab: xi fi fixi 70 5 350 69 6 414 45 3 135 80 1 80 56 1 56 Jumlah 16 1035 b. Mean dari data distribusi Frekuensi atau dari gabungan: Distribusi Frekuensi: Rata-rata hitung dari data yang sudah disusun dalam bentuk tabel distribusi frekuensi dapat ditentukan dengan menggunakan formula yang sama dengan formula untuk menghitung nilai rata-rata dari data yang sudah dikelompokkan, yaitu: Keterangan: ∑ = lambang penjumlahan semua gugus data pengamatan fi = frekuensi data ke-i = nilai rata-rata sampel Contoh 3: Tabel berikut ini adalah nilai ujian statistik 80 mahasiswa yang sudah disusun dalam tabel frekuensi. Berbeda dengan contoh 2, pada contoh ke-3 ini, tabel distribusi frekuensi dibuat dari data yang sudah dikelompokkan berdasarkan selang/kelas tertentu (banyak kelas = 7 dan panjang kelas = 10). Nilai Ujian fi 1.31 - 40 2 2.41 - 50 3 3.51 - 60 5 4.61 - 70 13 5.71 - 80 24 6.81 - 90 21 7.91 - 100 12 Jumlah 80 Jawab: Buat daftar tabel berikut, tentukan nilai pewakilnya (xi) dan hitung fixi. Kelas ke- Nilai Ujian fi xi fixi 1 31 - 40 2 35.5 71.0 2 41 - 50 3 45.5 136.5 3 51 - 60 5 55.5 277.5 4 61 - 70 13 65.5 851.5 5 71 - 80 24 75.5 1812.0 6 81 - 90 21 85.5 1795.5 7 91 - 100 12 95.5 1146.0 Jumlah 80 6090.0 Catatan: Pendekatan perhitungan nilai rata-rata hitung dengan menggunakan distribusi frekuensi kurang akurat dibandingkan dengan cara perhitungan rata-rata hitung dengan menggunakan data aktualnya. Pendekatan ini seharusnya hanya digunakan apabila tidak memungkinkan untuk menghitung nilai rata-rata hitung dari sumber data aslinya. Rata-rata Gabungan atau rata-rata terboboti (Weighted Mean) Rata-rata gabungan (disebut juga grand mean, pooled mean, atau rata-rata umum) adalah cara yang tepat untuk menggabungkan rata-rata hitung dari beberapa sampel. Contoh 4: Tiga sub sampel masing-masing berukuran 10, 6, 8 dan rata-ratanya 145, 118, dan 162. Berapa rata-ratanya? Jawab: (2) Median Median dari n pengukuran atau pengamatan x1, x2 ,..., xn adalah nilai pengamatan yang terletak di tengah gugus data setelah data tersebut diurutkan. Apabila banyaknya pengamatan (n) ganjil, median terletak tepat ditengah gugus data, sedangkan bila n genap, median diperoleh dengan cara interpolasi yaitu rata-rata dari dua data yang berada di tengah gugus data. Dengan demikian, median membagi himpunan pengamatan menjadi dua bagian yang sama besar, 50% dari pengamatan terletak di bawah median dan 50% lagi terletak di atas median. Median sering dilambangkan dengan (dibaca "x-tilde") apabila sumber datanya berasal dari sampel (dibaca "μ-tilde") untuk median populasi. Median tidak dipengaruhi oleh nilai-nilai aktual dari pengamatan melainkan pada posisi mereka. Prosedur untuk menentukan nilai median, pertama urutkan data terlebih dahulu, kemudian ikuti salah satu prosedur berikut ini: • Banyak data ganjil → mediannya adalah nilai yang berada tepat di tengah gugus data • Banyak data genap → mediannya adalah rata-rata dari dua nilai data yang berada di tengah gugus data a. Median data tunggal: Untuk menentukan median dari data tunggal, terlebih dulu kita harus mengetahui letak/posisi median tersebut. Posisi median dapat ditentukan dengan menggunakan formula berikut: dimana n = banyaknya data pengamatan. Median apabila n ganjil: Contoh 5: Hitunglah median dari nilai ujian matematika kelas 3 SMU berikut ini: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9; 10 Jawab: • data: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9; 10 • setelah diurutkan: 2; 4; 5; 6; 6; 7; 7; 7; 8; 9; 10 • banyaknya data (n) = 11 • posisi Me = ½(11+1) = 6 • jadi Median = 7 (data yang terletak pada urutan ke-6) Nilai Ujian 2 4 5 6 6 7 7 7 8 9 10 Urutan data ke- 1 2 3 4 5 6 7 8 9 10 11 ↑ Median apabila n genap: Contoh 6: Hitunglah median dari nilai ujian matematika kelas 3 SMU berikut ini: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9 Jawab: • data: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9 • setelah diurutkan: 2; 4; 5; 6; 6; 7; 7; 7; 8; 9 • banyaknya data (n) = 10 • posisi Me = ½(10+1) = 5.5 • Data tengahnya: 6 dan 7 • jadi Median = ½ (6+7) = 6.5 (rata-rata dari 2 data yang terletak pada urutan ke-5 dan ke-6) Nilai Ujian 2 4 5 6 6 7 7 7 8 9 Urutan data ke- 1 2 3 4 5 6 7 8 9 10 ↑ b. Median dalam distribusi frekuensi: Formula untuk menentukan median dari tabel distribusi frekuensi adalah sebagai berikut: b = batas bawah kelas median dari kelas selang yang mengandung unsur atau memuat nilai median p = panjang kelas median n = ukuran sampel/banyak data f = frekuensi kelas median F = Jumlah semua frekuensi dengan tanda kelas lebih kecil dari kelas median (∑fi) Contoh 7: Tentukan nilai median dari tabel distribusi frekuensi pada Contoh 3 di atas! Jawab: Kelas ke- Nilai Ujian fi fkum 1 31 - 40 2 2 2 41 - 50 3 5 3 51 - 60 5 10 4 61 - 70 13 23 5 71 - 80 24 47 ←letak kelas median 6 81 - 90 21 68 7 91 - 100 12 80 8 Jumlah 80 • Letak kelas median: Setengah dari seluruh data = 40, terletak pada kelas ke-5 (nilai ujian 71-80) • b = 70.5, p = 10 • n = 80, f = 24 • f = 24 (frekuensi kelas median) • F = 2 + 3 + 5 + 13 = 23 (3) Mode Mode adalah data yang paling sering muncul/terjadi. Untuk menentukan modus, pertama susun data dalam urutan meningkat atau sebaliknya, kemudian hitung frekuensinya. Nilai yang frekuensinya paling besar (sering muncul) adalah modus. Modus digunakan baik untuk tipe data numerik atau pun data kategoris. Modus tidak dipengaruhi oleh nilai ekstrem. Beberapa kemungkinan tentang modus suatu gugus data: • Apabila pada sekumpulan data terdapat dua mode, maka gugus data tersebut dikatakan bimodal. • Apabila pada sekumpulan data terdapat lebih dari dua mode, maka gugus data tersebut dikatakan multimodal. • Apabila pada sekumpulan data tidak terdapat mode, maka gugus data tersebut dikatakan tidak mempunyai modus. Meskipun suatu gugus data mungkin saja tidak memiliki modus, namun pada suatu distribusi data kontinyu, modus dapat ditentukan secara analitis. • Untuk gugus data yang distribusinya simetris, nilai mean, median dan modus semuanya sama. • Untuk distribusi miring ke kiri (negatively skewed): mean < median < modus • untuk distribusi miring ke kanan (positively skewed): terjadi hal yang sebaliknya, yaitu mean > median > modus. Hubungan antara ketiga ukuran tendensi sentral untuk data yang tidak berdistribusi normal, namun hampir simetris dapat didekati dengan menggunakan rumus empiris berikut: Mean - Mode = 3 (Mean - Median) a. Modus Data Tunggal: Contoh 8: Berapa modus dari nilai ujian matematika kelas 3 SMU berikut ini: • 2, 4, 5, 6, 6, 7, 7, 7, 8, 9 • 2, 4, 6, 6, 6, 7, 7, 7, 8, 9 • 2, 4, 6, 6, 6, 7, 8, 8, 8, 9 • 2, 4, 5, 5, 6, 7, 7, 8, 8, 9 • 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 Jawab: • 2, 4, 5, 6, 6, 7, 7, 7, 8, 9→ Nilai yang sering muncul adalah angka 7 (frekuensi terbanyak = 3), sehingga Modus (M) = 7 • 2, 4, 6, 6, 6, 7, 7, 7, 8, 9 → Nilai yang sering muncul adalah angka 6 dan 7 (masing-masing muncul 3 kali), sehingga Modusnya ada dua, yaitu 6 dan 7. Gugus data tersebut dikatakan bimodal karena mempunyai dua modus. Karena ke-2 mode tersebut nilainya berurutan, mode sering dihitung dengan menghitung nilai rata-rata keduanya, ½ (6+7) = 6.5. • 2, 4, 6, 6, 6, 7, 8, 8, 8, 9 → Nilai yang sering muncul adalah angka 6 dan 8 (masing-masing muncul 3 kali), sehingga Modusnya ada dua, yaitu 6 dan 8. Gugus data tersebut dikatakan bimodal karena mempunyai dua modus. Nilai mode tunggal tidak dapat dihitung karena ke-2 mode tersebut tidak berurutan. • 2, 4, 5, 5, 6, 7, 7, 8, 8, 9 → Nilai yang sering muncul adalah angka 5, 6 dan 7 (masing-masing muncul 2 kali), sehingga Modusnya ada tiga, yaitu 5, 6 dan 7. Gugus data tersebut dikatakan multimodal karena modusnya lebih dari dua. • 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 → Pada gugus data tersebut, semua frekuensi data sama, masing-masing muncul satu kali, sehingga gugus data tersebut dikatakan tidak mempunyai modusnya b. Mode dalam Distribusi Frekuensi: dimana: Mo = modal = kelas yang memuat modus b = batas bawah kelas modal p = panjang kelas modal bmo = frekuensi dari kelas yang memuat modus (yang nilainya tertinggi) b1= bmo – bmo-1 = frekuensi kelas modal – frekuensi kelas sebelumnya b2 = bmo – bmo+1 = frekuensi kelas modal – frekuensi kelas sesudahnya Contoh 9: Tentukan nilai median dari tabel distribusi frekuensi pada Contoh 3 di atas! Jawab: Kelas ke- Nilai Ujian fi 1 31 - 40 2 2 41 - 50 3 3 51 - 60 5 4 61 - 70 13 → b1 = (24 – 13) = 11 5 71 - 80 24 ← kelas modal (frekuensinya paling besar) → b2 =(24 – 21) =3 6 81 - 90 21 7 91 - 100 12 8 Jumlah 80 • Kelas modul =kelas ke-5 • b = 71-0.5 = 70.5 • b1 = 24 -13 = 11 • b2 = 24 – 21 = 3 • p = 10 Selain tiga ukuran tendensi sentral di atas (mean, median, dan mode), terdapat ukuran tendensi sentral lainnya, yaitu rata-rata ukur (Geometric Mean) dan rata-rata harmonis (Harmonic Mean) (4) Rata-rata Ukur (Geometric Mean) Untuk gugus data positif x1, x2, …, xn, rata-rata geometrik adalah akar ke-n dari hasil perkalian unsur-unsur datanya. Secara matematis dapat dinyatakan dengan formula berikut: Dimana: U = rata-rata ukur (rata-rata geometrik) n = banyaknya sampel Π = Huruf kapital π (pi) yang menyatakan jumlah dari hasil kali unsur-unsur data. Rata-rata geometrik sering digunakan dalam bisnis dan ekonomi untuk menghitung rata-rata tingkat perubahan, rata-rata tingkat pertumbuhan, atau rasio rata-rata untuk data berurutan tetap atau hampir tetap atau untuk rata-rata kenaikan dalam bentuk persentase. a. Rata-rata ukur untuk data tunggal Contoh 10: Berapakah rata-rata ukur dari data 2, 4, 8? Jawab: atau: b. Distribusi Frekuensi: xi = tanda kelas (nilai tengah) fi = frekuensi yang sesuai dengan xi Contoh 11: Tentukan rata-rata ukur dari tabel distribusi frekuensi pada Contoh 3 di atas! Jawab Kelas ke- Nilai Ujian fi xi log xi fi.log xi 1 31 - 40 2 35.5 1.5502 3.1005 2 41 - 50 3 45.5 1.6580 4.9740 3 51 - 60 5 55.5 1.7443 8.7215 4 61 - 70 13 65.5 1.8162 23.6111 5 71 - 80 24 75.5 1.8779 45.0707 6 81 - 90 21 85.5 1.9320 40.5713 7 91 - 100 12 95.5 1.9800 23.7600 8 Jumlah 80 149.8091 (5) Rata-rata Harmonik (H) Rata-rata harmonik dari suatu kumpulan data x1, x2, …, xn adalah kebalikan dari nilai rata-rata hitung (aritmetik mean). Secara matematis dapat dinyatakan dengan formula berikut: Secara umum, rata-rata harmonic jarang digunakan. Rata-rata ini hanya digunakan untuk data yang bersifat khusus. Misalnya,rata-rata harmonik sering digunakan sebagai ukuran tendensi sentral untuk kumpulan data yang menunjukkan adanya laju perubahan, seperti kecepatan. a. Rata-rata harmonic untuk data tunggal Contoh 12: Si A bepergian pulang pergi. Waktu pergi ia mengendarai kendaraan dengan kecepatan 10 km/jam, sedangkan waktu kembalinya 20 km/jam. Berapakah rata-rata kecepatan pulang pergi? Jawab: Apabila kita menghitungnya dengan menggunakan rumus jarak dan kecepatan, tentu hasilnya 13.5 km/jam! Apabila kita gunakan perhitungan rata-rata hitung, hasilnya tidak tepat! Pada kasus ini, lebih tepat menggunakan rata-rata harmonik: b. Rata-rata Harmonik untuk Distribusi Frekuensi: Contoh 13: Berapa rata-rata Harmonik dari tabel distribusi frekuensi pada Contoh 3 di atas! Jawab: Kelas ke- Nilai Ujian fi xi fi/xi 1 31 - 40 2 35.5 0.0563 2 41 - 50 3 45.5 0.0659 3 51 - 60 5 55.5 0.0901 4 61 - 70 13 65.5 0.1985 5 71 - 80 24 75.5 0.3179 6 81 - 90 21 85.5 0.2456 7 91 - 100 12 95.5 0.1257 8 Jumlah 80 1.1000 Perbandingan Ketiga Rata-rata (Mean): Karakteristik penting untuk ukuran tendensi sentral yang baik Ukuran nilai pusat/tendensi sentral (average) merupakan nilai pewakil dari suatu distribusi data, sehingga harus memiliki sifat-sifat berikut: • Harus mempertimbangkan semua gugus data • Tidak boleh terpengaruh oleh nilai-nilai ekstrim. • Harus stabil dari sampel ke sampel. • Harus mampu digunakan untuk analisis statistik lebih lanjut. Dari beberapa ukuran nilai pusat, Mean hampir memenuhi semua persyaratan tersebut, kecuali syarat pada point kedua, rata-rata dipengaruhi oleh nilai ekstrem. Sebagai contoh, jika item adalah 2; 4; 5; 6; 6; 6; 7; 7; 8; 9 maka mean, median dan modus semua bernilai sama, yaitu 6. Jika nilai terakhir adalah 90 bukan 9, rata-rata akan menjadi 14.10, sedangkan median dan modus tidak berubah. Meskipun dalam hal ini median dan modus lebih baik, namun tidak memenuhi persyaratan lainnya. Oleh karena itu Mean merupakan ukuran nilai pusat yang terbaik dan sering digunakan dalam analisis statistik. Kapan kita menggunakan nilai tendensi sentral yang berbeda? Nilai ukuran pusat yang tepat untuk digunakan tergantung pada sifat data, sifat distribusi frekuensi dan tujuan. Jika data bersifat kualitatif, hanya modus yang dapat digunakan. Sebagai contoh, apabila kita tertarik untuk mengetahui jenis tanah yang khas di suatu lokasi, atau pola tanam di suatu daerah, kita hanya dapat menggunakan modus. Di sisi lain, jika data bersifat kuantitatif, kita dapat menggunakan salah satu dari ukuran nilai pusat tersebut, mean atau median atau modus. Meskipun pada jenis data kuantitatif kita dapat menggunakan ketiga ukuran tendensi sentral, namun kita harus mempertimbangkan sifat distribusi frekuensi dari gugus data tersebut. • Bila distribusi frekuensi data tidak normal (tidak simetris), median atau modusmerupakan ukuran pusat yang tepat. • Apabila terdapat nilai-nilai ekstrim, baik kecil atau besar, lebih tepat menggunakan median atau modus. • Apabila distribusi data normal (simetris), semua ukuran nilai pusat, baik mean, median, atau modus dapat digunakan. Namun, mean lebih sering digunakandibanding yang lainnya karena lebih memenuhi persyaratan untuk ukuran pusat yang baik. • Ketika kita berhadapan dengan laju, kecepatan dan harga lebih tepat menggunakan rata-rata harmonik. • Jika kita tertarik pada perubahan relatif, seperti dalam kasus pertumbuhan bakteri, pembelahan sel dan sebagainya, rata-rata geometrik adalah rata-rata yang paling tepat. ________________________________________ Referensi: • Mario Triola. 2004. Elementary Statistics. 9th Edition. Pearson Education. • Stephen Bernstein and Ruth Bernstein. 1999. Elements of Statistics I: Descriptive Statistics and Probability. The McGraw-Hill Companies, Inc