Tuesday, February 17, 2009

Variance dan standard deviation

Melanjutkan pembahasan sebelumnya mengenai ukuran penyebaran, artikel ini membahas mengenai variance dan standard deviation. Variance berhubungan erat dengan standard deviation, yaitu digunakan untuk mengukur dan mengetahui seberapa jauh bagaimana penyebaran data dalam distribusi data. Dengan kata lain digunakan untuk mengukur variabilitas data, dalam bahasa awam variance adalah untuk mengetahui tingkat keragaman dalam data. Semakin tinggi nilai variance berarti semakin bervariasi dan beragam suatu data. Untuk menghitung variance, harus diketahui terlebih dahulu mean-nya, kemudian menjumlahkan kuadrat selisih dari tiap-tiap data terhadap mean tersebut. Secara numeric, variance merupakan rata-rata dari kuadrat selisih data terhadap mean.

Standard deviation diperoleh dari akar dari variance dan digunakan untuk mengukur penyebaran data. Standard deviation dan mean (rata-rata) lebih sering digunakan untuk mengetahui pola sebaran data, seperti contoh pola sebaran normal. Dalam sebaran normal, 68% data berarti mean +/- 1 * standard deviation, dan 95% data berarti mean +/- 2 * standard deviation. Di sini standard deviation memiliki arti yang sama dengan standard error mean.

Standard deviation merupakan salah satu dari beberapa ukuran penyebaran dalam statistika. Untuk menghitung standard deviation dari populasi perlu diketahui terlebih dahulu variance dari populasi tersebut. Hal ini karena standard deviation adalah akar kuadrat dari variance. Tidak seperti variance yang tidak mudah digunakan mengetaui tingkat variabilitas, standard deviation digunakan dengan mudah untuk mengetahui penyebaran.

Misal ada data tinggi badan siswa (cm) dalam satu kelas seperti berikut ini:
151.65 152.46 152.63 152.91 154.22 155.83 156.06 156.14 156.44
156.67 157.14 157.60 157.74 158.07 158.82 158.98 159.94 161.34
161.67 161.79 162.68 162.71 164.83 165.58 165.65 167.70 168.07
168.45 169.01 179.68
Dari data tersebut diketahui bahwa mean-nya adalah 160.42 dan standar deviation adalah 6.24. Melalui mean dan standard deviation dapat diketahui bahwa terdapat beberapa data yang berada di luar “standard”, “standard” dapat diketahui dari mean +/- standard deviation, yaitu 154.18 dan 166.66.

Seperti yang telah diketahui bahwa variance dan standard deviation memiliki hubungan secara matematis, yaitu variance merupakan kuadrat dari standard deviation. Mengapa menggunakan kuadrat ? Pengkuadratan pada tiap-tiap selisih membuat nilai selisih tersebut menjadi positif (nilai negative dapat mengurangi nilai pada variance). Pengkuadratan ini juga menyebabkan nilai yang besar pada variance, contoh 100^2 = 10.000 lebih besar daripada 50^2=2.500. Oleh karena itu secara praktek yang paling mudah digunakan adalah standard deviation.

No comments: