D Ö R D Ü N C Ü B Ö L Ü M
Bir veri topluluğundaki varyantların birbirlerinden farklılığına varyasyon (değişim) denir. Frekans tablosu yaparken gördüğümüz değişim genişliği bir varyasyon ölçüsüdür. Ancak her varyantın değil de sadece en büyük ve en küçük varyantların değişime katkısını yansıttığı için iyi bir ölçü sayılmaz. Mesela aşağıdaki gibi iki veri topluluğu düşünelim:
1 2 3 4 5
1 1 3 5 5
Bu veri topluluklarının her ikisinin de ortalaması 3, her ikisinin de değişim genişliği 5 -1=4’tür. Ne var ki bunlarda varyasyonun aynı olduğunu söyleyemeyiz. Değişim genişliği aradaki varyantların varyasyona katkısını dikkate almamaktadır. Bunun için bütün varyantların ortalamadan farkını dikkate alan ölçüler geliştirilmiştir. Bunlardan birisi Ortalama Sapmadır:
Ortalama sapma iyi bir değişim ölçüsüdür. Ancak varyasyonu analiz etmede ortlamadan sapmaların mutlak değerleri değil de kareleri daha elverişli olduğu için ortalama sapma pek kullanılmamakta, yerine karelerden hesaplanan varyans tercih edilmektedir.
IV.1- Varyans
Varyans, bir veri topluluğunda ortalamadan sapmaların karelerinin ortalama olarak alması beklenen değeri gösterir. Varyansı bulmak için Kareler Toplamı hesaplanmalıdır. Kareler Toplamı varyantların ortalamadan farklarının karelerinin toplamıdır:
Bu formül tanım formülü olup, hesaplamada çoğu zaman elverişli değildir. Bunun yerine hesap formülü olarak,
veya,
Varyans, Kareler Toplamnının serbestlik derecesine bölümüdür. Burada serbestlik derecesi varyant sayısının (n) bir eksiği olup, hesaplanan istatistiğin sapmasız bir tahmin olmasını sağlamak için n küçültülmektedir. Bazı istatistiklerde n 2, hatta3 küçültülebilir; prensip olarak parametre yerine kullanılan her istatistik için 1 serbestlik derecesi düşülür.
Varyansın formülü,
Varyansın kareköküne, yani S’ye standart sapma denir.
Misal: IV.1– 67 işçinin maaşlarına ait frekans tablosundan varyansı hesaplayalım
xi fi bi fibi fib2i fixi fixi2
32.5 2 -5 -10 50 65.0 2 112.50
36.5 11 -4 -44 176 401.5 14 654.75
40.5 14 -3 -42 126 567.0 22 963.50
44.5 13 -2 -26 52 578.5 25 743.25
48.5 8 -1 -8 8 388.0 18 818.00
52.5 6 0 0 0 315.0 16 537.50
56.5 4 1 4 4 226.0 12 769.00
60.5 3 2 6 12 181.5 10 980.75
64.5 4 3 12 36 258.0 16 641.00
68.5 1 4 4 16 68.5 4 692.25
72.5 1 5 5 25____72.5 5 256.25
Toplam 67 -99 505 3121.5 151 168.75
Doğrudan sınıf değerlerinden varyansı hesaplasaydık,
IV.2- Varyansın Özellikleri
1.
k ve A sabitleri için:
2.
3.
4. iki değişkenin toplamı için
z = x+y ise,
x ve y birbirinden bağımsız ise o zaman, çarpımlar toplamı diye bilinen üçüncü terim sıfır olur.
IV.3- Varyasyon Katsayısı
Iki veri topluluğunun varyasyonlarını, verilerin büyüklüğünden doğan farklılığı standardize ederek mukayese edebilmek için Varyasyon Katsayısı (Coefficient of Variation) kullanılır:
Mesela bir A özelliğinin ortalaması 60, varyansı 16 olsa, başka bir B özelliğinin de ortalaması 240, varyansı 64 olsa
C.V.(A) = (4/60)x100 = %6.67
C.V.(B) = (8/240)x100 = %3.33
Görülüyor ki varyansı daha büyük olan B örneğinde ortalamaya nisbet ettiğimiz zaman varyasyon daha küçük çıkıyor.
V.4- ALIŞTIRMA SORULARI
1- Aşağıdaki X değerlerinin varyansı kaçtır? a) 2.0, b) 2.5, c)10, d) 5
X: 47 48 49 50 51
2- Birinci sorudaki X değerlerinden 45 çıkarılarak elde edilecek değerlerin varyansı kaçtır? a) 2.0, b)2.5, c) 47.5, d) 42.5
3- İkinci sorudaki X-45 şeklinde bulunan değerleri 2 ile çarparak elde edeceğiniz değerlerin varyansı kaçtır? a) 2.0, b) 2.5, c) 10, d) 5.0
4- Bir değişim ölçüsü olarak varyans ortalama sapmaya tercih edilir. Niçin?
a) Bütün varyantlar katkı sağladığı için
b) Varyasyonu meydana getiren sebeplere bölünebildiği için
c) Sapmasız bir tahmin olduğu için
d) En küçük olduğu için
5- Değişim Genişliği yeterli bir istatistik değildir. Niçin?
a) Bütün varyantlardan hesaplanmadığı için
b) En küçük olmadığı için,
c) Ortancadan sapmaların ortalaması oluğu için
d) Ortancadan sapmaların ortalaması olmadığı için
6- Aşağıdaki frekans tablosunda b değerlerine ait kareler toplamı kaçtır? (Not: sınıf değerlerinden çıkaracağınız A sabiti 45, sonucu böleceğiniz c değeri ise sınıf genişliğidir) a) 220, b) 218, c) 60, d) 1962
Sınıflar Xi fi
32-34 33 2
35-37 36 4
38-40 39 5
41-43 42 7
44-46 45 10
47-49 48 8
50-52 51 6
53-55 54 5
56-58 57 3
7- Altıncı sorudaki X değerlerine ait kareler toplamı kaçtır?
a) 220, b) 1962, c) 218, d) 1320
8- Altıncı sorudaki X değerlerinin varyansı, a) 218/9, 1962/8, c) 1962/49, d) 1962/9
9- Varyansın kareköküne ne denir? a) Değişim Genişliği, b) Standart sapma, c) Varyasyon Katsayısı, d) Ortalama Sapma
10- Varyasyon Katsayısı için aşağıdakilerden hangisi yanlıştır?
a) Büyüklükleri çok farklı rakam topluluklarındaki varyasyonu karşılaştırmak için kullanılır.
b) Standart sapmanın ortalamadaki yüzdesine varyasyon katsayısı denir.
c) Varyasyon Katsayısı %100’den büyük olamaz
d) Varyasyon Katsayısı %100’den büyük olabilir
20 ziyaretçi ve 0 üye çevrimiçi