ONUNCU BÖLÜM
KHİ-KARE İLE DAĞILIMA UYUM VE BAĞIMSIZLIK TESTLERİ
X.1- Giriş
Khi kare dağılımı, gama dağılımının özel bir halidir. Gama dağılımı, µ ve q parametreleri olan bir dağılım olup yoğunluk fonksiyonu:
Bazı kaynaklarda β=1/µ ve α=q parametreleri ile de gösterilir:
µ=1/2 ve q=n/2 olduğu zaman gamma dağılımına özel olarak khi-kare dağılımı denir:
(X.1)
Görüldüğü gibi khi-kare (χ2) dağılımının tek parametresi n olup serbestlik derecesi adını alır. Dağılımın n>2 için n-2’de bir tepe değeri vardır. χ2 dağılımının beklenen değeri n’e, varyansı da 2n’e eşittir (Kavuncu 1995).
χ2 dağılımına örnek n boyutlu bir poligonda hedefi vurmadaki hata, eğer eğer her boyuttaki hata normal dağılıyorsa, khi kare dağılımı gösterir (Ross 1976). Ya da n adet bağımsız standart normal tesadüf değişkeninin karelerinin toplamı, n serbestlik dereceli (s.d.’li) khi kare dağılımı gösterir:
(X.2)
Khi-kare dağılımı, örneğin frekans dağılımının teorik bir dağılıma uyumlu olduğu hipotezini test etmek için kullanılır. Hipoteze göre beklenen frekanslarla gerçek frekanslar arasındaki farkların tesadüften ileri gelme ihtimali, Eşitlik (X.2)’ye benzer şekilde hesaplanan khi-kare istatistiğinin kendi dağılımındaki oluş ihtimali olarak hesaplanır:
(X.3)
Burada fi i. sınıfın frekansı, fi' de hipoteze göre (frekans dağılımının uyumlu olduğu varsayılan dağılıma göre) beklenen frekansıdır.
X.2- Homojenlik Kontrolü
Misal: X.1- Bir bölgede Orman İşletmesi 50 hektarlık bir ormanı ıslah etmek maksadıyla orman içinde boş bir alana eşit sayıda çam, ladin, meşe ve çınar dikmiştir. 20 sene sonra ekilen fidanların olduğu alanda rastgele bir bölgede büyüyen ağaçlar aşağıdaki gibi sayılmıştır. Ağaçların dağılımı, dikildikleri zaman ki gibi homojen kalmış mıdır?
Çam Ladin Meşe Çınar
36 44 27 25
Toplam 132 ağaç bulunmaktadır. Ekimdeki gibi eşitlik bozulmadıysa o zaman her ağaçtan eşit sayıda yani 132/4= 33’er tane olması beklenirdi. Buna göre örneğimizin khi kare değeri
S.D.=4-1=3 ve α=0.05 için Khi-kare değeri 7.815 olduğundan hipotez kabul edilir. Yani başlangıçtaki gibi ağaçların eşit sayıda olduğu kabul edilir.
X.3- Binomiyal Dağılıma Uygunluk
Misal: X.2- Bir yörede erkek çocukların çoğunun 6 yaşına varmadan öldüğüne inanılmaktadır. Sağlık Bakanlığı duyumlar üzerine bölgeye bir inceleme ekibi göndermiştir. Ekibin bölgede yaptığı incelemede 248 adet dört çocuklu ailede erkek çocuk sayısı bakımından dağılım aşağıdaki gibi bulunmuştur: Ahalinin inanışı doğru mudur?
Erkek çocuk sayısı 0 1 2 3 4
Aile Sayısı f 15 64 88 52 21
Beklenen f ' 20 60 90 60 20
Doğum, ölüm, yaşama şansı bakımından kızlarla erkekler arasında fark yoksa erkek çocuk sayısı bakımından dağılımın erkek çocuk ihtimali ½ olan binomiyal dağılıma uygun olması beklenir. Dolayısıyla homojenlik kontrolüne benzer şekilde “dört çocuklu ailelerde erkek çocuk sayısının dağılımı, binomiyal dağılımına uygundur” hipotezine göre beklenen frekanslarla gerçek frekanslar arasındaki farkın tesadüften ileri gelme ihtimalini, khi kare dağılımından yararlanarak bulabiliriz:
S.D.=5-1=4 olan khi kare dağılımında en büyük %5’lik alanı ayıran değer 9.488 olup örneğimizin khi kare değeri bundan çok küçüktür; yani örnek frekanslarının beklenen frekanslardan farklarının tesadüften ileri gelme ihtimali 0.05’ten çok büyüktür. Dolayısıyla hipotez kabul edilir; sonuç bölge halkının inanışını desteklememektedir.
X.4- Bağımsızlık Kontrolü
Misal:X.3- Bir araba tamir servisinin müşterilere uyguladığı bir memnuniyet anketi sonuçlarının yaş gruplarına göre değişip değişmediğini anlamak üzere sonuçlar aşağıdaki gibi tablo haline getirilmiştir. Memnuniyet sonuçları yaş gruplarına göre değişmekte midir?
Yaş Grupları |
Memnun Değilim |
Memnun sayılmam |
Ortadayım |
Memnunum |
Çok memnunum |
Toplam |
30 altı |
25 27 |
27 26 |
35 30 |
36 38 |
42 44 |
165 |
30-45 |
23 26 |
25 26 |
28 29 |
40 37 |
45 43 |
161 |
45 üstü |
30 25 |
25 25 |
25 29 |
35 36 |
41 42 |
156 |
Toplam |
78 |
77 |
88 |
111 |
128 |
482 |
Memnuniyet bakımından dağılım, yaş gruplarından bağımsız ise, yani yaş gruplarına göre değişmiyorsa o zaman her yaş grubunda dağılımın aynı olması beklenir. Mesela çok memnunların oranı bütün denekler üzerinden 128/482 olup bu beklenene (hipoteze) göre üç yaş grubunda da “çok memnunum” diyenlerin oranı 128/482 olmalıdır. 30 yaş altındaki 165 kişinin 182/482’si (44 kişi), 30-45 yaş aralığındaki 161 kişinin de 128/482’si (43 kişi) çok memnunum demiş olsun beklenir. Hipotez doğruysa beklenen frekanslardan farklılık tesadüften ileri geliyordur. Tabloda sütunların sağ tarafındaki kırmızı yazılmış frekanslar hipoteze göre beklenen frekansları göstermektedir.
Böyle iki yanlı tablolardan hesaplanacak Khi-Kare değerinin serbestlik derecesi (r-1).(s-1) şeklinde hesaplanır. Bu tabloda S.D.= (3-1).(5-1)=8 olup Khi Kare öncekiler gibi hesaplanır:
Bu değerin 8 S.D.’li Khi-Kare dağılımındaki oluş ihtimali %5’ten çok büyüktür; çünkü %5’teki Khi-Kare değeri 15.507’dir. Hipotez kabul edilir. Buna göre memnuniyet bakımından dağılım yaş grubundan bağımsızdır.
Çalışma Soruları
X.1- Bir eleştirmen bir yazarın bir zenginlik olarak “için, dolayı, üzere, diye” edatlarını eşit sayıda kullandığını düşünmektedir. Bu maksatla yazarın çeşitli kitaplarından toplam 50 sayfada bu kelimeleri saymıştır:
Kelime için dolayı üzere diye
Frekans 37 42 33 48
Acaba bu kelimelerin frekansı eşit kabul edilebilir mi?
X.2- Bir lisede derslerde sunum yapmaya istekli öğrencilerin oranı 0,40 olarak bilinmektedir. Aynı okulda Türkçe öğretmenleri yeni gelen altı sınıftan tesadüfen seçilen 4 kişilik 200 grupta sunum yapmaya hevesli öğrenci sayısı bakımından dağılım aşağıdaki gibi bulunmuştur. Yeni öğretmenlerin sunum hevesi olan öğrenci oranını değiştirdiği söylenebilir mi?
0 1 2 3 4
47 79 53 15 6
X.3- Dört ayrı yöntemle üretilen ampullere ilişkin ankette memnuniyet dağılımı aşağıdaki gibi bulunmuştur. Acaba memnuniyet dağılımının yöntemden bağımsız olduğu söylenebilir mi?
Yöntem |
Memnun değil |
Az memnun |
Memnun |
Çok memnun |
A |
35 |
65 |
70 |
30 |
B |
50 |
62 |
52 |
36 |
C |
20 |
35 |
67 |
78 |
D |
38 |
64 |
56 |
42 |
28 ziyaretçi ve 0 üye çevrimiçi