DOKUZUNCU BÖLÜM
HİPOTEZ KONTROLÜ
IX.1- HİPOTEZ KONTROLÜNÜN GENEL ESASLARI VE SAFHALARI
İstatistik karar verme süreçlerinden ikincisi, önceki bölümde bahsedildiği üzere, parametre ile ilgili bir hipotezimiz, yani bir bilgimiz veya bir beklentimiz varsa bunun kontrolü şeklinde gerçekleşir. Örnekten hesapladığımız değere (istatistiğe) ait örnekleme dağılımı hipotez kontrolünün temelidir. Bunun için, kontrol edeceğimiz hipotez somut (yani parametreleri belli) bir örnekleme dağılımı tanımlamalıdır. Bunun anlamını şöyle açıklayabiliriz:
Genellikle, örneğimizin temsil ettiğini düşündüğümüz populasyonun parametre değeri ile ilgili olarak bir beklentimiz vardır. Yani, örneğimizin temsil ettiği populasyonun, elde mevcut bir populasyonun parametre değerinden daha farklı (veya daha büyük veya daha küçük) bir parametre değerine sahip olduğunu iddia ediyor olabiliriz. Bu durumda elde mevcut örnek değerinin bizim iddiamızı destekleyip desteklemediğini kontrol etmeye çalışırız. Örnek değerimizin iddiamızı destekleyip desteklemediğine, iddiamızla tanımlanan populasyondan çekilen örneklerin değerlerine ait örnekleme dağılımında bizim örnek değerimizin oluş ihtimaline göre karar verebiliriz. Ancak iddiamız veya beklentimiz, çoğu zaman, parametresi belli somut bir örnekleme dağılımı tanımlamaz. Bu durumda örnek değerimizin mevcut populasyondan çekilen örneklerden hesaplanan değerlerin örnekleme dağılımından rastgele bir değer olduğu hipotezini kontrol edebiliriz. Bu hipoteze kontrol hipotezi denir. Kontrol hipotezi yerine sıfır hipotezi tabirini de çeşitli kitaplarda görmek mümkündür. Bunun sebebi, kontrol hipoteziyle, örnek değerimizin hipotetik örnekleme dağılımının ortalamasından farkının tesadüfi olduğunu, yani sıfır kabul edilebileceğini söylüyor olmamızdır. Bu sebeple kontrol hipotezi h0 olarak gösterilir. Sonra da örnek değerimizin bu hipotetik dağılımdaki oluş ihtimaline göre bu hipotezi ret veya kabul ederiz. Oluş ihtimali, bizim örnek değerimizin hipotetik örnekleme dağılımından rastgele bir değer olması demektir ve örnekleme dağılımında bizim değerimiz kadar ve daha fazla sapanların nispi miktarı olarak hesaplanır. Bu sapmayı, probleme göre, dağılımın iki tarafında veya tek tarafında hesaplayabiliriz. Kontrol hipotezini reddedersek, kabul etmek durumunda olduğumuz hipoteze karşıt hipotez denir.
Karşıt hipotez H1 ile gösterilir. Burada büyük harf kullanmamızın sebebi karşıt hipotezle parametreye bir tek değer verilmemiş olmasıdır. Eğer karşıt hipotez de belirli bir tek parametre değeri olsaydı o zaman h1 olarak gösterilirdi. Belirli bir tek parametre değeri olan hipotezlere basit hipotez, “parametre, belirli bir değerden büyüktür” veya “belirli bir değere eşit değildir” gibi parametreye birçok değer veren hipotezlere bileşik hipotez denilir. Özet olarak basit hipotezleri h olarak, bileşik hipotezleri ise H olarak gösteriyoruz.
Hipotez Kontrolü bir süreçtir. Bu süreçte birinci basamak kontrol hipotezini ve karşıt hipotezi kurmaktır. Kontrol hipotezini reddetmek için örnek değerimizin hipotetik örnekleme dağılımında oluş ihtimalinin düşük olması gerekir. Örnek değerimiz hipotetik örnekleme dağılımının ortalamasına ne kadar yakınsa bu ihtimal o kadar yüksek. Ne kadar uzaksa o kadar düşüktür. Örnek değerimiz kadar ve daha fazla sapan değerlerin yüzdesi kaç olursa hipotezi reddetmeliyiz? Bu yüzdeyi yüksek tutarsak hipotezimizi doğru olduğu halde reddetmek gibi bir yanlışlık yapmış olabiliriz. O zaman bu yüzdeyi küçük tutalım dersek, bu defa da hipotezimiz yanlış olduğu halde, yani örneğimiz hipotetik populasyondan çekilmediği halde, çekilmiş kabul etme hatası yapabiliriz. Muhtemel durumlar aşağıdaki 2*2 tablosunda özetlenmiştir:
İstatistik Karar |
Gerçek Durum |
|
h0 doğru |
h0 yanlış |
|
h0 kabul |
Karar hatalı değil |
Karar hatalı (İkinci Tip Hata) |
h0ret |
Karar hatalı (Birinci Tip Hata) |
Karar hatalı değil |
Birinci tip hata yapma ihtimali α ile gösterilir. α’nın kaç olacağına daha araştırma başlarken karar verilir. Kontrol hipotezini doğruyken reddetme hatasını yapma ihtimali olarak bunun nasıl belirleneceğine ilişkin bir formül yoktur. Ancak hatanın vereceği zarara göre göze alabileceğimiz risk olarak bunu düşünebiliriz. Kontrol hipotezini reddetmek istemiyorsak o zaman birinci hata yapma ihtimalini düşük tutarız. Bu durumlarda α 0.01 olarak belirlenir. Kontrol hipotezini reddetmeyi kolaylaştırmak istiyorsak α büyük tutulur; 0.05 veya nadir olarak 0.10 alındığı durumlar vardır. Eğer α ile ilgili bir karar veya bir bilgi verilmemişse o zaman α 0.05 olacak demektir.
İkinci tip hata ihtimali de β ile gösterilir. Birinci tip hata meselâ 0.01 alındığı zaman, bizim örneğimizin hipotetik populasyondan çekilme ihtimali meselâ 0.02 ise biz hipotezi kabul edeceğiz demektir. Ama hipotez gerçekte yanlış olabilir, biz ise doğru olma ihtimali sadece yüzde iki olduğu için, yani yüzde birden daha büyük olduğu için hipotezi kabul etmiş oluyoruz. Bu hatayı yapma ihtimalini hesaplayabilmemiz için karşıt hipotezin de kontrol hipotezi gibi basit bir hipotez olması gerekir. 1- β, yani kontrol hipotezi gerçekte yanlışken onu reddetme ihtimali testin gücü olarak bilinir.
Bu bölümde ortalamaya, istenen olayın yüzde oranına, korelasyon katsayısına ve iki örnek ortalamasının farkına ilişkin hipotez kontrollerini göreceğiz. Bunlara ait örnekleme dağılımları VII. Bölümde verilmiş olduğundan burada sadece misaller verilecektir. Bunun dışında varyans, regresyon katsayısı, iki olayın yüzde oranları arasında fark gibi parametre değerlerini ilişkin hipotezleri de test etmek mümkündür, ama lisans dersi seviyesinde bunlara gerek görülmemiştir. Merak edenler Düzgüneş ve ark (1987), Kavuncu ve Düzgüneş (1978) ve Kocabaş ve ark (2012) gibi ders kitaplarından yararlanabilirler.
Örneğimizin çekildiği varsayılan hipotetik populasyonun varyansı biliniyorsa, kontrol hipoteziyle tanımlanan örnekleme dağılımı aşağıdaki bahislerde görüleceği gibi, standart normal dağılıma (z dağılımına) çevrilerek test yapılır. Eğer populasyon varyansı bilinmiyorsa o zaman hipotetik örnekleme dağılımını t dağılımı denilen başka bir dağılıma çevirerek testi yaparız. T dağılımı da z dağılımı gibi ortalaması sıfır olan bir dağılımdır. Anca t, serbestlik derecesine bağlı bir dağılım olup, varyansı birden büyüktür. Serbestlik derecesi büyüdükçe t’nin varyansı 1’e doğru küçülür. Sonsuz serbestlik derecesinde t dağılımı, standart normal dağılıma, yani z dağılımına dönüşür.
Burada yapacağımız hipotez kontrolleri ister z ile ister t ile, üç adımlık bir işlem olarak tanımlanabilir:
Birinci adımda α belirlenir ve h0 ile H1 kurulur. Hipotetik (h0 ile tanımlanan) örnekleme dağılımı bir normal dağılım olarak (çizimle de) tasvir edilir.
İkinci adımda örnek değerimizin hipotetik örnekleme dağılımındaki oluş ihtimalinin α’dan büyük olup olmadığına karar vermeyi sağlayacak hesaplamalar yapılır. Örnek değeri hesaplanır, z (veya t) dağılımında bu örnek değerine karşılık gele değer hesaplanır. Gerekli tablodan α alanını ayıran z (veya t) değeri bulunur.
Üçüncü adımda h0 ile ilgili karar verilir. Bizim örnek değerimizin z (veya t) değeri α için tablodan bulunan değerden büyükse, bizim örnek değerimizin hipotetik örnekleme dağılımındaki oluş ihtimali α’dan küçük demektir, h0 reddedilir. Örneğimizin test değeri tablo değerinden küçükse h0 kabul edilir.
Not: Bir değerin bir dağılımdaki oluş ihtimali derken, o dağılımda o değer kadar ve daha fazla sapanların yüzde miktarını anlıyoruz. Karşıt hipotez, “bizim örneğimizin ait olduğu populasyon ortalaması hipotetik populasyon ortalamasından daha büyük” veya “daha küçük” şeklindeyse sapmayı tek tarafta hesaplarız. Şayet karşıt hipotez “örneğimizin ait olduğu populasyon değeri hipotetik populasyon değerine eşit değil” şeklindeyse sapmayı, α/2 küçük tarafta α/2 büyük tarafta olacak şekilde iki tarafta ararız. Şekil IX.1 bu konuda bir fikir verecektir.
IX.2- Ortalamaya İlişkin Hipotez Kontrolleri
Misal: IX.1- Önceki bölümde ortalaması 1.3 ± 0.026 kg olarak verilen 30 bebeğin, başka bir mama ile beslenen bebeklerin ortalaması 1,25 ve standart sapması 0.18 olan bir populasyonundan daha iyi bir populasyonu temsil ettiği söylenebilir mi?
Adım adım giderek çözelim:
Birinci adım: α=0.05 olsun. Hipotezler
h0: Örneğimizin temsil ettiği populasyonun ortalaması 1.25’tir. Yani µ=1.25
H1: Örneğimizin temsil ettiği populasyonun ortalaması 1.25’ten büyüktür. Yani µ>1.25.
İkinci adımda z değerini hesaplarız. Çünkü populasyonun standart sapması verilmiştir:
α=0.05 olduğuna göre 0 ile arasında bütün z’lerin 0.4500’ü olan z değeri 1.645 olarak bulunur.
Üçüncü adımda bizim örneğimizin z değeri ret bölgesini belirleyen 1.645’ten küçük olduğuna göre hipotez kabul edilir. Çünkü örneğimizin hipotetik populasyondan çekilmiş olma ihtimali 0.05’ten büyüktür.
Misal: IX.2- Yeni bir portakal çeşidinden elde edilen meyve sularında C vitamininin ortalaması 6.5 olan mevcut üretimden farklı olup olmadığı merak edilmektedir. Yeni çeşitten elde edilen 20 meyve suyunda C vitamini konsantrasyonu 5.8±0.25 bulunmuştur. Buna göre yeni çeşidin farklı C vitamini konsantrasyonuna sahip olduğunu söyleyebilir misiniz?
Bu problemin öncekinden iki farkı vardır. Birinci fark karşıt hipotezdedir. Burada karşıt hipotez µ≠6.5 şeklinde olmalıdır. Çünkü örnek elde edilmeden önce sonucun ne olacağı bilinmemektedir ve büyük mü küçük mü olduğu değil, farklı olup olmadığı merak edilmektedir. Bu yüzden α’nın yarısı büyük tarafta, yarısı da küçük tarafta değerlendirilmelidir. Buna göre α=0.05 ise, populasyon varyansını biliyor olsak, z dağılımını kullanır ve “büyük tarafta 0.025’luk alanı ayıran z değeri 1.96’dır” deriz.
Ancak populasyon varyansını bilmediğimiz için örnekleme dağılımının standart sapması yerine bunun örnekten tahmini olan ortalamanın standart hatasını kullanacağız. Bu da problemin öncekinden ikinci farkıdır; z dağılımı değil 19 serbestlik dereceli t dağılımına bakacağız. 19 serbestlik dereceli t dağılımında iki tarafta 0.05’lik alanı, tek tatafta 0.025’luk alanı ayıran değer 2.093’tür.
Örneğimizin t değeri
Buna göre h0 reddedilir. Çünkü örneğimizin t değeri ortalamaya 0.05’teki t değerinden daha uzaktadır. Yeni çeşidin C vitamini konsantrasyonu mevcuttan farklıdır.
IX.3- İstenenin Yüzde Oranına İlişkin Hipotez Kontrolleri
Misal: IX.3-Bir yörede su kirliliğinin erkek çocukların 6 yaşından sonra yaşama şansını azalttığı düşünülmektedir. Sağlık bakanlığının bölgeye gönderdiği bir araştırma ekibi rastgele seçtiği 130 ailede 6 yaşından küçük toplam 425 çocuktan 185 tanesinin erkek olduğu saptanmıştır. Acaba erkek çocuk oranı gerçekten %50’den önemli derecede az mıdır?
1. α=0.05
h0: p=0.50
H1:p<0.50
2.
Tablodan α=0.05 için z değeri 1.645 olarak bulunur.
3. Örneğimizin z değeri 0.05’lik alanı ayıran -1.645 değerine göre ortalamaya daha uzaktır. Yani örneğimizin p=0.50 olan bir populasyondan çekilmiş olma ihtimali α=%5’ten daha küçüktür. Dolayısıyla h0 kabul edilir. Örneğimizdeki erkek çocuk oranı olan 185/425’in 0.5’ten farkı tesadüfa atfedilemeyecek kadar fazladır.
Misal: IX.4- Vidaların 0.15’i bozuk olan bir üretim tarzında değişiklik yapılması düşünülmektedir. Yeni tarzın bozuk oranını değiştireceğine inanmayan sanayici, yeni tarz ile 500 vida imal etmiş ve bozukların sayısını 82 olduğunu bulmuştur. Acaba yeni tarz bozuk vida oranını değiştirmiş midir? Birinci tip hata ihtimalini 0.01 olarak alınız.
1. α=0.01
h0: p=0.15
H1: p≠0.15
2.
Tablodan 0.01 için z değeri P(0<Z<2.575)=0.4950 bulunur. Bizim örneğimizin z değeri 0.01 için bulunan Z0.005=2.575 değerinden çok küçüktür; ortalamaya çok daha yakındır. O halde istenenlerin oranı 82/500 olan örneğimizin p=0.15 olan bir populasyondan çekilmiş olma ihtimali 0.01’den çok büyüktür; h0 kabul edilir. Yani yeni tarz bozuk vida oranını değiştirmemiştir.
Orana ait hipotez kontrolünde, n çok küçük değilse z dağılımı kullanılır. Çünkü oranlara ait hipotetik örnekleme dağılımının standart sapması bellidir. Normal dağılım şartının p<1/2 ise n.p>10 olduğunu görmüştük.
IX.4- İki Bağımsız Örneğin Ortalaması Arasındaki Farka ilişkin Hipotez Kontrolü
Örnekleme dağılımlarını ele aldığımız yedinci bölümde, aynı populasyondan çekilen iki örneğin ortalaması arasındaki farkın, ortalaması sıfır, varyansının da populasyon varyansının (1/n1)+(1/n2) ile çarpımına eşit olduğu belirtilmişti. Bu bahiste iki örnek ortalaması arasındaki farkın, aynı populasyondan çekilmiş iki örneğin ortalaması arasındaki fark kadar olduğu olmadığı, istatistik olarak önemli olmadığı hipotezinin nasıl kontrol edildiği görülecektir. İki örneğin bağımsız olduğu varsayılacaktır. Bağımsız olmayan örnekler için eş yapma deney tertibi ayrıca ele alınacaktır.
Misal: IX.5- Antifrizin yakıt tüketimini etkilemediği düşünülmekte ancak bir üretici firma kendi ürettiği antifrizin yakıt tüketiminde bir azalma meydana getirdiğini iddia etmektedir. Bu firmanın A antifriziyle 12 arabada, başka bir firmanın B antifriziyle 15 arabada yapılan denemede aşağıdaki sonuçlar (lt/100km) bulunmuştur. Üretici firma haklı mıdır?
1. Adım: α=0.05 olsun.
h0: μD=0
H1: μD>0
2. Adım
A antifrizi B antifrizi A antifrizine ait kareler toplamı: 352.88-352.083=0.797
5,8 5,8 B antifrizine ait kareler toplamı: 500.19-498.817=1.373
5,6 5,9 Buradan A’nın ortalaması 5.417±0.078
4,9 5,7 B’nin ortalaması 5.767±0.081 bulunur.
5,2 5,4 İki ortalama arasındaki fark 0.350 için standart hata:
5,3 5,4 Karekök[(0.797+1.373)*27/((11+14)*180)]= 0.114
5,4 5,6
5,0 6,7 Gerekli olan t değeri 0.353/0.113=3.1 bulunur. Bu 25
5,6 5,8 serbestlik dereceli t dağılımında ortalamaya α=0.05’teki
5,5 5,7 1.708 değerinden daha uzaktır.
5,6 5,8
5,6 5,9 3. Adım h0 reddedilir. Üretici firma haklıdır.
5,5 5,6
6,0
5,5
5,7
Misal: IX.6- A firmasının ürettiği kışlık lastiklerle B firmasının ürettiği kışlık lastiklerin ömrünü karşılaştırmak üzere her iki lastikten rastgele 9’ar tanesinde ömür (10000 km) ortalaması, A için 31.11±0.63, B için 29.11±0.68 bulunmuştur. İki firmanın ürettiği lastiklerin ortalamaları arasında istatistik olarak önemli, bir fark var mıdır?
1. Adım α=0.05
h0: µA- µB = 0
H1: µA- µB ≠0
2. Adım n’ler eşit olduğu için farkın standart hatasını SD = sqrt[(0.63)2+(o.68)2]=0.93 bulunur. Buradan örneğimizin t değeri
bulunur. S.D.=9-1+9-1=16’li t dağılımında tablodan α=0.05 için t0.05=2.12 bulunur.
3. Adım Örneğimizin t değeri ortalamaya bundan birazcık daha uzak olduğundan h0 reddedilir. Firmaların ürettikleri lastiklerin ömrü arasındaki fark istatistik olarak önemlidir.
IX.5- Korelasyon Katsayısına İlişkin Hipotez Kontrolü
Misal: IX.7-66 arabada egzoz gazındaki CO2 oranı ile yakıt tüketimi (lt/100km) arasında korelasyon katsayısı 0.6 bulunmuştur. Acaba CO2 oranıyla yakıt tüketimi arasındaki ilişki önemli midir?
1. α=0.01; h0: ρ=0; H1: ρ≠0
2. Gerekli hesaplamalar:
3. Karar:
64 S.D’li t dağılımında 0.05’teki t değeri yaklaşık 2.65 olup, örneğimizin t değeri ortalamaya bundan çok daha uzaktır. İlişki önemlidir.
Misal: IX.8- 25 kişilik bir öğrenci grubunda derse devamsızlık süreleri ile final notları arasında doğrusal ilişki derecesi -0.55 bulunmuştur. İki özellik arasında azalan yönde bir doğrusal ilişkinin varlığından söz edilebilir mi?
1. α=0.01; h0: ρ=0; H1: ρ<0
2. Gerekli hesaplamalar:
3. Karar:
23 sd’li t dağılımında 0.01’deki t değeri -2.069 olup, örneğimizin t değeri ortalamaya bundan daha uzaktır; h0 red; azalanbir doğrusal ilişkinin varlığına hükmedilir.
IX.6- Bağımlı İki Örneğin Ortalamaları Arasındaki Farka İlişkin Hipotez Kontrolü (Eş Yapma)
İki grup bağımsız değilse ortalamaları arasındaki farkın varyansı aralarındaki ilişkiden etkilenir. Bu yüzden burada bağımsız iki grubu karşılaştırırken kullandığımız hesaplamalardan biraz farklı bir yol izlenir. Aşağıdaki örnekte durum daha iyi anlaşılacaktır.
Misal: IX.9- 9 öğrencinin zor bir sınavdan önce ve sonra kandaki adrenalin miktarları ölçülmüştür. Sınavdan sonra kandaki adrenalin miktarının azaldığı söylenebilir mi?
Sınavdan Önce : 40 45 48 50 53 51 54 50 52
Sınavdan Sonra: 35 41 44 51 50 49 53 50 50
1. Birinci Tip hata İhtimali: 0.05
H0: µD=0; H1: µD<0
2. Gerekli Hesaplamalar:
Toplam
Farklar(D) 5 4 4 -1 3 2 1 0 2 20
D2 25 16 16 1 9 4 1 0 4 76
D’lerin varyansı (76-202/9)/8=3,945
D’lerin ortalaması: 20/9= 2,22±0.66
D ortalamanın standart hatası: (3,945/9)-1=0.66
T=2.22/0.66=3,353
3. Karar: 9-1=8 sd’li t dağılımında 0.05’teki t değeri 1.86 olup bizim örneğimizin t değeri bundan daha uzaktadır. Dolayısıyla hipotez reddedilir. Adrenalin miktarındaki azalma istatistik olarak önemlidir; azaldığı söylenebilir.
Çalışma Problemleri
IX. 1. A örneğinin ortalaması ile B örneğinin ortalaması arasındaki farkın h0: µD=0 sıfır hipotezi ile tanımlanan bir örnekleme dağılımına dâhil olma ihtimalinin α=0.05’ten küçük olduğu bulunmuştur. Buna göre aşağıdaki ifadelerden hangisi yanlıştır:
a. H0 reddedilir; fark istatistik olarak önemlidir.
b. Birinci tip hata yapma ihtimali 0.05’ten küçük olduğu için h0 kabul edilir.
c. Farkın ortalaması sıfır olan örnekleme dağılımına dâhil olma ihtimali 0.05’ten küçük olduğu için farkın tesadüften ileri geldiği söylenemez.
d. Gerçekte doğru olan kontrol hipotezini reddetme hatasını yapma ihtimali 0.05’ten küçük olduğu için farkın tesadüfi olduğu hipotezini reddetmeyi göze alırız.
IX.2. Aşağıdaki deyimleri açıklayınız: Birinci Tip Hata, Kontrol Hipotezi, İkinci Tip Hata, Testin Gücü, Karşıt Hipotez, Çift Taraflı Hipotez Kontrolü.
IX.3. 38 ünitelik bir örnekte korelasyon katsayısı 0.7 bulunmuştur. Bu örneğin çekildiği populasyonda iki özellik arasında önemli bir ilişki olduğu söylenebilir mi? (α=0.05, çift taraflı kontrol yapınız).
IX.4. Bir içme suyunun şişe ambalajından memnun olmayanların oranı 0,35 olarak bulunmuştur. Ambalajı yenileyen şirket 380 kişilik bir örnekte memnuniyet anketi yapmış ve memnun olmayanların sayısını 114 bulmuştur. Yeni ambalaj memnuniyet oranını artırmış mıdır? (α=0.01 alınız)
IX.5. Bir antifriz belirli bir lastik modelinde ve belirli marka bir arabada benzin deposuna konduğu zaman ortalama yakıt tüketimi ortalaması 6,2 litre/100 km ve varyansı 1.44 olan bir normal dağılım göstermektedir. Başka bir antifrizin aynı model lastik ve aynı marka arabada yakıt tüketimini değiştirdiği iddia edilmektedir. İddiayı test etmek üzere antifriz 144 arabada denenmiş ve yakıt tüketimi 6.04 litre/100 km bulunmuştur. 144 arabalık örneğin ortalaması önceki antifrizden farklı bir populasyonu temsil ettiğini söyleyebilir misiniz?
28 ziyaretçi ve 0 üye çevrimiçi