ÌKÌNCÌ BÖLÜM
VERİLERİN ÖZETLENMESİ
VE SUNULMASI
Verileri topladığımız üniteler topluluğuna Örnek, örneklerin ait olduğu daha büyük üniteler topluluğuna Populasyon denildiğini geçen derste görmüştük. İşte bu örnekten hesaplanan değerlerden, yani İstatistiklerden yararlanarak bunların karşılığı olan populasyon değerleri, yani Parametreler hakkında bazı bilgiler çıkarmaya, genellemeler yapmaya çalışır. Bu genellemeleri yapabilmek için örneğimizi oluşturan verileri toplandığı halde bırakmayıp onları bir şekilde tanımlamak, tanıtmak isteriz.
Verileri tanımlama ve tanıtma işine geçmeden önce daima hatırlamamız gereken bir şeyi ifade etmek gerekir: Elimizdeki örnek ait olduğu populasyondan çekilebilecek öreklerden sadece birisidir. Populasyondan çekilebilecek bizim örneğimiz gibi örnekler, olasılık bahislerinde gördüğünüz örnek uzayıdır. Örnek uzayında bizim örneğimiz gibi örneklerin sayısı sonsuz sayılacak kadar çoktur. Meselâ 15 ünitelik bir populasyondan bir tesadüf örneği çekilecek olsa, örnek uzayını oluşturacak olan mümkün olan örneklerin sayısı 15 elemandan 5’iyle yapılacak kombinasyonların sayısına eşittir: 3003. Bu sayıdan hareketle, hakkında bilgi edinmek istediğimiz populasyonların 15’ten çok daha geniş olduğunu düşünerek örnek uzayındaki mümkün olan örnek sayısının ne kadar çok olacağını tasavvur edebilirsiniz. Elimizdeki gerçek örnek, işte bu örnek uzayındaki mümkün olan sonsuz sayıdaki örnekten sadece bir tanesidir.
Verilerin toplanıp kaydedilmesinden sonra sunulacak hale getirilmesi gerekir. Verilerin dağılımı hakkında bilgi edinmek, belirli bir değerden daha büyük değerlerin frekansını (sayısını), belirli iki değer arasındaki varyantların (değerlerin) frekansını vs bilmek için, verilerin özetlenmiş bir şekilde sunulması araştırıcıya kolaylık sağlar.
Misal: II.1- Bir bölgedeki 67 fabrikada çalışan işçilerin ortalama aylıkları (*100TL) aşağıdaki gibi kaydedilmiş olsun:
44 41 41 38 39 38 45 39 38 41 40 40 37 71
40 56 37 50 53 34 43 66 50 43 53 39 45 44
49 36 35 59 33 46 49 37 47 40 49 42 60 63
35 64 58 46 60 55 46 37 52 42 50 44 54 57
48 53 42 42 43 38 40 50 45 51 45
Bu veriler, kaydedildikleri bu haliyle bir anlam ifade etmezler. Bunlardan bazı sonuçlar çıkarmak isteyen okuyucu, zahmetli bir iş yapmak zorundadır. Meselâ bu rakamların ortanca değerini (varyantların yarısı kendinden büyük, yarısı da küçük olan değer) hesaplamak isteyen birisi rakamları küçükten büyüğe sıralayıp 34. sıradaki varyantı bulmak zorundadır. Veya beş bin liradan daha fazla ortalama aylık veren işletmelerin sayısını bulmak isteyen birisi, bu 67 rakamın içinde 50'den büyük olanları tek tek saymak zorundadır. Oysa bu veriler tablo veya grafik halinde özetlenerek sunulmuş olsa, bu gibi bilgiler çok daha kolay elde edilir ve verilerin frekans dağılımı (istatistik önemini daha sonra göreceğiz) hakkında bir bakışta fikir sahibi olunur.Sevinçle ifade etmek gerekir ki bütün bu zor işleri şimdi bilgisayarda göz açıp kapayıncaya kadar yapabilen istatistik paket programlar vardır.
Ìstatistik veriler, frekans dağılım tabloları ve/veya bunlardan yapılan grafikler halinde özetlenir ve sunulur.
II.1- Frekans Dağılım Tabloları
Frekans Dağılım Tabloları veya kısaca frekans tabloları, verileri, sınıflara ayırıp sonra her sınıfın frekansını, yani o sınıfta kaç tane veri olduğunu belirleyerek yapılan tablolardır. Anlaşılacağı gibi her sınıftaki veri sayısına o sınıfın frekansı denir. Sınıflar eşit aralıklarla yapılacağı gibi, eşit olmayan aralıklarla da yapılabilir. Bu kitapta eşit aralıklı frekans tabloları ele alınacaktır.
Frekans tabloları hazırlanırken en önemli iş sınıfları belirlemektir. Bunun için önce sınıf sayısı kararlaştırılmalıdır. Veriler genellikle 8-10 sınıflı frekans tabloları halinde özetlenir. Misalimizde 10 sınıf yapalım.
Ìkinci iş, sınıf genişliklerini belirlemektir. Bunun için değişim genişliği sınıf sayısına bölünür. En büyük varyantla en küçük varyant arasındaki farka değişim genişliği denir. Bulunan değer, veriler hangi duyarlıkla kaydedimişse o duyarlığa göre uygun bir değere yuvarlanır. Yukarıdaki misalde değişim genişliği 71-33=38; 10 sınıf yapmak istediğimize göre sınıf genişliği 38/10=3.8. Veriler 1 duyarlıkla (aslında 100) kaydedildiğine göre sınıf genişliğini 4 olarak alabiliriz.
Üçüncüiş, sınıfların alt ve üst sınırlarını belirlemektir. Verilerin hangi duyarlıkla kaydedildiği burada daha önemlidir. En küçük varyanttan daha küçük bir değer, en küçük sınıfın alt sınırı olarak alınır. Misalde en küçük değer 33 olduğuna göre, en küçük sınıfın alt sınırı 31 olabilir. En küçük sınıfın alt sınırını 30 da, 32 de, hatta 33 de alabilirdik.
Sınıf genişliği 4 olduğuna göre ikinci sınıfın alt sınırı 61+4=65 olacaktır. Veriler 1 duyarlıklı kaydedildiği için, birinci sınıfın üst sınırı, 65-1=64 olarak belirlenir. Sınıfları oluştururken alt ve üst sınırları öyle belirleriz ki, iki sınıf arasında boşluk kalmasın, yani bazı varyantlar ne o sınıfa ne de bu sınıfa düşmeyip iki sınıfın arasında kalmasın; yine sınıflar birbirine girmesin, yani bazı varyantlar hem o sın╅fa hem de bu sınıfa düşmesin. Sınıflar şimdi aşağıdaki gibi yapılmış olmaktadır:
Tablo: II.1- 67 Fabrikada Ortalama İşçi Aylıklarına Ait Frekans tablosu
Sınıflar S.D. Frekans
(Xi) Ìşaretle Rakamla(fi)
--------- ---- --------------- -------
31 - 34 32.5 ıı 2
35 - 38 36.5 ııııı ııııı ı 11
39 - 42 40.5 ııııı ııııı ıııı 14
43 - 46 44.5 ııııı ııııı ııı 13
47 - 50 48.5 ııııı ııı 8
51 - 54 52.5 ııııı ı 6
55 - 58 56.5 ıııı 4
59 - 62 60.5 ııı 3
63 - 66 64.5 ıııı 4
67 - 70 68.5 ı 1
71 - 74 72.5 ı 1
---------- ----- ------------------------
Toplam 67
Ìkinci sütun, sınıf değeri ifadesinin kısaltması ile S.D. olarak gösterilmiş olup, ilgili sınıfı temsil eden tipik değer olmak üzere alt ve üst sınırın ortalaması, yani toplamının yarısı olarak hesaplanmıştır.
Dördüncü iş, her sınıfın frekansını, yani o sınıftaki varyantların sayısını bulmaktır. Bunun için, eldeki rakamlar sıra ile hangi sınıfa düşüyorsa o sınıfın karşısında bir işaret koymak suretiyle, önce işaretle, sonra rakamla yazılır. Misalde, kaydedilmiş ilk varyant 44 olup, dördüncü sınıfa, 43-46 sınıfına düşmektedir. O halde bu sınıfın karşısına, frekans sütununa bir çizgi çekilir. Ìkinci değer 41 olup, üçüncü sınıfa 39-42 arasına düşmektedir; bu sınıfın karşısına frekans sütununa bir çizgi çekilir.
Dikkat edilirse frekans tablosunda 11 sınıf vardır. Bu en küçük sınıfın alt sınırını 31'e çekmemizden kaynaklanmış olabileceği gibi, sınıf genişliğini belirlerken yaptığımız yuvarlamalardan dolayı da sınıf sayısı baştan karar verdiğimiz sayıdan az ya da çok olabilir.
Misal: II.2- İstanbul Borsasında araştırma yapan bir ekonomist, rastgele 60 şirketin hisse başına aylık ortalama kazancını (TL) aşağıdaki gibi belirlemiştir. Frekans tablosunu yapınız.
7.80 10.08 8.39 9.83 7.25 6.04
8.50 8.15 7.94 8.33 6.42 5.94
7.80 6.45 7.54 8.91 7.04 6.58
8.02 6.97 7.41 7.16 8.03 7.55
6.92 7.24 5.90 9.03 7.78 8.75
7.62 7.44 7.54 6.51 7.34 7.10
6.12 9.84 7.69 7.47 8.96 7.91
8.75 6.45 7.23 8.03 7.64 8.36
7.78 8.29 8.55 8.07 7.21 7.64
6.48 8.90 8.25 8.14 6.99 7.21
1. sınıf sayısı 8 olsun.
2. sınıf genişliği= (10.08-5.90)/8= 0.525. Rakamlar .01 duyarlıklı olduğuna göre, kolay bir genişlik: 0.50.
3. en küçük varyant 5.9, en küçük sınıfın alt sınırı 5.85 olabilir. Buna göre sınıflar:
Tablo: II.2- İstanbul Borsasında 60 şirketin hisselerinin aylık ortalama kazancı (Hisse başına)
Sınıflar S.D. Frekans
(Xi) Ìşaretle Rakamla(fi)
----------- ------ ------------------------------
5.85 - 6.34 6.095 ıııı 4
6.35 - 6.84 6.595 ııııı ı 6
6.85 - 7.34 7.095 ııııı ııııı ıı 12
7.35 - 7.84 7.595 ııııı ııııı ıııı 14
7.85 - 8.34 8.095 ııııı ıııı ı 11
8.35 - 8.84 8.595 ııııı ı 6
8.85 - 9.34 9.095 ıııı 4
9.35 - 9.84 9.595 ıı 2
9.85 -10.34 10.095 ı 1
4. Frekanslar, her varyant için ait olduğu sınıfın karşısına bir işaret çekilerek belirlenir. İlk varyant 7.80 olduğuna göre 7.35-7.84 sınıfına bir çentik, ikinci varyant 10.08 olduğuna göre 9.85-10.34 sınıfına bir çentik çekilir ve bu şekilde bir varyantlar ait oldukları sınıflara yerleştirilir.
II.2- Eklemeli Frekans Dağılım Tabloları
Birçok durumda belirli bir varyanttan daha küçük veya daha büyük değerlerin sayısını bilmek isteriz. Bunun için frekans tablolarından eklemeli (kümülâtif) frekanslar hesaplanır. Sınıfları birbirinden ayıran gerçek sınırlar küçük sınıfın üst sınırı ile bir sonraki sınıfın ait sınırı toplanıp ikiye bölünerek bulunur. Gerçek sınırlar arasındaki fark da sınıf genişliği kadardır. Sonra her gerçek sınırın karşısına, o değerden daha küçük veya daha büyük değerler toplanarak bulunur.
Misal: II.1'de birinci sınıfla ikinci sınıfı birbirinden ayıran gerçek sınır 34.5'tir. Birinci sınıfın gerçek alt sınırı bu durumda 30.5'tir. Buna göre de eklemeli frekans tablosu,
Tablo: II.3- 67 Fabrikada ortalama işçi aylıklarına ait –den daha az ve –den daha fazla eklemeli frekanslar.
Eklemeli Frekanslar
Gerçek -den daha -den daha
Sınırlar küçük büyük
----------- ------------- ---------------
30.5 0 67
34.5 2 65
38.5 13 54
42.5 27 40
46.5 40 27
50.5 48 19
54.5 54 13
58.5 58 9
62.5 61 6
66.5 65 2
70.5 66 1
74.5 67 0
----------- -----------------------------
Misal: II.2'deki veriler için eklemeli frekansları da siz hesaplayınız.
II.3- Grafikler
Frekans tablolarının grafik haline getirilmesi, dağılımın şekli hakkında okuyucuya derhal fikir vermesi bakımından faydalıdır. Freans tabloları histoğram veya poligon şeklinde grafik haline getirilir. Burada sadece histogram gösterilmiştir.
Histoğram
X eksenine gerçek sınırlar, Y eksenine frekanslar işaretlenir. Histoğramda, her sınıf, yüksekliği frekansa eşit, tabanı ilgili gerçek sınırlar üzerine oturan bir dikdörtgenle gösterilir. Dikdörtgenler birbirine bitişiktir. MINITAB isimli paket program ile yapılan histogram Şekil: II.1’de görülmektedir. Ancak orada sınıflar bizim burada belirlediğimizden biraz farklıdır. Tablo: II.1'deki frekans tablosundan histogramı siz çizerek aradaki farkı görünüz.
Şekil: II.1- 67 fabrikanın ortalama işçi aylıklarına ait Histogram
II.3.2- Ogive (Eklemeli Frekans Eğrisi)
X eksenine gerçek sınırlar, Y eksenine eklemeli frekanslar işaretlenir. Gerçek sınırlar ile karşılık gelen ekemeli frekansların kesiştiği noktalar birleştirilerek Ogiveelde edilir (Şekil: II.2). -Den daha küçük ogive'i ile -den daha büyük ogive'inin kesiştiği noktanın X eksenindeki değeri, III. bölümde ele alınacak olan merkezi eğilim ölçülerinden ortancaya karşılık gelir.
Şekil: II.2-67 Fabrikanın ortalama işçi aylıklarına ait –den daha az eklemeli frekans eğrisi (Ogive)
II.4- Kesikli Değişkenler için Frekans Tablosu ve Grafikler
Kesikli değişim gösteren bir özellik için değişim genişliği, her değeri bir sınıf yapmaya yetmeyecek kadar çok ise o zaman frekans tablosu yukarıda anlatıldığı gibi yapılır. Ne var ki birçok durumda kesikli özelliklerde değişim genişliği her varyantı bir sınıf yapacak kadar azdır ve bu durumlarda frekans tablosu yapmak gayet kolaydır. En küçük varyant birinci sınıfın değeri olarak yazılır. Burada sınıf sınırları belirlemeye gerek yoktur. Sonra diğer değerler bu en küçük varyantın altına küçükten büyüğe doğru sıralanır. Nihayet örneğimizdeki her değer, ait olduğu sınıfın karşısına bir işaret çekilerek tabloya kaydolur (Tablo: II.4). Bunların grafikleri de çubuklu diyağram şeklinde yapılır. Çubuklu diyagram Şelil: II.3'te gösterilmiştir.
Misal: II.3- 10 yıldır evli olan 40 ailenin çocuk sayısı aşağıdaki gibi bulunmuştur. Frekans tablosunu ve çubuklu diyağramını yapın.
3 2 1 2 3 5 3 2 2 2
6 4 3 4 2 1 0 2 3 2
1 2 1 1 2 3 2 2 2 1
1 1 3 2 1 2 3 2 1 0
Tablo: II.4- 10 yıldır evli 40 ailenin çocuk sayılarına ait frekans tablosu
Sınıflar Frekanslar
--------- ----------
0 2
1 10
2 16
3 8
4 2
5 1
6 1
-------- -----------
40
Şekil: II.3- 10 yıldır evli 40 ailenin çocuk sayılarına ait çubuklu diyagram.
Şekil: II.2-67 Fabrikanın ortalama işçi aylıklarına ait –den daha az eklemeli frekans eğrisi (Ogive)
II.6- Alıştırma Soruları
1- 50 adet Öğrencinin boyları metre olarak 1.79, 1.82, 1.76.,,, şeklinde ölçülmüştür. En küçük boy 1.57 m, e büyük boy da 1.98 m olarak bulunmuştur. 10 sınıf olarak yapılan aşağıdaki frekans tablosunda boşlukları doldurunuz.
S.D.
Sınıflar (Xi) Frekans
------------ ------- ----------
1.56 - ---- ----- 1
----- - 1.63 ----- 2
1.64 - ----- ----- 5
----- - ----- 1.695 7
----- - ----- ----- 10
----- - 1.79 ----- 8
----- - ----- ----- 6
----- - ----- ----- 5
----- - ----- ----- 3
----- - ----- ----- 2
----- - 1.99 ----- 1
2- Yukarıdaki soruda 1.795’ten daha az eklemeli frekansı kaçtır? a) 8, b) 33, c) 17, d) 50.
3- II.1 numaralı soruda 1.595’ten daha çok frekansı kaçtır? a) 1, b) 49, c) 50, d) 0.
4- Kesikli değişim gösteren özellikler için en uygun frekans grafiği aşağıdakilerden hangisidir? a) Histogram, b) Frekans Poligonu, c) Çubuklu diyagram, d) Ogive.
5- II.1 numaralı sorudaki frekans tablosunda üst sınırı 1.79 olan sınıfın alt gerçek sınırı kaçtır? a) 1.795, b) 1.755, c) 1.775, d) 1.75.
6- 45 süt numunesinde pH değerleri ölçülmüş ve 7.2, 6.8, 8.1, 6.5, … şeklinde kaydedilmiştir. En büyük değer 8.1, en küçük değer de 6.5 olduğuna göre ve sınıf sayısını 10 yapmak istediğinize göre sınıf genişliğini kaç alırsınız? a) 0.16, b) 0.2, c) 0.5, d) 0.1
7- Aşağıdaki frekans tablosunda 3’ten daha az frekansı kaçtır? a) 8, b) 12, c) 4, d) 18
Sınıflar 0 1 2 3 4 5 6 7
Frekanslar 1 3 4 4 6 5 4 3
8- 7 numaralı soruda örnek genişliği kaçtır? a) 30, b) 8, c) 7, d) 1
9- 7 numaralı sorudaki özellik nasıl bir değişim gösterir? a) Kesikli, b) Sürekli, c) hiçbiri, d) her ikisi.
10- 7 numaralı soruda sınıflar arasında gerçek sınırlara gerek var mıdır? a) vardır, b) yoktur.
7 ziyaretçi ve 0 üye çevrimiçi