G İ R İ Ş
1- İstatistiğin Tanımı
İstatistik kelimesi üç anlamda kullanılır: Bilimsel bir disiplin, sayısal veriler grubu ve bu sayısal veriler grubundan hesaplanan değerler.
Bilimsel bir disiplin olarak İstatistik, uygulamalı matematiğin bir alt dalıdır. En yeni ve en hızlı gelişen bir bilim dalı olan İstatistik, bilimsel araştırmalarda ve uygulamada gerekli olan bilgileri rakamsal veriler olarak toplamaya, bu verileri özetlemeye, tanımlamaya ve sunmaya çalışan ve bu verilerin temsil ettiği, ait olduğu daha büyük veri grupları, yani populasyonlar hakkında genellemeler yapmaya, kararlar vermeye ve sonuçlar çıkarmaya çalışan bir metodlar bütünüdür. Dolayısı ile bir bilim dalı anlamında kullandığımız zaman İstatistik Metodlar demeyi tercih edeccğiz. Bilimsel araştırmalarda ve uygulamada gerekli olan sonuçların ve kararların, İstatistik Metodlar sayesinde daha çabuk, daha ucuz, daha duyarlı ve daha güvenilir bir şekilde elde edilmesi, İstatistik Metodların çok yaygın olarak kullanılmasını sağlamıştır. Bugün, fabrika veya hastane yönetiminden siyaset bilimine, dil biliminden filolojiye, ekonomiden psikolojiye, biyolojiden fiziğe, kriminolojiden antropolojiye kadar hemen her disiplinde İstatistik Metodları kullanılmaktadır.
İstatistik kelimesinin ikinci anlamı, sayısal verilerdir. Bunlara istatistik veriler diyeceğiz. İstatistik Veriler, sayı topluluklarıdır; ancak somut sayı topluluklarıdır. Bir logaritma cetvelindeki, bir karekök tablosudaki gibi soyut rakam toplulukları "istatistik veri" değildir. İstatistik veriler, gerçek hayattan toplanan verilerdir; nüfus sayımları, maaşlar, vergiler, bir basketbol takımındaki oyuncuların basket atma, ribaund alma, faul yapma gibi istatistikleri, dükkâna gelen günlük müşteri sayısı, bir koyu sürüsünde yeni doğan kuzuların doğum ağırlıkları gibi..
İstatistik kelimesi üçüncü olarak, toplanan verilerden hesaplanan değerler için kullanılır. Bunlara Tanımlayıcı İstatistikler veya kısaca İstatistikler denir. Bir işletmede çalışan insanların maaşlarının aritmetik ortalaması, standart sapması, maaşla tahsil süresi arasındaki korelaayon katsayısı, sigara içenlerin oranı, maaşı yüz milyon liranın üstünde olanların oranı gibi hesaplanan değerler işte böyle istatistiklerdir. Bu istatistikler, eldeki veri topluluğunun ait olduğu ve dolayısı ile temsil ettiği daha büyük topluluğun, populasyonun değerleri için birer tahmindir.
Verileri topladığımız üniteler topluluğuna Örnek, örneklerin ait olduğu daha büyük üniteler topluluğuna Populasyon denir. İşte bu örnekten hesaplanan değerlere, yukarıdaki üçüncü tanıma uygun olarak İstatistik, bunların karşılığı olan populasyon değerlerine ise Parametre denir.
2- İstatistik Metodlarının Konusu, Amacı ve Önemi
İstatistik Metodlarının amacı, örneklerden, ait oldukları populasyonlar hakkııında bilgiler çıkarmaktır. Bu bilgiler, insanların bilimsel sonuçlara ve kanaatlere varmalarında, çeşitli konularda, "ne yapalım?" sorusuna cevap niteliğinde kararlar vermelerinde yardımcı olduğu için istatistik metodları bu kadar yaygın olarak kullanılmaktadır.
Burada bilimsel çalışmalarla ilgili bazı terimleri açıklamak yararlı olacaktır: Yöntem (Metod), olayları (fenomenleri) ve bunlar arasındaki sebep-sonuc ilişkilerini açıklayabilmek, bu ilişkilerin temelinde yer alan bilimsel kanunları belirleyebilmek için takip edilen yoldur. Bu sebep-sonuç ilişkilerine ve bunların dayandığı bilimsel kanunlara topluca ve kısaca bilgi (knowledge)diyoruz. Belirli kural ve kanunlara uyan böyle bilgilerin sistematize edilmiş haline bilim (ilim) diyoruz. Bilim, bu bilgileri elde etme yollarını ve gayretlerini da içine alan bir ifadedir. Bir bilginin bilimsel sayılabilmesi için sınanabilir olması gerekir. Dikkat edilmelidir ki, “sınanabilir olması” demek, “yanlış olabilir” demektir. İbn-i Sina’nın dediği gibi, “(bilimsel) bir bilginin doğruluğuna, sınamadan inanmak olmaz”. O halde doğru olup olmadığı test edilemeyen yani sınanamayan bilgi, bilimsel değildir. İnancımız gereği doğruluğunu test etme ihtiyacı duymaksızın kabul ettiğimiz vahye müstenit bilgiler, bu tanıma göre, bilimsel bilgi sayılmamaları gerekir. Bunlara mutlak bilgi diyeceğiz.
Bilimsel çalışmaların başlıca maksadı bilgiyi sistematize etmektir; başka bir ifade ile, tabiatta cereyan eden olayların hangi şartlarda nasıl cereyan ettiğini ve sonuçlandığını izah eden modeller geliştirmektir. Bu modellerin bir kısmı deterministiktir. Bunlar, belirli bir olayın, belirli bir şartlar setinin her tahakkukunda, aynı şekilde sonuçlanacağı durumlar için geliştirilmiştir. Bu tip olaylara kesin olaylar (certain events) denilmektedir. Kesin olaylarda, belirli şartlar setinin sağlandığı her durumda, modele göre beklenen –teorik- sonuçla, müşahede edilen –ampirik- sonuç arasında açık bir benzerlik vardır. Ne var ki, modelin uygunluğunu bozmayacak kadar küçük de olsa, teorik sonuçla ampirik sonuç arasında farklar olacaktır. Bu farklar, etkisinin önemsiz olduğu düşünülerek modelde ihmal edilen veya kontrol edilemeyen veya hiç bilinmeyen faktörlerin etkisi ile ortaya çıkabilir. Elbette, bu farklar ne kadar küçükse, geliştirilen model fenomeni izah etmede o kadar başarılı sayılır. Buna karşılık, deterministik modellerin açıklayamadığı, yani belirli şartlar setinin her sağlanışında farklı şekilde sonuçlanan olaylar da tabiatta vardır. Belirli bir şartlar setinin her tahakkukunda önceden bilinemeyen bir şekilde farklı sonuçlanan olaylara tesadüf olayları (random events) denir. Bu olayları açıklamak üzere geliştirilen modellere stokastik modeller denmektedir. İstatistiğin konusu bu tesadüf olaylarıdır. Bir olay her gözlemde aynı şekilde sonuçlanıyorsa bu istatistiğin konusu değildir. İstatistiğin konusu olaylarda denemden denemeye, gözlemden gözleme bir belirsizlik söz konusudur.
Meselâ, yeni bir alana yatırım yapmak istiyen bir müteşebbis, o alanda mevcut yatırımından daha fazla kâr etme ihtimali meselâ %95'ten yüksek ise o alana yatırım yapacaktır. Bu ihtimali belirleyip kararını nasıl verecektir?
Bir fabrika yöneticisi, yeni bir vardiye düzeninin verimliliği artırdığını duymuştur. Bu duyumun doğru olup olmadığına nasıl karar verecektir?
Bir çiftlik sahibi, yeni bir buğday çeşidinin, kendi ektiği çeşidden daha yüksek verimli olduğu iddiasını, araştırmak zorundadır.
Bu kararları verirken yöneticiler veya ilim adamları, belirli bilglere dayanmak zorundadır. Bu bilgiler, konuyla ilgili istatistik verilerdir. Bu verilerden hesaplanan değerlerle, verilerin temsil ettiği populasyonun parametrelerinin kaç olduğu tahmin edilmeye veya belirli bir değere eşit veya ondan daha yüksek veya daha küçük olup olmadığına, verileri elde ettiğimiz ünite topluluğunun, yani örneğin kontrol edilen parametre değerine sahip olan bir populasyona ait olma, ondan çekilmiş olma ihtimaline göre karar verilmeye çalışılır.
Hakkında bilgi edinmek istediğimiz populasyonun bütün üyelerinden veri toplamak, gereksiz ve çoğu zaman imkânsıdır. Bu mümkün olduğu zamanlarda bile sarfedilen emek, para ve zaman çok fazladır. Böyle durumlarda populasyonu temsil ettiği düşünülen sınırlı sayıda üniteden, yani örnekten, verileri elde etmek daha ucuz, daha çabuk, daha kolay ve hatta daha güvenilir sonuçlara ulaşmayı sağlar. Belirli bir günde kuluçkadan çıkan civcivlerin ağırlığını belirlemek istiyorsak, hepsini aynı günde tartmak zorundayız,. Civciv çok ise tartamadığımız civcivleri ertesi gün tartmak bir hataya sebep olur, çünkü o civcivler artık kuluçkadan yeni çıkmış değildir; bir günlüktür. Civcivlerin ağırlıkları arasındaki farkın bir kısmı yaş (gün) farkından kaynaklanır. Bu gibi durumlarda civcivlerin tamamını temsil ettiğine inanılan bir grup civcivi tartmak daha güvenilir bilgiler elde etmemizi sağlayacaktır.
3- İstatistik Verilerin Özellikleri ve Veri Toplarken Dikkat Edilecek Hususlar
Her veri, İstatistik Veri değildir. Bir veri topluluğunun İstatistik Veri sayılabilmesi için, veriler arasında farklılık olması gerekir. Meselâ, koyunların kaç gözü var? sorusuna cevap arayan bir biyolog, her baktığı koyunda iki göz görecek ve topladığı veriler 2,2,2,. şeklinde olacaktır. Tabiatiyle aralarında farklılık olmayan bu gibi rakam toplulukları, istatistik veri değildirler.
Bir rakam topluluğunun istatistik veri sayılması için rakamlar arasındaki farklılıkların hiç olmazsa bir kısmının bilinen her hangi bir sebebe atfedilememesi, yani tesadüften ileri gelmiş olması gerekir. Populasyonun üyesi olan her ünitenin örneğe girme şansı eşit olmalıdır. Bu şekilde elde edilen örneğe Tesadüf Örneği denir.
Tesadüf örnekleri, her ünitenin örneğe girme şansının eşit olması bakımından populasyonu en iyi temsil eden örnekler kabul edilir. Ancak bu her zaman geçerli değildir. Meselâ kızlarla erkeklerden oluşan bir sınıfta öğrencilerin boyu ile ilgili bir tahmin çalışma yapılacaksa, kızlarla erkeklerin örneğe, sınıftaki oranları kadar girmesi gerekir. Buna tabakalı örnekleme denilir. 60 kişilik sınıfın 20’si kız, 40’ı erkek ise 12 kişilik örneğin 4’ünün kızlardan rastgele, 8’inin de erkeklerden rastgele seçilmesi halinde elde edilen örnek, populasyonu 12 öğrencinin rastgele seçildiği bir örnekten daha iyi temsil edecektir.
Populasyonlardan, o populasyonları en iyi temsil eden örneklerin nasıl çekileceği, örnek genişliğinin (örnekte ünite sayısının) kaç olmasının daha iyi olacağı gibi konular, İstatistiğin Örnekleme Metodları denilen bir alt disiplininin konusudur.
Örneği oluşturan ünitelerin bir veya daha fazla özelliğine ait veriler, bu ünitelerden tartmak, ölçmek, saymak suretiyle veya başka bir şekilde (laboratuvarda analiz yöntemleriyle,..) elde edilirler. Bir özelliğe (veya bir tesaadüf değişkenine) ait her üniteden elde edilen rakam o özelliğin birvaryantıdır. Varyantlar, tartmak veya ölmek suretiyle veri elde edilen değişkenlerin vayantları iseler sürekli farklılıklara sahiptirler. Meselâ bir bebeğin doğum ağırlığı 3,4 kg. olarak kaydedilmişse bu varyant gerçekte 3,35 kg. ile 3,44 kg. arasında her hangi bir değer olabilir. Veya bir bebek 3,5 diğeri 3,4 kg. olarak tartılmışsa bunlar arasındaki gerçek farklılık 0,1 kg.'dan daha az veya daha fazla olabilir. Böyle değişkenlere sürekli değişkenler denir.
Varyantlar, saymak suretiyle elde edilmişlerse, bunlar arasındaki farklar kesiklidir. 3 çocuklu bir aile ile 4 çocuklu bir aile arasında, çocuk sayısı bakımından fark kesin olarak 1 çocuktur. Burada bir yuvarlama söz konusu değildir. Böyle değişkenlere kesikli değişkenler adı verilir.
Örnek ne kadar genişse populasyonu o kadar iyi temsil eder. Ancak populasyonun tamamını çalışmak, ya da örnekleri büyük tutmak çok masraflı ve çok zaman alıcı olabilir. Araştırıcının tarafsızlığı, bir defa, örneğe girecek ünitelerin seçiminde gereklidir. Örneği oluşturacak üniteler populasyondan tamamen tesadüfen seçmelidir. Araştırıcı, beklentisi istikametinde ünitelere daha fazla şans vermemelidir.
Araştırıcının, örneği oluşturduktan sonra, verileri doğru bir şekilde elde etmesi gerekir. Yanlış olarak toplanmış verilerden doğru sonuçlar çıkaracak hiç bir yöntem yoktur.
İstatistik verilerin doğru olarak elde edilmesinde en büyük sorumluluk, verileri toplayan araştırıcılara aittir. Bu araştırıcılar, konuyu iyi bilmek, tarafsız ve dikkatli olmak zorundadırlar.
Konuyu iyi bilmekten maksat, örnekteki ünitelerden verileri elde etme yöntemini iyi bilmektir; üzerinde çalışılan özellikleri iyi bilmektir. Verileri elde ederken, üniteleri tartacak mı, ölçecek mi, laboratuarda analiz mi yapacak, sayım mı yapacak,.. bu yöntemleri iyi bilmelidir. Elde edilen verilerin hangi duyarlıkla kaydedileceği de yine araştırıcının iyi bilmesi gereken bir husustur. Gereğinden az, ya da gereğinden çok hassas veriler, veriler arasındaki gerçek farkları tam yansıtmazlar.
Tarafsızlık burada da araştırıcının, elde ettiği rakamlar üzeride beklentisi istikametinde düzeltmeler yapmamasıdır; gerçek ile kendi beklentisi arasında tarafsız olmasıdır. Dikkat ve sabır da elbette verilerin doğru elde edilmesinde önemli hususlardır. Bir de, kalibrasyona titizlikle uyulması, verilerin doğru elde edilmesinde faydalı bir diğer husustur.
4. ALIŞTIRMA SORULARI
1- İstatistik terimi için aşağıdakilerden hangisi yanlıştır? A- Toplanan verilere istatistik denir. B- Yanlış verilerden doğru sonuçlar çıkarma sanatıdır. C- Örnekten hesaplanan değerlere istatistik denir. D. Verilerin toplanması, işlenmesi, sunulması ve genellenmesi ile uğraşan bir bilim dalıdır.
2. Parametre ne demektir? A- Populasyonların dağılımını fonksiyonlarını tanımlayan formüllerdeki değerlerdir. B- Örnekten hesaplanan değerlerdir. C- Örnek genişliğidir. D- Değişim Genişliğidir.
3. Örnek nedir? A- Elimizdeki verileri elde ettiğimiz üniteler topluluğudur. B- Elimizdeki verileri elde ettiğimiz ünitelerin temsil ettiği daha büyük ünite topluluğudur. C- Elimizdeki verilerden hesaplanan değerlere örnek denir.
4. Populasyon nedir? A- Örneğimizin temsil ettiği ve bizim örneğimiz gibi daha birçok örneğin çekilebileceği üniteler topluluğudur. B- Örneğimizi oluşturan verilerdir. C- Örnekten hesaplanan değerlerin dağılımıdır. D- En iyi örnektir.
5. Sürekli değişken ne demektir? A- Gerçek sayılar doğrusunda sayılabilen değerler alan değişkendir. B- Gerçek sayılar doğrusunda küçük bir aralıktaki sayılamayacak kadar çok değerin her birini alabilen değişkendir. C- Rakamlarla ifade edilmeyen değişkenlerdir. D- Ailelerin çocuk sayısı, bir sayfadaki hata sayısı, kız çocuk sayısı gibi değişkenlere sürekli değişken denir.
6. Örneğin populasyonu iyi bir şekilde temsil etmesi için nasıl çekileceğine ve genişliğinin ne kadar olacağına dair usuller geliştiren istatistik disiplini aşağıdakilerden hangisidir? A- Kalite Kontrolü, B- Tanımlayıcı İstatistik, C- Örnekleme Metotları, D- Deney Tasarımı.
7. Sonucun ne olacağı önceden kestirilemeyen olaylar, A- Kesin Olaylardır, B- Mutlak Olaylardır, C- Tesadüf Olaylarıdır, D- Hiçbirisi.
8. Modele göre beklenen sonuçla deneme sonunda ortaya çıkan sonuç arasında ihmal edilebilir farklar varsa böyle modellere A- Deterministik Modeller, C- Stokastik Modeller, C- Korelatif Modeller, D- Açıklayıcı Modeller denir.
9. Bir veri topluluğunun istatistiğin konusu olması için A- Aralarındaki varyasyonun hiç olmazsa bir kısmının tesadüften ileri gelmiş olması lazımdır; B- Aralarındaki farklılıkların tamamını açıklayabilen modeller kurulabilmesi lazımdır. C- Sonucun ne olacağını önceden söyleyebilmek lazımdır. D- Kesikli değişken olması lazımdır.
10- Araştırıcının tarafsız olması ne demektir? A- Etkisini araştırdığı muameleler arasında hangisinin daha etkili olacağına dair beklentisi olmamak. B- Üniteler arasındaki gözleyeceği varyasyon hakkında beklentisi olmamak, C- Denemede çıkan sonuçları beklentisine uysa da uymasa da kaydetmek, D- Denemede beklentisine uyan sonuçları kaydetmek, beklentisine uymayanları elemek.
24 ziyaretçi ve 0 üye çevrimiçi