BÖLÜM DÖRT
ÖRNEKLEME YÖNTEMLERİ
Örnek ve Populasyon ve Diğer Kavramlar, Örnekleme Dağılımları, Örnekleme Yöntemleri, Örnek Genişliği ve Hesaplanması
Üzerinde çalıştığımız konu, bir gözlem veya deneme yapmamızı gerektirir. Gözlem veya deneme yaptığımız ünitelere araştırma ünitesi (deney ünitesi veya temel ünite) denilmektedir. Bu üniteler ve bunlardan elde edilen veriler ise bizim araştırma materyalimizi oluşturur. Araştırmamıza konu olan bireylerin tümüne populasyon (küme, yığın, evren veya bazen çerçeve), o bireylerden veri elde etmek üzere seçtiklerimize örnek diyoruz. Tersine söylersek, verileri elde ettiğimiz üniteler toplululuğuna örnek (sample), örneğin temsil ettiği (elde edildiği, ait olduğu), daha büyük topluluğa da populasyon diyoruz. Örnekten elde edilen bilgileri populasyona genellemek, denilebilir ki, bilimsel araştırmaların başlıca amacıdır.
Populasyon, sosyolojik olarak, araştırmamıza konu olan insanların tamamının oluşturduğu topluluktur. Dikkat edilirse burada araştırma ünitesi, insandır.Türkiye’deki üniversite öğrencilerinin yükseköğretim uygulamalarına ilişkin kanaatlerini, şehircilik anlayışlarını, belediye hizmetlerini nasıl önem sırasına koyduklarını vb. öğrenmek istiyor olabiliriz. Bu durumda Türkiye’deki bütün üniversite öğrencileri bizim populasyonumuzdur.
Araştırmayı Ankara’da yapıyorsak, Ankara’daki öğrencilerin araştırma konumuzla ilgili tavır, kanaat veya beklentilerini belirlemek istiyorsak, populasyonumuz Ankara’daki üniversite öğrencilerine indirgenmiş olur. Aynı çalışmayı, Kastamonu Üniversitesi öğrencilerine genellemek üzere yapıyorsak populasyonumuz artık sadece bu üniversitenin öğrencileridir.
Populasyonun illa da insan populasyonu olması gerekmez. Araştırma konusuna göre başka bir canlı topluluğu, hatta cansız ünitelerin oluşturduğu bir populasyon da olabilir. Araştırma konusu, sığır sütünün protein oranı bakımından çeşitli ırklar arasındaki farklılık olabilir. Genelleme yapılacak populasyon, “çeşitli ırklar” tabiriyle neyin kastedildiğine bağlıdır. Maksat, meselâ üç tane ırk arasındaki farkı belirlemek ise, araştırma sonuçlarını genelleyeceğini populasyon bu üç ırka ait sığırların oluşturduğu populasyondur. Niyetiniz bu üç ırk arasında değil de bütün sığır ırkları arasında sütte protein oranı bakımından bir fark olup olmadığını araştırmak ise, çalışacağınız ırkları, yine üç tane veya daha farklı sayıda ırkı, bütün sığır ırkları arasından rastgele seçersiniz. Bu iki niyet arasındaki fark, araştırma sonucunun genellenmesinde önemlidir. İlkine İstatistik Biliminin bir alt dalı olan deney tasarımında “sabit model” denilir ve hassaten ele alınan ırkla arasındaki farklılık araştırılır. İkincisi ise “rastgele model” olup, çalıştığınız ırklar arasındaki farkı, bütün ırklar arasındaki varyasyonun bir tahmini olarak kullanırsınız. Benzer şekilde, elma ağaçlarının bir zararlıya karşı dayanıklılığını ölçmek istiyor olabiliriz.
Bir elementin yaydığı ışıkla ilgili bir konu araştırılıyorsa veya bir şehre gelen suların kaynaklarına göre kirlilik oranlarını karşılaştırılıyorsa populasyon cansız ünitelerden meydana gelmektedir.
Populasyon, istatistik bilimi bakımından, biraz daha farklıdır. Üniteler, populasyon üyelerinin kendilerinden ziyade, üzerinde durduğumuz özelliğe ilişkin ölçümlerle elde edilen verilerdir. Akarsuların kirlilik oranları, demir parçalarının ışık yoğunluğu, insanların büyük tansiyonu, apartman dairelerinde oturan kişi sayısı, balıkların boyu vb. populasyonumuzu oluşturur. Görüldüğü gibi populasyonu oluşturan üniteler, o populasyonun üyeleri değil, fakat onlardan elde edilen verilerdir.
Hakkında bilgi edinmek istediğimiz populasyonun bütün üyelerinden veri toplamak, gereksiz ve çoğu zaman imkânsızdır. Bu mümkün olduğu zamanlarda bile sarfedilen emek, para ve zaman çok fazladır. Populasyonun tamamından veri elde etmek çoğu zaman gereksiz ve bazen de imkânsızdır; mümkün olduğunda da zaman, emek ve para israfıdır. Hatta bir çok durumda veri elde edilen ünitelerin sayısı arttıkça hatalı ölçüm yapma ihtimali artar; ölçüm yapan kişi yoruldukça dikkati dağılır, çok ölçüm için birden fazla kişi çalışırsa aralarındaki farklılık hata kaynağı olur; birden fazla alet kullanımı da yine bir hata kaynağı olabilir. Ölçümleri belirli bir zamanda bitirme zorunluğu da ünite sayısını sınırlı tutmayı gerektirir. Meselâ Japon bıldırcınlarında 35 günlük kuşların canlı ağırlığını tartıyor olabilirsiniz. Hepsi aynı gün kuluçkadan çıkmış civcivlerin tamamını bir güne tartmanız gerekir. Tartıları ertesi güne kalan kuşlar artık 35 değil, 36 günlüktür. Dolayısıyla kuşlar arasındaki farkın birazı bir günlük yaş farkından ileri gelecektir. Böyle durumlarda populasyonu temsil ettiği düşünülen sınırlı sayıda üniteden, yani örnekten, verileri elde etmek daha ucuz, daha çabuk, daha kolay ve hatta daha güvenilir sonuçlara ulaşmayı sağlar.
Daha önce bahsedildiği gibi üzerinde deney veya gözlem yapılacak birimlerin her birine araştırma ünitesi denir. Araştırma ünitelerinin tamamı populasyonu oluşturur. Bunlar arasından veri elde etmek üzere belirlenen araştırma üniteleri ise örneği oluşturur. Populasyondan örnek çekme işlemine örnekleme denir. Örneğin populasyonu iyi bir şekilde temsil etmesi gerekir.
Populasyonlardan o populasyonları temsil eden örneklerin nasıl çekileceği, İstatistiğin Örnekleme Yöntemleri denilen bir alt disiplininin konusudur. Örnekleme Yöntemleri, bu derste gerekli olduğu kadarıyla ele alınacaktır.
Örnek populasyonu iyi bir şekilde temsil etmelidir. Çünkü, örnekten elde ettiğimiz bilgileri, temsil ettiği populasyona genellemek, o bilgilerle populasyon hakkında tahminler yapmak isteriz. Genellemenin sıhhatli olması, herşeyden önce, örneğin populasyonu iyi temsil etmesine bağlıdır.
Örneğin populasyonu iyi bir şekilde temsil etmesi için, örneğin yeterince geniş olması, uygun örnekleme metoduyla seçilmiş olması ve araştırıcının örneğe hangi ünitelerin gireceği konusunda tarafsız olması gerekir. Populasyonu oluşturan bireylerin, örneğe girme şansı bakımından birbirinden bağımsız olması da, bu tarafsızlığın başka bir ifadesidir. Araştırıcının tarafsızlığı da, örneğe girecek ünitelerin seçiminde gereklidir. Araştırıcı, beklentisine uygun ünitelere daha fazla şans vermemelidir.
Örnek ne kadar genişse poulasyonu o kadar iyi temsil eder. Ancak populasyonun tamamını çalışmak, ya da örnekleri büyük tutmak, yukarıda ifade edildiği gibi, çok masraflı ve çok zaman alıcı olabilir.
Populasyonu iyi temsil eden bir örnek için en basit yol, populasyonu oluşturan bütün bireylerin bizim örneğimize girme şansının eşit olmasıdır. İleride böyle örneklere basit tesadüf örneği (simple random sample) dendiğini göreceğiz. Bazı durumlarda, iyi bir temsil için, populasyon üyelerinin örneğimize girme şansının eşit olmaması gerekebilir, populasyonun her bir alt bölümünün, alt populasyonların, örneğimize üye verme şansı farklı olmalıdır; böyle örneklere olasılıklı örnek denir. Basit tesadüf örneği de bir olasılıklı örnektir.
Populasyonu oluşturan ünitelerin hangilerinin örneğe gireceğini, eşit veya eşit olmayan şansla belirliyorsak, buna olasılıklı (veya şansa bağlı) örnekleme denir. Bazen de, şansa dayanmayan örnekleme yapmamız gerekebilir, böyle örneklere amaçlı veya olasılıksız örnek denir.
Örneğin populasyonu iyi temsil etmesi gerektiğini, çünkü örnekten elde ettiğimiz bilgileri populasyona genellemek istediğimizi gördük. Örnekten elde ettiğimiz bilgiler, örneği oluşturan ünitelerden hesapladığımız değerlerdir. Örnekten hesaplanan değerlere istatistik diyoruz. Bir örneğin ortalaması, standart sapması, bir sınıftaki öğrencilerin içtiği sigara sayısı, iki örneğin ortalaması arasındaki fark vb. hep birer istatistiktir. İstatistiklerin populasyon karşılıklarına parametre denilir.
Örnekten elde edilen bilgilerin populasyona genellenmesi, istatistiklerin karşılık geldiği parametrelere genellenmesi demektir. Örneğin ortalaması 54 çıktığına göre bu örneğin temsil ettiği populasyonun ortalamasının 55’ten büyük olma ihtimali nedir? Bu kadar ihtimale göre populasyon ortalaması 55’ten evet büyüktür diyebilir miyiz? Önceden 55’ten büyük olduğuna dair bir beklentimiz varsa genellemeyi bu beklentiyi (Hipotezi) kontrol ederek yaparız. Beklentimiz yoksa o zaman örnek ortalaması 54 olduğuna göre bu örneğin temsil ettiği populasyonu ortalaması kaç olabilir sorusuna cevap ararız, populasyon ortalamasını tahmin etmeye çalışırız.
Görülüyor ki genelleme, populasyonun ilgili parametresi hakkında beklentimiz olup olmamasına göre, hipotez kontrolü veya parametre tahmini şeklinde yapılabilir.
Elimizdeki örnek temsil ettiği populasyondan çekilebilecek örneklerden sadece bir tanesidir ve bundan hesaplanan istatistik ile karşılık geldiği parametre arasında bir fark olur. Başka bir ifadeyle populasyondan çekeceğimiz ikinci bir örnekte hesaplayacağımız istatistik birincisiyle aynı olmaz. Bu şekilde çekilebilecek bütün örnekleri çektiğimizi ve hepsinde aynı istatistiği hesapladığımızı varsayalım. Bu örneklerin her birinden hesapladığımız istatistikler farklı olacaktır. Çoğu parametreye yakın değerler olacaktır; parametreden çok farklı istatistiklerin oranı ise daha az olacaktır. Bunları istatistik dersinde ayrıntılı olarak görmektesiniz. Aynı populasyondan çekilebilecek örneklerden hesaplanan istatistikler görülüyor ki bir dağılım gösterirler. İstatistiklerin bu dağılımına örnekleme dağılımı denir.
Araştırma sonucunun genelleyebilmek, yani örnekten elde edilen bilgileri (istatistikleri) populasyona (parametreye) genelleyebilmek için bu örnekleme dağılımları kullanılır. Bu derste örnekleme dağılımları hakkında ayrıntılı bilgi vermeyeceğiz. Ancak bir istatistikçiyle sürekli istişare etmenin veya daha iyisi araştırma grubuna bir de istatistikçi dâhil etmek gerektiği bir kere daha anlaşılmış olmalıdır.
Elde mevcut örnekten hesapladığımız her istatistiğin, bir frekans dağılımı gösterdiğini bilmek durumundayız. İstatistiklerin bu dağılımına Örnekleme Dağılımı (Sampling Distribution) denir. Örnekten elde edilen birinci derece istatistiklerin (ortalama, oran, ortalamaların farkı, oranların farkı), örneğin çekildiği populasyon normal veya bir tepe değeri etrafında simetrik dağılıyorsa, normal dağıldığı kabul edilir. Populasyonda üzerinde durulan özellik bir tepe değerli bir dağılım gösteriyorsa, dağılım simetrik olmasa da, küçük örneklerde bile ortalamaya ait örnekleme dağılımının normal olduğu kabul edilir. Üzerinde durulan özelliğin dağılımı tepe değerli değilse o zaman ortalamaya ait örnekleme dağılımının normal sayılması için örnek genişliğinin en az 30 olması istenir. Korelasyon katsayısının da, eğer örneğimiz, korelasyon katsayısı sıfır olan bir populasyondan çekilmişse, normal dağıldığı varsayılır.
Ortalamaya ait örnekleme dağılımının varyansı, o örneklerin çekildiği populasyon varyansının örnek genişliğine bölünmesiyle bulunur. İki özellik arasındaki korelasyon katsayısı, bir fenomenin oranı, iki ortalamanın farkı gibi diğer istatistiklerin örnekleme dağılımlarına burada girmeye zamanımız olmadığı için onları ele alamıyoruz. Varyansın kareköküne hatırlayacağınız üzere standart sapma denir. Bir örnekleme dağılımının varyansı, örnek genişliğiyle (örnekteki araştırma ünitelerinin sayısı) ters orantılıdır. Örnek genişliği büyüdükçe standart sapma küçülür.
Populasyona ait varyans bilinmediği zaman, bunun yerine, parametrenin bir tahmini olarak örneğin varyansını kullanırız. Varyans ne kadar küçükse örneğin populasyonu temsil etme şansı o kadar artar. Ya da varyans ne kadar küçükse populasyonu temsil edecek örnek o kadar küçük olabilir. Örnekleme dağılımının standart sapmasının örnekten tahminine standart hata denir. Bir istatistiğin standart hatası ne kadar küçükse onun populasyon parametresine karşılık gelme şansı o kadar yüksektir. Standart hata ne kadar küçükse örnek genişliği de ona göre küçük alınabilir.
Özet olarak, örneğimizin, populasyonu temsil etme derecesini, standart hata gösterir. Standart hata, örnekleme dağılımına ait standart sapmanın yansız bir tahminidir. Örnek ne kadar genişse, standart hata o kadar küçük çıkar, dolayısı ile örneğimizin populasyonu temsil derecesi o kadar yüksektir.
IV.3- Örnek Genişliği
Örnek genişliği kaç olmalıdır? Örnek genişliği büyüdükçe standart hata küçüldüğüne göre ne kadar büyük örnekle çalışırsak genellemelerimizin isabet derecesi o kadar artar. Ancak maliyet, emek ve zaman israfını düşünerek örneğimizi sınırlı sayıda tutmayı da isteriz. O zaman uygun örnek genişliği kaç olmalıdır? Bu soruyu cevaplayabilmek için istatistikten hatırlayacağınız standart normal dağılımı düşünelim. Ortalamaya ait örnekleme dağılımını standart normal dağılıma çevirmek için kullanılan formülü hatırlayalım:
Burada örnek ortalamasından populasyon ortalamasını çıkarıp örnekleme dağılımının standart sapmasına bölüyoruz. Örnek ortalaması ile populasyon ortalaması arasındaki farka, daha doğrusu örnek değeri (istatistik) ile populasyon değeri (parametre) arasındaki farka örnekleme hatası denir ve D ile gösterilir. Bu hatanın az olması istenir. Z’yi de biz standart normal dağılım tablosundan göze aldığımız birinci tip hata yapma ihtimaline göre belirleriz. Birinci tip hatayı şimdilik, doğru bir hipotezi reddetme hatası olarak tanımlayabiliriz.
Bu durumda uygun örnek genişliğini Z formülünden çözersek:
→→→
bulunur. Demek ki, örnek genişliği birinci hata yapma ihtimaline göre belirleyeceğimiz Z değerine, populasyonun varyansına ve örnekleme hatasına bağlıdır. Birinci hata yapma ihtimalini %5 olarak belirlemişsek buna karşılık gelen Z değeri 1.96 olacak demektir. Populasyon varyansı 100 ise ve göze aldığımız örnekleme hatası da 10 ise
Yani örnek genişliğini 4 olursa %5’lik bir hatayı göze alıyoruz demektir. Göze alabileceğimiz örnekleme hatası 5 ise o zaman örnek genişliği 16 olması yeterli demektir. Populasyon varyansı 200 ise birinci durumda 8, ikinci durumda ise 32 üniteyle çalışmamız en uygun olacak demektir. Görülüyor ki populasyon varyansı ne kadar küçükse örnek genişliği de o nispette küçük olabilir.
Oran için örnek genişliği de aynı şekilde
→→→
olarak verilir.
Populasyon varyansı bilinmediği zaman örnek varyansını kullanacağımızı söylemiştik. Örnek varyansının n’e bölünmesiyle örnekleme dağılımının varyansını tahmin etmiş oluruz. Bu varyansın kareköküne ilgili istatistiğin standart hatası denildiğini de biraz önce ifade etmiştik. Görülüyor ki standart hata ne kadar küçükse tahmin o kadar isabetli demektir.
Populasyonu iyi temsil edecek ve maksada uygun olan örnek elde etme işlemine örnekleme diyoruz. Örneklemede populasyonu en iyi şekilde temsil edecek örneği seçmek için genellikle başvurulan yol, örneğe girecek bireyleri, şansa bağlı olarak belirlemektir. Bu yola, şans örneklemesi, olasılıklı örnekleme veya daha yaygın adıyla rastgele örnekleme diyoruz. Bazı hallerde, örneğe girecek bireyler şansa göre değil, amaçlı olarak seçilebilir. Bu yola da amaçlı örnekleme, tipik örnek seçme veya olasılıksız örnekleme denilmektedir. Amaçlı örneklemeye bilimsel çalışmalarda nadiren başvurulur. Onun için bu derste sadece olasılıklı örnekleme yöntemleri üzerinde durulacaktır. Amaçlı örneklemeye bir misal olarak eksperlerin uygulaması gösterilebilir. Eksperler, tütün, pancar alımlarında gelen ürünün fiyatını belirlemek için üründen birkaç örnek alır ve bunu tesadüfen değil de amacına uygun olarak seçer. Pancar kooperatifine üreticinin bir traktör veya kamyonla getirdiği şeker pancarı ürününün fiyatı ne olacaktır? Eksper fiyatı belirlemek için pancarlardan tesadüfen seçmez, ama yığının üstünden, ortasından ve altından birkaç numune alır ve bunları, meselâ şeker ve çamur oranını bulmak üzere analiz ederek yığının tamamı hakkında bir kanaat sahibi olur ve fiyatlandırmayı yapar.
Bu kısımda ele alınacak olan olasılıklı örnekleme yöntemleri, Basit Tesadüfi Örnekleme, Tabakalı Örnekleme, Kümeli (Kademeli) Örnekleme ve Sistematik Örneklemedir.
Olasılıklı örnekleme (Şans örneklemesi) yöntemleri içinde en basit ve sık kullanılan örnekleme yöntemi basit tesadüfi örneklemedir. Bu şekilde çekilen örneğe basit tesadüf örneği (simple random sample) denir. Bu örnekleme işleminde populasyondaki her ünitenin bizim araştırma örneğimiz olma şansı, yani örneğe girme şansı eşittir. Populasyondan 10 ünitelik bir örnek çekilecek olsa, her ünitenin örneğe girme şansının eşit olması demek, mümkün olan bütün 10 kişilik örneklerin de bizim çekeceğimiz örnek olma şansı eşit demektir. Buna göre, elimizdeki örneğin söz konusu populasyondan çekilebilecek bizim örneğimiz gibi örneklerden sadece birisi olduğunu, buradan elde edilecek bilgileri populasyona genellemeye çalıştığımızı bilmek, bilimsel yaklaşımın temel ögelerinden birisidir. Görülüyor ki basit tesadüf örneğinde, her bireyin örneğe girme şansı eşit olduğu gibi, populasyondaki mümkün olan her birey kombinasyonunun da, bizim örneğimiz olma şansı eşittir.
Meselâ bir okulda 500 öğrenci varsa ve biz 25 öğrenciden oluşan bir örnekle çalışacaksak, 500 bireyden yapılabilecek 25’lik kombinasyonların herbiri eşit şansla bizim örneğimiz olabilir. Çalıştığımız örneğin, bu mümkün olan örneklerden (örnek uzayından) rastgele birisi olduğunu bilerek araştırmayı sürdürmek, bilimsel yaklaşımın önemli ilkelerinden birisidir.
Ne var ki bazı durumlarda basit tesadüf örneklemesi örneğimizim populasyonu iyi temsil etmesine yetmez ve/veya çok zaman ve masraf gerektirir. Meselâ üniversite öğrencilerinden oluşan bir populasyonda öğrencilerin 100 metreyi kaç saniyede koşabildiğini çalışıyorsak, populasyondaki kız ve erkek öğrenci sayısı eşit değilse basit tesadüf örneklemesi uygun olmaz. Populasyonun %40’ı kız, %60’ı erkek ise ve biz 20 öğrencilik bir örnekte çalışacaksak 20 öğrencinin %40’ını yani 8’ini kızlardan, %60’ını yani 12’sini erkeklerden almamız gerekir. Bu şekilde tabakalardan, alt populasyonlardan oluşan bir populasyondan çekilen örnekte her tabakanın büyüklüğüne orantılı şekilde örnekte yer almasını sağlayacak şekilde yapılan örneklemeye tabakalı (stratified) örnekleme denir. Burada her tabakada örneklemenin yine basit tesadüfi örnekleme olarak yapıldığını anlamış olmanız gerekir.
Bir üniversitede uzaktan eğitimde okuyan öğrencilerin gelir dağılımını belirlemek istiyorsak, burada da yine populasyonu çalışan öğrenciler, çalışmayan öğrenciler diye ikiye ayırmak gerekir. Yine populasyonun %25’i çalışan öğrenci ise ve 70 öğrencide araştırmamızı yapacaksak, bu 70 öğrencinin %25’i yani 18’i çalışanlardan geri kalan 52’si diğer öğrencilerden seçilmelidir.
Tabakalı örneklemede (stratified sampling), populasyon, bizim üzerinde çalıştığımız özellikler bakımından tabakalara ayrılıyorsa, her tabakanın oranına uygun miktarda ünite örneğimize alınır. Böylece büyük tabakadan çok, küçük tabakadan az sayıda birey örneğimize girmiş olur. Burada dikkat edilecek husus, üzerinde çalıştığımız özellik(ler) bakımından gerekiyorsa tabakalara ayırmaktır. Her tabakada basit tesadüfi örnekleme yapılır.
Tabakalı örneklemede iki husus önemlidir. Birincisi, tabakaları hangi faktöre göre ayıracağımızdır. Bu araştırmacının konusunu iyi bilmesini gerektiren bir husustur. İkincisi, her tabakadan örneğe girecek ünite sayısını ve dolayısıyla ihtimalini belirlemektir. Tabakanın populasyon içindeki büyüklüğü burada önemlidir. Büyük tabakadan tabiatıyla daha çok ünite seçmek gerekir. Ancak tabakadan alınacak ünite sayısı bazı durumlarda tabakanın nisbi büyüklüğüne uygun olmayabilir. Bir tabakadan alınacak üniteler daha masraflı ve/veya zahmetli olabilir. Bu durumda o tabakadan daha az sayıda örnek alınır.
Bazen de populasyon geniş bir alana yayılmış olabilir. Meselâ çalışma materyalimizi, yani populasyonumuzu Türkiye’deki bütün kadınlar oluşturuyorsa rastgele örnekleme Edirne’den Kars’a kadar her yere gitmemizi gerektirebilir. Bu durumlarda kümeli (cluster) örnekleme yapılır. Bu örnekleme yöntemi için Türkçede kullandığımız bir isim de kademeli örneklemedir. Toplam 2500 kadınla anket yapılacaksa, rastgele (Basit tesadüfi) örneklemede 2500 kadın bütün Türkiye sathına yayılmış olabilir. Bunun yerine illeri birer küme (birer örnekleme ünitesi) olarak planlayıp her ilden o ilin büyüklüğüne orantılı şekilde örneğe girecek kadınları belirlemek daha az masrafla yapılabilecek bir çalışma olur. 81 ilden rastgele 5’ini seçip 2500 kişilik örneği, bu 5 ilden, illerin nüfusuna orantılı olarak belirleyebiliriz.
Küme örneklemesinde (cluster sampling), örneğe girecek bireyleri tesadüfen seçmek zor ve masraflı bir çalışmaya sebep olabilir. Bu durumda populasyon kümelere ayrılır ve kümeler tesadüfen seçilir.
Sistematik örneklemeye de sıralı deney ünitelerinden örnek verilebilir. Bir hastane kliniğine gelen hastalardan populasyonun %5’i kadar bir örnek alınacaksa hasta kayıt numarasına göre ilk hastanın kayıt numarası, diyelim ki, 1 ile 30 arasındaki rastgele bir numara olarak belirlenir. Sonra her 20 sonraki hasta örneğimize girer. İlk hastanın kayıt numarası tesadüfi bir sayı olarak 18 çıkmışsa 18, 38, 58,… kayıt numaralı hastalar örneğimize girecektir. %10’luk bir örnek alınacaksa örneğimiz girecek ikinci ünitenin sıra numarası 28, üçüncü 38,… olacak şekilde örnek belirlenir.
Mesela 238 kayıt numaralı hasta ölmüş olabilir o zaman bir önceki veya bir sonraki hasta alınabilir. Burada hasta kayıt defteri populasyon anlamında çerçeve olarak isimlendirilir. Ancak çerçeve ile gerçek populasyon arasında bir farka da değinmiş oluyoruz. Ölmüş, başka yere taşındığı için bulamayacağımız hastalar da çerçeve içinde yer almakta, ancak bizim gerçek populasyonumuzda yer almamaktadır.
Sistematik örneklemede de, genellikle büyük ve üyeleri bir şekilde sıralanmış populasyonlarda, örneğe girecek birimler, sistematik olarak, (her 50.ci hasta gibi) seçilir. Burada sıralamanın getirdiği zaman farkının üzerinde çalıştığımız özellik(ler) bakımından önemsiz olması gerekir.
Sıralama, üzerinde durduğumuz özellikle ilişkiliyse, sistematik örneklemenin tahinin isabet derecesini azaltabileceğini bilmek gerekir. Meselâ sizin numaralarınız giriş puanlarınızla ilgiliyse ve giriş puanlarınızı belirlemeye yönelik bir araştırma yapıyorsak, sistematik örneklemede ilk seçtiğini sıra numarası küçükse, giriş puanları populasyonun gerçek ortalamasının altında bir tahmin verecektir. O bakımdan sistematik örneklemenin rastgele örnekleme yöntemi olmadığı durumları da işaret etmek gerekir.
Burada gördüğümüz dört örnekleme yönteminin (Basit tesadüfi, tabakalı, kümeli ve sistematik) avantajları, dezavantajları vardır. Bazılarında deney hatası büyük, bazılarında grup içi korelasyon dediğimiz parametre büyük olur. Ancak bu ders seviyesinde bunlar üzerinde durmayacağız. Daha önce de bahsedildiği gibi, Örnekleme Yöntemleri adı altında İstatistik bilim dalı içinde bir alt disiplin vardır. Örnekleme konuları o alt disiplin dalının uzmanı olarak yetiştirileceklere verilen “Örnekleme Metodları” derslerde etraflıca ele alınmaktadır.
IV.5- Çalışma Soruları
1- A populasyonunun varyansı 25, B populasyonunun aynı özellik bakımından varyansı 36 bulunmuştur. Bu populasyonları temsil edecek tesadüf örnekleri için aşağıdaki ifadelerden hangisi doğrudur?
a- A populasyonunu temsil edecek örnek daha geniş olmalıdır.
b- A populasyonunu temsil edecek örnek daha küçük olmalıdır.
c- İkisi aynı büyüklükte olmalıdır.
d- B populasyonunu temsil edecek örnek daha küçük olmalıdır.
2- Populasyon çok geniş bir alana yayılmışsa en iyi örnekleme yöntemi
a- Basit Tesadüf Örneklemesi
b- Tabakalı Örnekleme
c- Kümeli Örnekleme
d- Olasılıksız Örnekleme
3- Örnekten hesaplanan değerlere ne denir?
a- Örnek Genişliği
b- Parametre
c- İstatistik
d- Hiçbirisi.
4- Aşağıdaki ifadelerden hangisi doğrudur?
a- en iyi örnekleme yöntemi, olasılıksız (amaçlı) örnekleme yöntemidir
b- örnek ne kadar küçükse populasyonu o kadar iyi temsil eder
c- örnekteki birey sayısı populasyonun yarısından az olmamalıdır
d- tabakalı örnekleme, populasyon homojen değilse başvurulan bir
yöntemdir
5- Populasyondaki her ünitenin örneğe girme şansı eşit olacak şekilde yapılan örneklemeye ne denir?
a- Basit Rastgele Örnekleme
b- Amaçlı Örnekleme
c- Tabakalı Örnekleme
d- Hiçbirisi
6- Tabakalı örneklemeye hangi hallerde başvurulur?
a- Populasyon çok geniş bir alana yayılmışsa
b- Populasyon araştırma konusu bakımından alt gruplara ayrılıyorsa
c- Populasyonu oluşturan üniteler homojen ise
d- Hemen fiyat belirlemesi yapılacaksa
7- Standart hata için aşağıdaki ifadelerden hangileri doğrudur?
I- ait olduğu istatistiğin parametreyi tahmindeki isabet derecesini verir
II- ait olduğu istatistikten büyük olması mümkün değildir
III- sıfırdan küçük çıkarsa o istatistiğe güvenilmez
IV- populasyon standart sapmasının tahminidir
a- I-II
b- I-III
c- II-IV
d- II-III
8- Tabakalı örneklemeye hangi hallerde başvurulur?
a- Populasyon çok geniş bir alana yayılmışsa
b- Populasyon araştırma konusu bakımından alt gruplara ayrılıyorsa
c- Populasyonu oluşturan üniteler homojen ise
d- Hemen fiyat belirlemesi yapılacaksa
9- Bir şekilde sıralı (bir poliklinikteki hasta dosyaları gibi) bireylerden oluşan bir populasyondan çekilecek örnek için en uygun yöntem
a. basit rastgele örnekleme b. sistematik örnekleme c. küme örneklemesi ç. hiçbirisi
10- Populasyon ülkenin tamamındaki kadınlardan oluşuyor ise, en iyi örnekleme yöntemi,
a- Basit rastgele Örnekleme
b- Tabakalı örnekleme
c- Küme Örneklemesi
d- Hiçbirisi
26 ziyaretçi ve 0 üye çevrimiçi