SPSS Eğitimleri 12- Tanımlayıcı İstatistikler

Merhabalar,
Bu yazımda çalışmalarda oldukça önemli olan tanımlayıcı istatistiklerin nasıl elde edildiğine değineceğiz. Bu istatistikler birçok analiz öncesinde standart olarak uygulanır ve raporun ilk kısmını oluşturur. Oldukça sade ve etkili sonuçlar üretirler. Kısaca basit, hızlı ve özet bilgilerdir. Peki nedir bunlar?

Tanımlayıcı İstatistikler
Tanımlayıcı istatistikler kategorisinde; ortalama, medyan ve mod gibi merkezi eğilim ölçüleri, standart sapma ve varyans gibi ortalamadan sapma ölçüleri ile çarpıklık ve basıklık gibi normal dağılımdan sapmayı ölçen ölçüler yer alır.
1.Merkezi Eğilim Ölçüleri
* İstatistikte bir çok terimden oluşan bir sayıyı temsil ve ifadeye yeterli olan ve tek bir rakama ortalama denir.
* Ortalama aynı zamanda serinin özelliklerini de belirler. Ortalama, bir veri setindeki değerlerin, hangi değer etrafında toplanmış olduklarını gösterir., bu nedenle “Merkezi Eğilim Ölçüleri” olarak da adlandırılır. Bunlar; aritmetik ortalama, mod ve medyandan ibarettir.
-Aritmetik Ortalama
Veri setindeki her değerden etkilendiği için, veri setindeki bütün değerlerin bilinmediği durumlarda uygun bir tanımlayıcı istatistik değildir. Uç değerlerden de önemli derecede etkilenir.
-Medyan(Ortanca)
Bir veri setinde tam ortada yer alan değerdir. Yani sıralanmış bir veri setinde tam ortaya denk gelen ve veriyi iki eşit parçaya bölen değerdir. Uç değerlere karşı hassas olmadığından dolayı özellikle verilerin çarpık olduğu durumlarda, simetrik ve simetrik olmayan dağılımlarda ve veri setinin tamamının bilinmediği açık uçlu verilerde kullanılabilir.
-Mod( Tepe Değeri)
Bir veri setinde en çok ortaya çıkan değerdir. Aralıklı, oransal ve sıralı değişkenlerde kaba bir merkezi eğilim ölçüsü olarak kullanılabilirken sınıflama ölçeğindeki ölçümlerde en yüksek frekansı gösterir.

2.Yayılım Ölçüleri ( Ortalamadan Sapma Ölçüleri)
-Varyans
Değerlerin ortalamadan sapmalarının karelerinin toplamının, toplam değer sayısına bölünmesiyle oluşur.
-Standart Sapma
Gözlemlerin ortalamadan ne kadar uzaklaştığını gösterir ve varyansın pozitif kareköküne eşittir.
Genel olarak merkezi yayılım ölçülerini merkezi eğilim ve yayılım ölçüleri olarak ifade edip tanımladık. Şimdi örnek bir veri seti üzerinden bu ölçüler ne gibi sonuçlar sağlar ve nasıl elde edilir inceleyelim.

İlk olarak aşağıdaki gibi bir veri seti oluşturalım.Şimdi tanımlayıcı istatistikleri elde edip veri hakkında bize ne gibi bir sonuç sağlıyor görelim. Bu veri setinde amacımız; cinsiyetlere göre kişilerin başlangıç maaşlarına ilişkin bir takım tanımlayıcı istatistikler elde etmek.
* Report seçeneğinde Case Summaries sekmesinden Tanımlayıcı İstatistikler elde edilir.


*Descriptive Statistics >> Tanımlayıcı İstatistik
İlk üç seçenekte bir takım tanımlayıcı istatistikler elde edilir.

Hangi istatistikleri aradığımıza bağlı olarak seçimimiz değişir. İlk üç seçeneği sırasıyla inceleyelim;–>Statistics menüsüne baktığımızda elde edeceğimiz tanımlayıcı istatistiklerin menüsü görülmektedir. Eğer bu değerler bizim için yeterli ise doğrudan bu menüyü kullanabiliriz.–> Options seçeneğine baktığımızda bize bir takım tanımlayıcı istatistik değerleri veriyor. Diğer menüde de aynı değerler var ancak biz hangisi kolay ise onu tercih ederiz.–> Son olarak Explore menüsünden Statistics seçeneğine baktığımızda Tanımlayıcı İstatistiklerin bir listesini sunmayıp kendi içerisinde tablo halinde veriyor.

Bir örnek üzerinden Tanımlayıcı İstatistik tablosunu elde edip yorumlayalım.

Karşımıza ilk olarak Cinsiyetlere ilişkin değerler ve eksik gözlem olup olmadığını (Missing) gösteren kısa bir tablo çıkmıştır. Bu tablo görüldüğü gibi genel bir sayıyı göstermektedir.

Tablomuz yukarda görüldüğü gibi Başlangıç Maaşları ile Ciniyet arasında değerlerden oluşmaktadır. Bu değerlerin sırasıyla neyi temsil ettiğini inceleyelim.

Mean; Kızlar için ortalama başlangıç maaşı $20,615.00 iken bu başlangıç maaşının standart hatasının $3,705.852 olduğunu göstermektedir.

%95 Confidence İnterval for Mean; % 95 güven aralığında Alt Sınır(Lower Bound) ve Üst Sınırı (Upper Bound) belirten bu değer, bu veri grubuna benzer veri grubu çektiğimiz takdirde elde edeceğimiz örnekleme dağılımda ortalama başlangıç maaşı $ 12,796.33 ile $ 28,433.67 arasında değişecektir.

%5 Trimmed Mean; Verinin sağ ve sol kısmından verinin %5’ine karşılık gelen birim sayısı kadar en küçük maaş ve en yüksek maaş değerleri ayrı tutulup elde edilen ortalama $ 17,795.56 değeridir.
Veride çok yüksek veya çok düşük maaş alan çalışan olduğundan emin olduğumuz takdirde bizim ortalama değerimizi etkilediğini düşürerek azaltma işleminin gerçekleşmesidir.

Median: Bireylerin maaşlarını sıraladığımızda ortadaki değeri yani medyanı $14,250.00 dır.
Variance: Varyans değeri ise 247,200 olarak karşımız çıkmaktadır.
Std. Deviation: Standart sapma değeri olup Varyansın karekökünü ifade etmektedir.
Minimum, Maximum: Veride Minumum ve Maksimum maaşları ifade etmektedir.
Range: Verinin Min. ile Max. değerleri arasındaki farktır. ($67,980)
Skewness: Verinin çarpıklık değeri olup, yukarıda belirtilen 18 kişinin maaşlarının dağılımı hakkında bilgi sağlar. Değerin pozitif olması sağa, negatif olması sola çarpık demektir.
Kurtosis; Verinin dağılımının normal dağılıma oranla daha basılı veya daha dik olup olmadığı hakkında bilgi verir. Sıfırdan büyük ise daha dik, küçük ise daha basıktır.
Kadınlar için yaptığımız değerlendirmeler Erkekler için de geçerli olup, Kadınların maaşının ortalama değerinin Erkeklerin maaşından önemli ölçüde yüksek olduğu görülmektedir.

Son olarak bir başka önemli konu olan Variance( Varyans) değerine baktığımızda Kadınlarda 247,200 iken Erkeklerde 7,042’dir. Bunun anlamı ise 18 Kadın üyenin maaşları arasındaki değişim, 12 Erkek üyenin maaşları arasındaki değişimden daha fazla değişkenlik göstermektedir. Varyans değişkeni, veri grubunun kendi içerisinde ne kadar homojen bir yapı gösterdiğine ilişkin bir ölçüttür. Erkelerin maaşının daha fazla homojen olduğu görülmektedir.

Genel olarak Tanımlayıcı İstatistileri inceledik.
Görüş ve önerileriniz için okarakoc@industryolog.com mail adresimden her zaman ulaşabilirsiniz.

Görüşmek üzere…