Minitab Eğitimleri 8 – One Sample Sign Test

Minitab Eğitimleri 7- One Way Anova

Minitab Eğitimleri 7- One Way Anova

Merhabalar minitab eğitimlerine One Way Anova testi ile devam ediyoruz. Anova 3 yada daha fazla bağımsız grubun ortalamalarını karşılaştırmak üzere kullanılan bir testtir. Örneğin dört farklı ürün grubu üzerinde ölçümler alıp bu ürünlerin ortalama ömürleri arasında anlamlı bir fark olup olmadığını test ediyor olalım. Anova bu testi yaparken aynı zamanda olası bir farklılıkta hangi grubun diğerlerinden farklı olduğunu anlayabilmemize de olanak verir. Anova testini yapabilmemiz için grupların birbirinden bağımsız ve verilerinin normal dağılıma uygun olması gerekmektedir. Hemen bir örnek üzerinde uygulamamızı gösterelim.

Aşağıda A partisinin 5 farklı bölgeden elde ettiği oylara ait veriler bulunmaktadır. A partisi bu oylara göre önümüzdeki seçimlerde bir takım stratejiler geliştirmeyi amaçlamıştır. A partisinin bu bölgelerdeki etkinliğini kontrol edelim. (Not: Veriler normal dağılmıştır.)

Öncelikle hipotezlerimizi kuralım.

H1: A partisinin bölgelerdeki etkinliği arasında anlamlı bir fark yoktur.

Ho: A partisi en az bir bölgede farklı etkinlik göstermektedir

Verilerimiz normal dağıldığından direkt testimize geçebiliriz.

Bunun için sırasıyla Stat- Anova- One Way adımlarını takip ediyoruz.

Gelen pencerede ilgili yerleri aşağıdaki gibi dolduruyoruz.

Diyelimki bölgeler arasında bir farklılık var ve biz bunun hangi bölgede olduğunu öğrenmek istiyoruz bunun için Tukey testi yaparız. Tukey için Comparisons seçeneğinden Tukey’ i işaretlememiz yeterlidir.

Şimdi sonuçları görelim. Anova testinin sonuçları aşağıdaki gibidir.

Burada P değerimiz 0,05 ten büyük olduğu için Ho hipotezimiz kabul ediliyor. Buna göre A partisinin bu beş bölgede de aynı etkinliği gösterdiğini söyleyebiliriz.

Tukey testi eğer bir farklılık olursa bunun hangi grupta olduğunu bize gösterirdi. O halde bu testin sonucunun da hipotezimizi destekler nitelikte olması gerekmektedir. Kontrol edecek olursak;

Grouping kısmı altında tüm bölgelerimizin A ile belirtildiğini görüyoruz. Bu durum bölgelerin aynı gruba ait olduğunu ve aralarında bir farklılık olmadığını ifade etmektedir. Örneğin 4 bölge A grubu ile belirtilirken 1 bölge B grubu ile belirtilmiş olsaydı bu durumda B ile belirtilen bölgede diğerlerinden daha farklı bir etkinlik gösterildiğini söyler ve bu bölge için farklı stratejiler geliştirilmesi gerektiği yorumunda bulunabilirdik.

Örneğin aşağıda Tukey ile belirlenmiş bir farklılığı görebiliriz.

1.ve 2. Gruplar A ile belirtilirken 3. Grubun B ile belirtilmiş olması o grubun diğerlerinden daha farklı bir ortalamaya sahip olduğunu ifade etmektedir.

Minitab Eğitimleri 8 – One Sample Sign Test

Minitab Eğitimleri 6 – Regresyon Analizi

Merhabalar bu yazımda regresyon analizini tanıyıp minitabda nasıl uygulandığını göreceğiz. Faydalı olması dileğiyle..

Regresyon analizi, iki veya daha fazla değişken arasındaki ilişkiyi belirlemek ve bu ilişkiyi kullanarak o konu ile ilgili tahminler ya da kestirimler yapabilmek amacıyla kullandığımız bir  metottur. 

Regresyon analizi bizlere biri bağımlı diğeri bağımsız değişken olmak üzere bir doğru denklemi sunar. Bu denklem değişkenlerden birinin değerinin değişmesi durumunda diğeri hakkında yorum yapabilmemizi sağlar. Örneğin çocuklar için günlük süt tüketimi ile boy uzunluğu arasındaki ilişkiyi incelediğimizi düşünelim. Burada bağımsız değişkenimiz günlük tüketilen süt miktarı iken bağımlı değişkenimiz ise boy uzunluğu olacaktır. Regresyon analizi bu ilişki hakkında birtakım yorumlar yapabilmemize olanak verecektir. Aşağıda basit regresyon denklemini görüyoruz.

Y=α+βX+ε

Burada
Y ⇒ bağımlı (sonuç) değişkeni ,
X⇒ bağımsız (sebep) değişkeni temsil eder.
α ⇒ sabit olup X=0 olduğunda Y’nin aldığı değerdir.
β ⇒ regresyon katsayısı olup, X’de meydana gelecek bir birimlik değişimin Y deki etkisini gösterir.
ε ⇒ tesadüfi hata terimidir.

Örneğin kardiyoloji kliniğine başvuran erkek hastalar üzerinde yapılan bir
araştırmada, yas(x) ve kolesterol(y) değişkeni arasındaki korelasyondan yola çıkılarak kurulan
regresyon modeli aşağıdaki gibi elde edilmiştir:

Y=3,42+0,326x

Bu modele göre, yastaki bir birimlik artışın, kolesterol değerinde 0.326 birimlik bir
artışa neden olacağı, yeni doğan bir erkeğin (X=0) kolesterol değerinin ise 3.42 olacağı
söylenebilir.Kurulan bu modele göre, 50 yasında bir erkeğin kolesterol değerinin ne kadar
olacağını tahmin edebiliriz.
X=50 için :
Y=3,42+0,326*(50)=19,52
50 yasında bir erkeğin kolesterol değerinin 19.52 olacağı söylenebilir.

Şimdi regresyon analizinin minitabda nasıl uygulandığını görelim..

Örneğimizde öğrencilerin derslerdeki başarı oranı ile ders çalışma süreleri arasındaki ilişkiyi inceleyerek kurulan regresyon modelinin geçerliliğini kontrol edelim ve eğer modelimiz geçerliyse bir takım tahminlerde bulunalım..

Öncelikle hipotezlerimizi kuralım.

Ho: Kurulan regresyon modeli geçerlidir.

        H1: Kurulan regresyon modeli geçerli değildir.

Daha sonra sırasıyla Stat-Regression- Fitted Line Plot adımlarını uygulayalım.

Gelen pencerede Bağımlı ve Bağımsız değişkenleri belirteceğiz. Bu örnek için bağımlı değişken Başarı Oranı iken bağımsız değişken ise Ders Çalışma Süresidir. Değişkenlerimizi belirttikten sonra Ok a basıp işlemi tamamlıyoruz.

Sonuç tablosu aşağıdaki gibidir. Bu sonuçlara göre P değerimiz 0,027 <0,05 olduğundan Ho hipotezi reddedilir. Ho hipotezinin reddedilmesi demek kurulan regresyon modelinin geçerli olduğunu belirtir.

O halde bu modele göre ortalama 140 dakika ders çalışan bir öğrencinin başarı oranı ne olur gibisinden bir soruya yanıt bulabiliriz. Modele göre

Başarı oranı=51,29+0,3095* Ders Çalıma Süresi idi. Değerleri yerine yazarsak;

Başarı oranı=51,29+0,3095*140= 94,62 olur.

 

 

Minitab Eğitimleri 8 – One Sample Sign Test

Minitab Eğitimleri 2- Bağımlı Örnek T Testi (Paired T Test)

Minitab Eğitimleri – Bağımlı Örnek T Testi (Paired T Test)

Merhabalar arkadaşlar Minitab eğitimlerimize devam ediyoruz. Bu yazımda Paired T Testini konu alacağız. Niçin Paired T testini kullanırız? Diğer testlerden farkı nedir? Nasıl kullanırız? gibi soruların cevabını ilerleyen satırlarda bulabilirsiniz.Fayda görmeniz dileğiyle…

Paired t testi aslında birçok parametrik test gibi ortalamaların karşılaştırılmasına dayanır. Fakat burada tek örneklem üzerinde işlemler uygularız. Aynı örneklem üzerinde ölçümler alır, aynı grubun farklı zaman dilimlerindeki beklentilerini, başarılarını, hızlarını vb. ölçeriz.

Bu ölçümlerden elde ettiğimiz sonuçlar neticesinde Paired T testi bize bu ölçümlerin  öncesi ve sonrası arasında bir fark var mı varsa bu farkın ne olduğunu gösterir.

Paired t testini verilerin normal dağılıma uygun olduğu durumlarda kullanırız.

Örneğin 30 kişilik bir öğrenci grubunun vize ve final notları arasındaki başarı durumu ölçmek isteyen bir öğretim elemanı bunu Paired t testi ile görebilir.

Ya da bir ilacın etkinliği araştırılıyor ve bu amaçla 10 hastanın ilaç öncesi ve sonrası kan değerleri ölçüyorsa bu test uygundur.

Şimdi yukarıda bahsettiğimiz örnek üzerinden bir uygulama yaparak bu testin nasıl yapıldığını görelim.

Önce veriler normal dağılıyor mu onu tespit edelim. Hipotezlerimiz kuralım.

Ho: veriler normal dağılıma uygundur.

H1: veriler normal dağılıma uygun değildir.

Burada verilerimiz iki ayrı sütunda karşımıza geliyor normallik testini tek adımda hızlıca yapabilmek adına bu verileri tek sütuna indirgeyelim. Bunun için Data- Stack – Columns adımlarını takip etmemiz yeterli.

Gelen ekranda “Stack The Following Columns” denen alana C2 ve C3 değerlerini atadıktan sonra OK a basıp işlemi tamamlayalım.

Artık normallik testini tek adımda uygulayabiliriz.

Normallik testi için sırasıyla Stat- Basic Statistics – Normality Test adımlarını uygulayalım.

Gelen ekrandaki Variable alanına C2 değerini atayalım. OK a basıp işlemi tamamlayalım.

Burada karşımıza gelen grafikte eğim çizgisine çift tıklıyoruz gelen ekranda Grpups alanında C1 seçeceğine çift tıklayıp işlemi tamamlıyoruz.

P değerlerimiz 0,05 ten büyük olduğu için Ho değerimiz kabul edilir ve veriler normal dağılıma uygundur deriz.

Şimdi artık Paired T testini uygulayabiliriz. Bunun için sırasıyla Stat- Basic Statistics – Paired T adımlarını uyguluyoruz.

Gelen ekranda Sample 1 alanına C2 yi Sample 2 alanınada C3 ü atıyoruz.  Graphs seçeneğinden istediğimiz grafikleri seçebiliriz.

Sonuçlar karşımıza geldi. Burada P değerimiz 0,05ten küçük olduğu için ortalamalar arasında bir fark vardır diyoruz. Peki bu fark nedir? İlaç öncesi kan değerlerinin ortalamasını 55,70 ilaç sonrası kan değerlerinin ortalamasını ise 44, 40 olarak görüyoruz. Buradan ilaç kullanımının kan değerleri oranında bir düşüş meydana getirdiği yorumunda bulunabiliriz.