Merhabalar bu yazımda regresyon analizini tanıyıp minitabda nasıl uygulandığını göreceğiz. Faydalı olması dileğiyle..

Regresyon analizi, iki veya daha fazla değişken arasındaki ilişkiyi belirlemek ve bu ilişkiyi kullanarak o konu ile ilgili tahminler ya da kestirimler yapabilmek amacıyla kullandığımız bir  metottur. 

Regresyon analizi bizlere biri bağımlı diğeri bağımsız değişken olmak üzere bir doğru denklemi sunar. Bu denklem değişkenlerden birinin değerinin değişmesi durumunda diğeri hakkında yorum yapabilmemizi sağlar. Örneğin çocuklar için günlük süt tüketimi ile boy uzunluğu arasındaki ilişkiyi incelediğimizi düşünelim. Burada bağımsız değişkenimiz günlük tüketilen süt miktarı iken bağımlı değişkenimiz ise boy uzunluğu olacaktır. Regresyon analizi bu ilişki hakkında birtakım yorumlar yapabilmemize olanak verecektir. Aşağıda basit regresyon denklemini görüyoruz.

Y=α+βX+ε

Burada
Y ⇒ bağımlı (sonuç) değişkeni ,
X⇒ bağımsız (sebep) değişkeni temsil eder.
α ⇒ sabit olup X=0 olduğunda Y’nin aldığı değerdir.
β ⇒ regresyon katsayısı olup, X’de meydana gelecek bir birimlik değişimin Y deki etkisini gösterir.
ε ⇒ tesadüfi hata terimidir.

Örneğin kardiyoloji kliniğine başvuran erkek hastalar üzerinde yapılan bir
araştırmada, yas(x) ve kolesterol(y) değişkeni arasındaki korelasyondan yola çıkılarak kurulan
regresyon modeli aşağıdaki gibi elde edilmiştir:

Y=3,42+0,326x

Bu modele göre, yastaki bir birimlik artışın, kolesterol değerinde 0.326 birimlik bir
artışa neden olacağı, yeni doğan bir erkeğin (X=0) kolesterol değerinin ise 3.42 olacağı
söylenebilir.Kurulan bu modele göre, 50 yasında bir erkeğin kolesterol değerinin ne kadar
olacağını tahmin edebiliriz.
X=50 için :
Y=3,42+0,326*(50)=19,52
50 yasında bir erkeğin kolesterol değerinin 19.52 olacağı söylenebilir.

Şimdi regresyon analizinin minitabda nasıl uygulandığını görelim..

Örneğimizde öğrencilerin derslerdeki başarı oranı ile ders çalışma süreleri arasındaki ilişkiyi inceleyerek kurulan regresyon modelinin geçerliliğini kontrol edelim ve eğer modelimiz geçerliyse bir takım tahminlerde bulunalım..

Öncelikle hipotezlerimizi kuralım.

Ho: Kurulan regresyon modeli geçerlidir.

        H1: Kurulan regresyon modeli geçerli değildir.

Daha sonra sırasıyla Stat-Regression- Fitted Line Plot adımlarını uygulayalım.

Gelen pencerede Bağımlı ve Bağımsız değişkenleri belirteceğiz. Bu örnek için bağımlı değişken Başarı Oranı iken bağımsız değişken ise Ders Çalışma Süresidir. Değişkenlerimizi belirttikten sonra Ok a basıp işlemi tamamlıyoruz.

Sonuç tablosu aşağıdaki gibidir. Bu sonuçlara göre P değerimiz 0,027 <0,05 olduğundan Ho hipotezi reddedilir. Ho hipotezinin reddedilmesi demek kurulan regresyon modelinin geçerli olduğunu belirtir.

O halde bu modele göre ortalama 140 dakika ders çalışan bir öğrencinin başarı oranı ne olur gibisinden bir soruya yanıt bulabiliriz. Modele göre

Başarı oranı=51,29+0,3095* Ders Çalıma Süresi idi. Değerleri yerine yazarsak;

Başarı oranı=51,29+0,3095*140= 94,62 olur.