Dünya p'den Büyüktür!

P değeri,birçok araştırmacının odak noktası olmuş ve sıkça yanlış yorumlanmış bir istatistiksel ölçüdür.Bu yazıda,p değerinin ne olduğunu,nasıl hesaplandığını ve en önemlisi nasıl doğru bir şekilde yorumlanması gerektiğini ele alacağım.

Posted by Şuheda Karabudak on September 16, 2023

P-Değeri Nedir

P değeri (p-value), istatistiksel analizlerde kullanılan bir terimdir ve bir hipotezin test edilmesi sonucunda elde edilen bir istatistik değerini ifade eder.Bir başka deyişe göre p değeri, belirli bir istatistiksel model altında verilerin, örneğin karşılaştırılan iki grup arasındaki fark gibi gözlemlenen verilere eşit veya daha uçta olma olasılığını ifade eder. P değeri, genellikle 0 ile 1 arasında bir değer alır. Daha düşük bir p değeri, gözlemlenen farkın istatistiksel olarak daha anlamlı olduğunu gösterir.

P-Değeri Nasıl Hesaplanır

Diyelim ki bir arkadaşınız size, kendi yaptığı bir özel diyetin kilo verme üzerinde olumlu bir etkisi olduğunu iddia ediyor.

İlk adım, null hipotezi oluşturmak: Null hipotez, arkadaşınızın diyetinin kilo verme üzerinde herhangi bir etkisinin olmadığını varsayar. Yani, diyetin etkisi yoktur.

Şimdi, arkadaşınızın bu diyeti uygulamaya başlar ve bir ay boyunca kilo verme sonuçlarını kaydeder.

P değeri hesaplama zamanı geldi! P değeri, null hipotezinin doğru olduğu varsayımı altında bu kadar şaşırtıcı bir kilo kaybı elde etme olasılığını gösterir.

Eğer p değeri çok düşükse (örneğin, 0.05 veya daha küçük), bu, null hipotezinin doğru olma olasılığının çok düşük olduğunu ve arkadaşınızın diyetinin gerçekten kilo verme üzerinde olumlu bir etkisi olduğunu gösterir.

Ancak, eğer p değeri yüksekse, bu null hipotezinin doğru olma olasılığının yüksek olduğunu gösterir ve arkadaşınızın diyetinin kilo verme üzerinde etkisi olup olmadığı konusunda daha fazla şüphe yaratır.

Sonuç olarak, p değeri, bir iddianın istatistiksel olarak ne kadar güçlü olduğunu veya zayıf olduğunu değerlendirmek için kullanılan bir araçtır. Yani, arkadaşınızın diyeti gerçekten işe yarıyor mu, yoksa sadece rastgele mi kilo verdi? P değeri, bu sorunun cevabını aramak size yardımcı olur.

P-Değerinin Yorumlanması

P değerini doğru bir şekilde yorumlamak, istatistiksel sonuçların anlaşılması için kritik öneme sahiptir. İşte p değerini yorumlarken dikkate almanız gereken bazı önemli noktalar:

1.Alfa (α) Değerinin Rolü: Alfa değeri, veri analizi öncesinde karar verilen kabul edilebilir hata seviyesini temsil eder. Genellikle 0.05 olarak belirlenir. Bir p değeri, alfa değerinden düşükse (örneğin p < 0.05), bu sonuç istatistiksel olarak anlamlı kabul edilir.

2.Örneklem Büyüklüğünün Rolü: P değeri, örneklem büyüklüğüne bağlı olarak değişebilir. Aynı büyüklükteki bir fark için daha büyük bir örneklem, p değerini küçültebilir. Bu nedenle, p değerini yorumlarken örneklem büyüklüğünü dikkate almak önemlidir.

3.Etki Büyüklüğü ve Güven Aralığı: P değerinden daha önemli olan şeylerden biri, etki büyüklüğüdür. Bir sonucun istatistiksel olarak anlamlı olup olmadığından daha fazla, bu sonucun pratik açıdan ne kadar önemli olduğu önemlidir. Ayrıca, güven aralığı da sonuçların belirsizlik derecesini gösterir ve dikkate alınmalıdır.

4.Tekrarlanabilirlik: Tek bir çalışma sonucuna dayanarak p değerini yorumlamak yerine, benzer sonuçları elde etmek için farklı çalışmaların yapılması ve sonuçların tekrarlanabilirliği de göz önünde bulundurulmalıdır.

Python’da P-Değerini Hesaplama

P-değeri, hipotezleri değerlendirmemize, veriler hakkında çıkarımlar yapmamıza ve istatistiksel anlamlılığa dayalı karar almayı yönlendirmemize yardımcı olduğundan veri biliminde de önemli bir kavramdır. Python’da p değerini hesaplamak için scipy.stats veya statsmodels gibi çeşitli istatistiksel kütüphaneleri kullanabilirsiniz.Örnek vermek gerekirse;

1
2
3
4
5
6
7
8
9
10
11
import scipy.stats as stats

#İki veri kümesi tanımlayalım
grupA = [5, 6, 7, 8, 9]
grupB = [2, 4, 6, 8, 10]

#İki veri kümesi üzerinde bir t-testi gerçekleştirin
t_statistic, p_value = stats.ttest_ind(grupA, grupB)

#Hesaplanan p değerini yazdırın
print("The p-value is:", p_value)

Sonuç

Çoğu araştırmacı veya okur, çalışmada bulunan p değeri < 0.05 olduğunda, bulunan sonucun önemli olduğunu hatta bu değerin sıfıra çok yaklaştığında sonucun çok önemli olduğunu düşünür veya yorumlar. Oysaki p değeri, gruplar arası bulduğumuz farkın veya yapılan regresyon veya korelasyon analizi sonuçlarının incelenen değişkenler arasındaki doğrusal ilişkinin şansa, yani olasılığa bağlı olarak ortaya çıkıp çıkmadığını gösteren bir sonuçtur.

Mesela, ‘Araştırma sonucunda p değerinin ne çıkacağını belirlemek’ işte en büyük yanlışlık burada başlıyor. Bir araştırma için sürpriz olan aslında p değerinin kaç çıkacağı değildir. Sürpriz olması gereken, merakla beklenen şey, araştırma sonucunda ortaya çıkacak farkın büyüklüğü, ilişkinin derecesi, riskin miktarı, başarı veya başarısızlık oranıdır. P değerinden ziyade önemli olan etki büyüklüğü ve güven aralığıdır.

P değeri hangi büyüklükte ve düzeyde olursa olsun, büyük ölçüde örneklem büyüklüğüne bağlı olduğu dikkatten kaçırılmamalıdır. Aynı büyüklükteki bir fark veya katsayı için örneklem büyüklüğü arttıkça test istatistiği büyür ve “p” olasılığı küçülür.

P değeri, istatistiksel analizlerde önemli bir araçtır, ancak tek başına sonuçları yorumlamak için yetersizdir. İstatistiksel anlamlılığın yanı sıra etki büyüklüğü, güven aralığı ve örneklem büyüklüğü gibi diğer faktörleri de göz önünde bulundurarak daha sağlam ve bilinçli yorumlar yapabilirsiniz. Unutmayın, p değeri bir araçtır, ancak sonucunuzun bilimsel önemi hakkında tam bir resim sunmaz.

Kaynakça

Etki Büyüklüğü

Bilimsel Çalışmalarda P-Değerinin Rapor Edilmesi

Bilimsel Araştırmalarda İstatistiksel Anlamlılığın Raporlanmasında Güncel Yaklaşımlar: Hatalar ve Doğrular

P-Value And Statistical Significance: What It Is & Why It Matters