Od prawa małych liczb do wielkich wniosków

Czyli: wszyscy jesteśmy statystykami

„Zapadalność na raka nerek  we wszystkich 3141 hrabstwach USA jest najniższa głównie w wiejskich, rzadko zaludnionych obszarach stanów Środkowego Zachodu, Zachodu i Południa, gdzie tradycyjnie głosuje się na Partię Republikańską.” Jak należy to interpretować? Jeśli dobrze działa u ciebie mechanizm „intuicyjnej statystyki” to prawdopodobnie odrzuciłeś interpretację, że przed rakiem chronią poglądy republikańskie. Za to hipoteza […]

magento-statistics

„Zapadalność na raka nerek  we wszystkich 3141 hrabstwach USA jest najniższa głównie w wiejskich, rzadko zaludnionych obszarach stanów Środkowego Zachodu, Zachodu i Południa, gdzie tradycyjnie głosuje się na Partię Republikańską.”

Jak należy to interpretować?

Jeśli dobrze działa u ciebie mechanizm „intuicyjnej statystyki” to prawdopodobnie odrzuciłeś interpretację, że przed rakiem chronią poglądy republikańskie. Za to hipoteza wyjaśniająca badania, wskazująca, iż niska zapadalność na raka wiąże się z czystością środowiska i ekologią wiejskich okolic – wydała ci się prawdopodobna, bo to zdrowy tryb życia, czyste powietrze itp., itd.

close up of business team sitting at table

„Ma to sens” – powtarzasz sobie

Weźmy pod uwagę teraz hrabstwa, w których zapadalność na raka nerek jest najwyższa. Jak się okazuje – są to także tereny wiejskie, rzadko zaludnione i położone w tradycyjnie republikańskich stanach USA.

Jak komentują te wyniki Wainer i Zwerling (od których z resztą pożyczam ten przykład): „Łatwo byłoby wywnioskować, że więcej zachorowań na raka wiąże się z kiepskim dostępem do opieki medycznej, tłustą dietą i nadużywaniem alkoholu  (a to przecież nieodłączne elementy „stylu życia” w małych miasteczkach).”

Coś tu nie gra

Przytoczone badania nie dotyczą epidemiologii, ale trudności, jakich nastręcza naszemu umysłowi statystyka. A umysł rozwiązuje je, tworząc zależności przyczynowo-skutkowe tam, gdzie ich nie ma.

Dodatkowo, przytoczone badania pokazują tzw. prawo małych prób – wiemy, że jeśli grupa badana jest mała, to ryzyko potwierdzenia nieprawdziwej hipotezy jest duże. To tak jak z często przywoływanym przykładem kulek. Jeśli mamy w urnie 1000 kulek białych i 1000 kulek czarnych, to do potwierdzenia „matematycznego” wyniku 50%  szansy na wylosowanie każdej z kulek zbliżymy się mniej, jeśli losować będziemy tylko 3 razy, a bardziej, kiedy tych losowań będzie coraz „bliżej” dwóch tysięcy.

9fd1b6522acf242e93b442e72f5689fc

Według amerykańskich naukowców…

Zawsze z wielką atencją, ale – przyznam – podszytą ironią, traktowałam „odkrycia” czy wyniki badań amerykańskich naukowców. Ale co teraz?

  1. Może „amerykańscy naukowcy” mają rację, a moje niedowierzanie to wynik mojej „intuicji statystycznej” (która – jak widzimy – sprowadza często na manowce)
  2. Może „amerykańscy naukowcy” też ulegają swojej statystycznej intuicji
  3. Może próba badana była za mała

 

A może te 3 powody plus kilka innych.

I co teraz? Gdzie szukać prawdy dotyczącej tego „jak jest”?