9 Testování hypotéz

Testování statistikcké hypotézy je proces, při kterém na základě dat pocházejících z náhodného výběru ověřujeme úsudek o teoretickém souboru.

Zavádíme pojmy nulové $\mathrm{H}_0$ a alternativní hypotézy $\mathrm{H}_a$.

Pod testováním hypotéz potom rozumíme proces, který na základě vlastností datové sady rozhodne o zamítnutí, či nezamítnutí nulové hypotézy.

Poznámka

Nulová hypotéza má ve většině případů neutrání až trochu negativní znění. Například “neexistuje rozdíl mezi středními hodnotami”, “testované rozdělení není odlišné od normálního” apod. Její konstrukce víceméně odráží opak toho, co se na sesbíraných datech snažíme vysledovat.

9.1 Postup testování statistické hypotézy:

Formulace nulové $\mathrm{H}_0$ a alternativní $\mathrm{H}_a$ hypotézy,
volba hladiny významnosti $\alpha$,
volba testovací statistiky,
určení kritického oboru testové statistiky,
vyhodnocení testu s pomocí p-hodnoty.

Výsledkem testování je buď a) zamítnutní nulové hypotézy¹ b) nezamítnutní nulové hypotézy.

Rozhodnutí	Skutečnost
Rozhodnutí	$$\mathrm{H}_0$$	$$\neg \mathrm{H}_0$$
Nazamítáme $$\mathrm{H}_0$$	Správné rozhodnutí: $$P = 1 - \alpha$$	Nastává chyba II. druhu: $$P = \beta$$
Zamítáme $$\mathrm{H}_0$$	Chyba I. druhu: $$P = \alpha$$	Správné rozhodnutí: $$P = 1- \beta$$

Síla testu $\beta$ je pravěpodobnost, že je testem zamítnuta nulová hypotéza, která je skutečně neplatná. $P(\mathrm{H}_A|\mathrm{H}_A) = 1-\beta$

9.2 $p-$hodnota

Místo porovnání hodnoty testovacího kritéria s kritickými hodnotami lze pro rozhodování o platnosti či neplatnosti nulové hypotézy použít i tzv. $p-$hodnotu (anglicky p-value). Definice $p-$hodnoty je poněkud obšírná - jedná se o odhad pravděpodobnosti, že daný výsledek nebo výsledek, který je ještě extrémnější než ten pozorovaný, mohl nastat náhodou, za předpokladu, že nulová hypotéza je pravdivá.

9.3 Jednovýběrové testy

Představme si, že hledáme odpověď na otázky typu: “Jaká je střední hodnota souboru?”, “Je střední hodnota souboru výrazně odlišná od očekávání (například na základě teoretického poznání)”? “Jaká je mír nejistoty odhadu této střední hodnoty?”.

9.4 $100(1-\alpha)\%$ interval spolehlivosti

Vrátíme se krátce k intervalu spolehlivosti z předchozí hodiny.

\[ \bar{x} - 1.96\dfrac{\sigma}{\sqrt{n}}\leq\mu\leq \bar{x} + 1.96\dfrac{\sigma}{\sqrt{n}} \]

\[ \bar{x} - t_{(1-\alpha/2)}(\nu)\dfrac{\sigma}{\sqrt{n}}\leq\mu\leq \bar{x} + t_{(1-\alpha/2)}(\nu)\dfrac{\sigma}{\sqrt{n}} \]

kde $\nu=n-1$ je počet stupňů volnosti. Kvantil $t_{\alpha/2}$ lze získat následovně

Kód

alpha <- 0.05
nu <- n - 1
qt(p = (1 - alpha)/2, df = nu)

9.4.1 Příklad 1

V tomto příkladu si ukážeme, jak to vypadá, když dojde k chybě 1. druhu. Dejme tomu, že jsme v průběhu práce sesbírali následující hodnoty:
2.7012729, 1.948016, 1.8352938, 3.1679424, 0.526072, 2.1859689, 1.065823, 3.3036902, -0.3457034, -0.6952718
u procesu $X\sim\mathsf{N}(0; 1)$

Kód

set.seed(1450070)
xd <- rnorm(10)
curve(dnorm(x), from = -5, to = 5)
rug(xd, lwd = 2)
segments(x0 = mean(xd), 
         x1 = mean(xd), 
         y0 = -0.2, 
         y1 = dnorm(mean(xd)), 
         lwd = 2, 
         col = "orangered",
         xlab = "", 
         ylab = "")

1: V tomto příkladu potřebujeme vygenerovat specifické hodnoty, proto si určíme set.seed()

Data jsme získali s pomocí generátoru pro náhodné rozdělení, budeme předpokládat, že teoretický soubor má náhodné rozdělení s parametry $\mu=0$ a $\sigma^2=1$ a ověříme na hladině významnosti $\alpha=0.05$.

Úloha

Stanovte znění $\mathrm{H}_0$ a $\mathrm{H}_a$.
Kolik bude stupňů volnosti?

Kód

t.test(xd, mu = 0)


    One Sample t-test

data:  xd
t = 3.5511, df = 9, p-value = 0.006206
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
 0.5696028 2.5690180
sample estimates:
mean of x 
  1.56931

Z výsledku testu vyplývá, že p-value $< \alpha$, proto tedy musíme nulovou hypotézu

9.4.2 Příklad 2

V předchozím příkladu jsme testovali nulovou hypotézu oproti oboustranné alternativě, tzn. neřešili jsme, zda je střední hodnota menší či větší.

Úloha

S pomocí nápovědy nastavte argumenty funkce t.test() tak, aby byla test proběhl oproti jednostranné alternativě, že je skutečná střední hodnota nižší než 2.
Studentův $t-$test lze použít za předpokladu, že data splňují tzv. normalitu. tu lze pro tento soubor snadno ověřit jiným testem - shapiro.test(). $\mathrm{H}_0$: rozdělení není odlišné od normálního. Zamítneme $\mathrm{H}_0$ na hladině významnosti $\alpha=0,1$?
Zatím jsme použili jedovýběrový $t-$test na data pocházející z Normálního rozdělení. V případě, že by naše data nesplňovala předpoklady kladené na tento parametrický test, museli bychom volit neparametrickou variantu testu. Pro test hypotézy o střední hodnotě lze využít neparametrický Wilcoxonův test - wilcox.test(). Rozhodněte o volbě testu a proveďte s pomocí nápovědy test o rovnosti středních hodnot souborů z datové sady temp.csv.

Zamítnutí nulové hypotézy neznamená, že nulová hypotéza ve skutečnosti nemůže platit, ale získaná data nevykazují objektivní důvody k jejímu přijetí.↩︎

9 Testování hypotéz

9.1 Postup testování statistické hypotézy:

9.2 \(p-\)hodnota

9.3 Jednovýběrové testy

9.4 \(100(1-\alpha)\%\) interval spolehlivosti

9.4.1 Příklad 1

9.4.2 Příklad 2