9  Testování hypotéz

Cíle cvičení
  • Znát terminologii testování hypotéz.
  • Umět sestavit a vyhodnotit statistický test.

Testování statistické hypotézy je proces, při kterém na základě dat pocházejících z náhodného výběru ověřujeme úsudek o teoretickém souboru. Pomocí testování hypotéz řešíme například: - srovnání charakteristiky výběrového odhadu parametru \(\theta\) s předpokládanou hodnotou souboru. - vyhodnotit charakter rozdělení náhodné veličiny - vyhodnocení nezávislosti veličin

Zavádíme pojmy nulové \(\mathrm{H}_0\) a alternativní hypotézy \(\mathrm{H}_a\) jako vzájemně vylučující se tvrzení.

Pod testováním hypotéz potom rozumíme proces, který na základě vlastností datové sady rozhodne o zamítnutí, či nezamítnutí nulové hypotézy.

Poznámka

Nulová hypotéza má ve většině případů neutrální až trochu negativní znění. Například “neexistuje rozdíl mezi středními hodnotami”, “testované rozdělení není odlišné od normálního” apod. Její konstrukce víceméně odráží opak toho, co se na sesbíraných datech snažíme vysledovat.

9.1 Postup testování statistické hypotézy:

  1. Formulace nulové \(\mathrm{H}_0\) a alternativní \(\mathrm{H}_a\) hypotézy,
  2. volba hladiny významnosti \(\alpha\),
  3. volba testovací statistiky,
  4. určení kritického oboru testové statistiky,
  5. vyhodnocení testu s pomocí p-hodnoty.

Výsledkem testování je buď a) zamítnutní nulové hypotézy1 b) nezamítnutní nulové hypotézy.

10 Testování hypotéz

Cíle cvičení
  • Znát terminologii testování hypotéz.
  • Umět sestavit a vyhodnotit statistický test.

Testování statistické hypotézy je proces, při kterém na základě dat pocházejících z náhodného výběru ověřujeme úsudek o teoretickém souboru. Pomocí testování hypotéz řešíme například:

  • srovnání výběrového odhadu parametru \(\theta\) s předpokládanou hodnotou v souboru,
  • posouzení charakteru rozdělení náhodné veličiny,
  • vyhodnocení nezávislosti náhodných veličin.

Zavádíme pojmy nulové hypotézy \(\mathrm{H}_0\) a alternativní hypotézy \(\mathrm{H}_a\) jako vzájemně se vylučující tvrzení.

Pod testováním hypotéz potom rozumíme proces, který na základě vlastností datové sady rozhoduje o zamítnutí, nebo nezamítnutí nulové hypotézy.

Poznámka

Nulová hypotéza má ve většině případů neutrální až mírně „negativní“ znění. Například:
„neexistuje rozdíl mezi středními hodnotami“,
„testované rozdělení není odlišné od normálního“ apod.

Její formulace obvykle odráží opak toho, co se na základě dat snažíme prokázat.

10.1 Postup testování statistické hypotézy

  1. formulace nulové \(\mathrm{H}_0\) a alternativní \(\mathrm{H}_a\) hypotézy,
  2. volba hladiny významnosti \(\alpha\),
  3. volba testovací statistiky,
  4. určení kritického oboru testové statistiky,
  5. vyhodnocení testu pomocí p-hodnoty.

Výsledkem testování je buď
a) zamítnutí nulové hypotézy2,
b) nezamítnutí nulové hypotézy.


Rozhodnutí Skutečnost
$$\mathrm{H}_0$$ $$\neg \mathrm{H}_0$$
Nezamítáme $$\mathrm{H}_0$$ Správné rozhodnutí: $$P = 1 - \alpha$$ Chyba II. druhu: $$P = \beta$$
Zamítáme $$\mathrm{H}_0$$ Chyba I. druhu: $$P = \alpha$$ Správné rozhodnutí: $$P = 1 - \beta$$

Síla testu je pravděpodobnost, že je testem zamítnuta nulová hypotéza, která je skutečně neplatná. \(P(\mathrm{zamítneme\:H}_0|\mathrm{H}_0\: \mathrm{neplatí}) = 1-\beta\)

10.2 \(p-\)hodnota

Místo porovnání hodnoty testovacího kritéria s kritickými hodnotami lze pro rozhodování o platnosti či neplatnosti nulové hypotézy použít i tzv. \(p-\)hodnotu (anglicky p-value). Definice \(p-\)hodnoty není zcela triviální.

\(p-\)hodnota je pravděpodobnost, že bychom za předpokladu platnosti nulové hypotézy pozorovali výsledek alespoň tak extrémní, jako je výsledek skutečně naměřený..

10.3 Jednovýběrové testy

Představme si, že hledáme odpověď na otázky typu: “Jaká je střední hodnota souboru?”, “Je střední hodnota souboru výrazně odlišná od očekávání (například na základě teoretického poznání)”? “Jaká je míra nejistoty odhadu této střední hodnoty?”.

10.4 \(100(1-\alpha)\%\) interval spolehlivosti

Vrátíme se krátce k intervalu spolehlivosti z předchozí hodiny.

\[ \bar{x} - 1.96\dfrac{\sigma}{\sqrt{n}}\leq\mu\leq \bar{x} + 1.96\dfrac{\sigma}{\sqrt{n}} \]

\[ \bar{x} - t_{(1-\alpha/2)}(\nu)\dfrac{\sigma}{\sqrt{n}}\leq\mu\leq \bar{x} + t_{(1-\alpha/2)}(\nu)\dfrac{\sigma}{\sqrt{n}} \]

kde \(\nu=n-1\) je počet stupňů volnosti. Kvantil \(t_{\alpha/2}\) lze získat následovně

Kód
alpha <- 0.05
nu <- n - 1
qt(p = (1 - alpha)/2, df = nu)

10.4.1 Příklad 1

V tomto příkladu si ukážeme, jak to vypadá, když dojde k chybě 1. druhu. Dejme tomu, že jsme v průběhu práce sesbírali následující hodnoty: 
2.7012729, 1.948016, 1.8352938, 3.1679424, 0.526072, 2.1859689, 1.065823, 3.3036902, -0.3457034, -0.6952718 
u procesu \(X\sim\mathsf{N}(0; 1)\)

Kód
set.seed(1450070)
xd <- rnorm(10)
curve(dnorm(x), from = -5, to = 5)
rug(xd, lwd = 2)
segments(x0 = mean(xd), 
         x1 = mean(xd), 
         y0 = -0.2, 
         y1 = dnorm(mean(xd)), 
         lwd = 2, 
         col = "orangered",
         xlab = "", 
         ylab = "")
1
V tomto příkladu potřebujeme vygenerovat specifické hodnoty, proto si určíme set.seed()

Data jsme získali s pomocí generátoru pro náhodné rozdělení, budeme předpokládat, že teoretický soubor má náhodné rozdělení s parametry \(\mu=0\) a \(\sigma^2=1\) a ověříme na hladině významnosti \(\alpha=0.05\).

Úloha
  1. Stanovte znění \(\mathrm{H}_0\) a \(\mathrm{H}_a\).
  2. Kolik bude stupňů volnosti?
Kód
t.test(xd, mu = 0)

    One Sample t-test

data:  xd
t = 3.5511, df = 9, p-value = 0.006206
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
 0.5696028 2.5690180
sample estimates:
mean of x 
  1.56931 

Z výsledku testu vyplývá, že p-value \(< \alpha\), proto tedy musíme nulovou hypotézu .

10.4.2 Příklad 2

V předchozím příkladu jsme testovali nulovou hypotézu oproti oboustranné alternativě, tzn. neřešili jsme, zda je střední hodnota menší či větší.

Úloha
  1. S pomocí nápovědy nastavte argumenty funkce t.test() tak, aby byla test proběhl oproti jednostranné alternativě, že je skutečná střední hodnota nižší než 2.
  2. Studentův \(t-\)test lze použít za předpokladu, že data splňují tzv. normalitu. tu lze pro tento soubor snadno ověřit jiným testem - shapiro.test(). \(\mathrm{H}_0\): rozdělení není odlišné od normálního. Zamítneme \(\mathrm{H}_0\) na hladině významnosti \(\alpha=0,1\)?
  3. Zatím jsme použili jednovýběrový \(t-\)test na data pocházející z Normálního rozdělení. V případě, že by naše data nesplňovala předpoklady kladené na tento parametrický test, museli bychom volit neparametrickou variantu testu. Pro test hypotézy o střední hodnotě lze využít neparametrický Wilcoxonův test - wilcox.test(). Rozhodněte o volbě testu a proveďte s pomocí nápovědy test o rovnosti středních hodnot souborů z datové sady temp.csv.

  1. Zamítnutí nulové hypotézy neznamená, že nulová hypotéza ve skutečnosti nemůže platit, ale že získaná data neposkytují dostatečné důkazy pro její platnost.↩︎

  2. Zamítnutí nulové hypotézy neznamená, že nulová hypotéza ve skutečnosti nemůže platit, ale že získaná data neposkytují dostatečné důkazy pro její platnost.↩︎