Kód
alpha <- 0.05
nu <- n - 1
qt(p = (1 - alpha)/2, df = nu)Testování statistické hypotézy je proces, při kterém na základě dat pocházejících z náhodného výběru ověřujeme úsudek o teoretickém souboru. Pomocí testování hypotéz řešíme například: - srovnání charakteristiky výběrového odhadu parametru \(\theta\) s předpokládanou hodnotou souboru. - vyhodnotit charakter rozdělení náhodné veličiny - vyhodnocení nezávislosti veličin
Zavádíme pojmy nulové \(\mathrm{H}_0\) a alternativní hypotézy \(\mathrm{H}_a\) jako vzájemně vylučující se tvrzení.
Pod testováním hypotéz potom rozumíme proces, který na základě vlastností datové sady rozhodne o zamítnutí, či nezamítnutí nulové hypotézy.
Nulová hypotéza má ve většině případů neutrální až trochu negativní znění. Například “neexistuje rozdíl mezi středními hodnotami”, “testované rozdělení není odlišné od normálního” apod. Její konstrukce víceméně odráží opak toho, co se na sesbíraných datech snažíme vysledovat.
Výsledkem testování je buď a) zamítnutní nulové hypotézy1 b) nezamítnutní nulové hypotézy.
Testování statistické hypotézy je proces, při kterém na základě dat pocházejících z náhodného výběru ověřujeme úsudek o teoretickém souboru. Pomocí testování hypotéz řešíme například:
Zavádíme pojmy nulové hypotézy \(\mathrm{H}_0\) a alternativní hypotézy \(\mathrm{H}_a\) jako vzájemně se vylučující tvrzení.
Pod testováním hypotéz potom rozumíme proces, který na základě vlastností datové sady rozhoduje o zamítnutí, nebo nezamítnutí nulové hypotézy.
Nulová hypotéza má ve většině případů neutrální až mírně „negativní“ znění. Například:
„neexistuje rozdíl mezi středními hodnotami“,
„testované rozdělení není odlišné od normálního“ apod.
Její formulace obvykle odráží opak toho, co se na základě dat snažíme prokázat.
Výsledkem testování je buď
a) zamítnutí nulové hypotézy2,
b) nezamítnutí nulové hypotézy.
| Rozhodnutí | Skutečnost | |
| $$\mathrm{H}_0$$ | $$\neg \mathrm{H}_0$$ | |
| Nezamítáme $$\mathrm{H}_0$$ | Správné rozhodnutí: $$P = 1 - \alpha$$ | Chyba II. druhu: $$P = \beta$$ |
| Zamítáme $$\mathrm{H}_0$$ | Chyba I. druhu: $$P = \alpha$$ | Správné rozhodnutí: $$P = 1 - \beta$$ |
Síla testu je pravděpodobnost, že je testem zamítnuta nulová hypotéza, která je skutečně neplatná. \(P(\mathrm{zamítneme\:H}_0|\mathrm{H}_0\: \mathrm{neplatí}) = 1-\beta\)
Místo porovnání hodnoty testovacího kritéria s kritickými hodnotami lze pro rozhodování o platnosti či neplatnosti nulové hypotézy použít i tzv. \(p-\)hodnotu (anglicky p-value). Definice \(p-\)hodnoty není zcela triviální.
\(p-\)hodnota je pravděpodobnost, že bychom za předpokladu platnosti nulové hypotézy pozorovali výsledek alespoň tak extrémní, jako je výsledek skutečně naměřený..
Představme si, že hledáme odpověď na otázky typu: “Jaká je střední hodnota souboru?”, “Je střední hodnota souboru výrazně odlišná od očekávání (například na základě teoretického poznání)”? “Jaká je míra nejistoty odhadu této střední hodnoty?”.
Vrátíme se krátce k intervalu spolehlivosti z předchozí hodiny.
\[ \bar{x} - 1.96\dfrac{\sigma}{\sqrt{n}}\leq\mu\leq \bar{x} + 1.96\dfrac{\sigma}{\sqrt{n}} \]
\[ \bar{x} - t_{(1-\alpha/2)}(\nu)\dfrac{\sigma}{\sqrt{n}}\leq\mu\leq \bar{x} + t_{(1-\alpha/2)}(\nu)\dfrac{\sigma}{\sqrt{n}} \]
kde \(\nu=n-1\) je počet stupňů volnosti. Kvantil \(t_{\alpha/2}\) lze získat následovně
alpha <- 0.05
nu <- n - 1
qt(p = (1 - alpha)/2, df = nu)V tomto příkladu si ukážeme, jak to vypadá, když dojde k chybě 1. druhu. Dejme tomu, že jsme v průběhu práce sesbírali následující hodnoty:
2.7012729, 1.948016, 1.8352938, 3.1679424, 0.526072, 2.1859689, 1.065823, 3.3036902, -0.3457034, -0.6952718
u procesu \(X\sim\mathsf{N}(0; 1)\)
set.seed(1450070)
xd <- rnorm(10)
curve(dnorm(x), from = -5, to = 5)
rug(xd, lwd = 2)
segments(x0 = mean(xd),
x1 = mean(xd),
y0 = -0.2,
y1 = dnorm(mean(xd)),
lwd = 2,
col = "orangered",
xlab = "",
ylab = "")set.seed()
Data jsme získali s pomocí generátoru pro náhodné rozdělení, budeme předpokládat, že teoretický soubor má náhodné rozdělení s parametry \(\mu=0\) a \(\sigma^2=1\) a ověříme na hladině významnosti \(\alpha=0.05\).
t.test(xd, mu = 0)
One Sample t-test
data: xd
t = 3.5511, df = 9, p-value = 0.006206
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
0.5696028 2.5690180
sample estimates:
mean of x
1.56931
Z výsledku testu vyplývá, že p-value \(< \alpha\), proto tedy musíme nulovou hypotézu .
V předchozím příkladu jsme testovali nulovou hypotézu oproti oboustranné alternativě, tzn. neřešili jsme, zda je střední hodnota menší či větší.
t.test() tak, aby byla test proběhl oproti jednostranné alternativě, že je skutečná střední hodnota nižší než 2.shapiro.test(). \(\mathrm{H}_0\): rozdělení není odlišné od normálního. Zamítneme \(\mathrm{H}_0\) na hladině významnosti \(\alpha=0,1\)?wilcox.test(). Rozhodněte o volbě testu a proveďte s pomocí nápovědy test o rovnosti středních hodnot souborů z datové sady temp.csv.Zamítnutí nulové hypotézy neznamená, že nulová hypotéza ve skutečnosti nemůže platit, ale že získaná data neposkytují dostatečné důkazy pro její platnost.↩︎
Zamítnutí nulové hypotézy neznamená, že nulová hypotéza ve skutečnosti nemůže platit, ale že získaná data neposkytují dostatečné důkazy pro její platnost.↩︎