Kód
<- 0.05
alpha <- n - 1
nu qt(p = (1 - alpha)/2, df = nu)
Testování statistikcké hypotézy je proces, při kterém na základě dat pocházejících z náhodného výběru ověřujeme úsudek o teoretickém souboru. Pomocí testování hypotéz řešíme například: - srovnání charakteristiky výběrového odhadu parametru \(\theta\) s přepokládanou hodnotou souboru. - vyhodnotit charakter rozdělení náhodné veličiny - vyhodnocení nezávislosti veličin
Zavádíme pojmy nulové \(\mathrm{H}_0\) a alternativní hypotézy \(\mathrm{H}_a\) jako vzájemně vylučující se tvrzení.
Pod testováním hypotéz potom rozumíme proces, který na základě vlastností datové sady rozhodne o zamítnutí, či nezamítnutí nulové hypotézy.
Nulová hypotéza má ve většině případů neutrání až trochu negativní znění. Například “neexistuje rozdíl mezi středními hodnotami”, “testované rozdělení není odlišné od normálního” apod. Její konstrukce víceméně odráží opak toho, co se na sesbíraných datech snažíme vysledovat.
Výsledkem testování je buď a) zamítnutní nulové hypotézy1 b) nezamítnutní nulové hypotézy.
Rozhodnutí | Skutečnost | |
$$\mathrm{H}_0$$ | $$\neg \mathrm{H}_0$$ | |
Nazamítáme $$\mathrm{H}_0$$ | Správné rozhodnutí: $$P = 1 - \alpha$$ | Nastává chyba II. druhu: $$P = \beta$$ |
Zamítáme $$\mathrm{H}_0$$ | Chyba I. druhu: $$P = \alpha$$ | Správné rozhodnutí: $$P = 1- \beta$$ |
Síla testu \(\beta\) je pravěpodobnost, že je testem zamítnuta nulová hypotéza, která je skutečně neplatná. \(P(\mathrm{H}_A|\mathrm{H}_A) = 1-\beta\)
Místo porovnání hodnoty testovacího kritéria s kritickými hodnotami lze pro rozhodování o platnosti či neplatnosti nulové hypotézy použít i tzv. \(p-\)hodnotu (anglicky p-value). Definice \(p-\)hodnoty je poněkud obšírná - jedná se o odhad pravděpodobnosti, že daný výsledek nebo výsledek, který je ještě extrémnější než ten pozorovaný, mohl nastat náhodou, za předpokladu, že nulová hypotéza je pravdivá.
Představme si, že hledáme odpověď na otázky typu: “Jaká je střední hodnota souboru?”, “Je střední hodnota souboru výrazně odlišná od očekávání (například na základě teoretického poznání)”? “Jaká je mír nejistoty odhadu této střední hodnoty?”.
Vrátíme se krátce k intervalu spolehlivosti z předchozí hodiny.
\[ \bar{x} - 1.96\dfrac{\sigma}{\sqrt{n}}\leq\mu\leq \bar{x} + 1.96\dfrac{\sigma}{\sqrt{n}} \]
\[ \bar{x} - t_{(1-\alpha/2)}(\nu)\dfrac{\sigma}{\sqrt{n}}\leq\mu\leq \bar{x} + t_{(1-\alpha/2)}(\nu)\dfrac{\sigma}{\sqrt{n}} \]
kde \(\nu=n-1\) je počet stupňů volnosti. Kvantil \(t_{\alpha/2}\) lze získat následovně
<- 0.05
alpha <- n - 1
nu qt(p = (1 - alpha)/2, df = nu)
V tomto příkladu si ukážeme, jak to vypadá, když dojde k chybě 1. druhu. Dejme tomu, že jsme v průběhu práce sesbírali následující hodnoty:
2.7012729, 1.948016, 1.8352938, 3.1679424, 0.526072, 2.1859689, 1.065823, 3.3036902, -0.3457034, -0.6952718
u procesu \(X\sim\mathsf{N}(0; 1)\)
set.seed(1450070)
<- rnorm(10)
xd curve(dnorm(x), from = -5, to = 5)
rug(xd, lwd = 2)
segments(x0 = mean(xd),
x1 = mean(xd),
y0 = -0.2,
y1 = dnorm(mean(xd)),
lwd = 2,
col = "orangered",
xlab = "",
ylab = "")
set.seed()
Data jsme získali s pomocí generátoru pro náhodné rozdělení, budeme předpokládat, že teoretický soubor má náhodné rozdělení s parametry \(\mu=0\) a \(\sigma^2=1\) a ověříme na hladině významnosti \(\alpha=0.05\).
t.test(xd, mu = 0)
One Sample t-test
data: xd
t = 3.5511, df = 9, p-value = 0.006206
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
0.5696028 2.5690180
sample estimates:
mean of x
1.56931
Z výsledku testu vyplývá, že p-value
\(< \alpha\), proto tedy musíme nulovou hypotézu .
V předchozím příkladu jsme testovali nulovou hypotézu oproti oboustranné alternativě, tzn. neřešili jsme, zda je střední hodnota menší či větší.
t.test()
tak, aby byla test proběhl oproti jednostranné alternativě, že je skutečná střední hodnota nižší než 2.shapiro.test()
. \(\mathrm{H}_0\): rozdělení není odlišné od normálního. Zamítneme \(\mathrm{H}_0\) na hladině významnosti \(\alpha=0,1\)?wilcox.test()
. Rozhodněte o volbě testu a proveďte s pomocí nápovědy test o rovnosti středních hodnot souborů z datové sady temp.csv.Zamítnutí nulové hypotézy neznamená, že nulová hypotéza ve skutečnosti nemůže platit, ale získaná data nevykazují objektivní důvody k jejímu přijetí.↩︎