I.
Diszkrét eloszlások

Az itt látható eloszlások az 1. ZH-hoz szükségesek.

Adott egy A eseményünk, melynek ki szeretnénk számolni a valószínűségét.

Adott ezen kívül tetszőleges darab B1 … Bn esemény, melyek teljes eseményrendszert alkotnak (vagyis egymást párokban kizárják és az uniójuk az teljes eseményteret (Ω) adja).

A B1 … Bn események valószínűségét ismerjük és azt is, hogy bekövetkezésük esetén mennyi A bekövetkezésének esélye (vagyis sorra mennyi P(A|B1) … P(A|Bn) értékei).

i	P(Bi)	P(A\|Bi)	X

Ekkor ki tudjuk számolni P(A) értékét a következőképp:

P(A) =

Vagyis:

P(A) = =

Ismert P(A), P(B) és P(A|B) valószínűségek esetén kiszámolható vele P(B|A), a következő módon:

Változó	Érték
P(A)
P(B)
P(A\|B)
P(B\|A)

$P (B | A) = \frac{P (A | B) P (B)}{P (A)}$

Ebben az esetben mi magunk adjuk meg kézzel az értékeket, amiket a valvál felvehet és ezek valószínűségeit.

k	P(X=k)	X

E(X) = =

E(X²) = =

D²(X) = E(X²) - E²(X) = - =

D(X) = √D²(X) =

Pl.: "Adott öt tanuló, akik 0.3 valószínűséggel készültek. Mennyi az esélye, hogy közűlük hárman készültek?"

Változó	Érték
n
p
k

Érték	Képlet	Végeredmény
P(X = k)	$(\binom{n}{k}) \cdot p^{k} \cdot (1 - p)^{n - k}$
E(X)	$n p$
D(X)	$\sqrt{n p (1 - p)}$

Adott n alanyunk, melyekre példányonként p valószínűséggel következik be egy esemény. A kérdés, hogy mennyi a valószínűsége, hogy k példányra következik be az esemény.

Pl.: "30% az esélye, hogy nyerek a lottón. Mennyi az esélye, hogy az ötödik szelvényem nyer?"

Változó	Érték
p
k

Érték	Képlet	Eredmény
P(X = k)	$(1 - p)^{k - 1} \cdot p$
E(X)	$\frac{1}{p}$
D(X)	$\sqrt{\frac{1 - p}{p^{2}}}$

Adott egy esemény egyszeri bekövetkezésének valószínűsége, ez p. A kérdés, hogy mennyi a valószínűsége, hogy ez az esemény a k-adik próbálkozásra következik be és nem előtte. Általában onnan felismerhető, hogy a feladat leírásában nem található példányszám.

Pl.: "Egy bagoly egy órán belül átlagosan háromszor huhog. Mennyi az esélye, hogy a következő órában ötször fog huhogni?"

Változó	Érték
λ
k

Érték	Képlet	Eredmény
P(X = k)	$\frac{λ^{k}}{k!} e^{- λ}$
E(X)	λ
D(X)	$\sqrt{λ}$

Olyan esetekben használandó, amikor valamilyen adott mérhető mennyiségen (pl. időtartam) belül adott darab egymástól független esemény következik be átlagosan. A kérdés, hogy mi a valószínűsége, hogy az esemény k alkalommal következik be.

II.
Folyamatos eloszlások

Az itt látható eloszlások az 2. ZH-hoz szükségesek.

Egy esemény bekövetkezésének valószínűségét adja meg x idő elteltével. Az esemény valószínűségének direkt megadása helyett általában az E(X) értékéből számolunk λ értéket, mellyel a képletek használhatóvá válnak.

Változó	Érték
λ
x

Érték	Képlet	Eredmény
f(x)	${\begin{matrix} λ e^{- λ x} & ha x > 0 \\ 0 & k \ddot{u} l \ddot{o} n b e n \end{matrix}$
F(x)	${\begin{matrix} 1 - e^{- λ x} & ha x > 0 \\ 0 & k \ddot{u} l \ddot{o} n b e n \end{matrix}$
E(X)	$\frac{1}{λ}$
D(X)	$\frac{1}{λ}$

Változó	Érték
A
B
P(A < X < B)

Az exponenciális eloszlás rendelkezik még az úgynevezett "örökifjú" tulajdonsággal is. Ezt a következőképp definiáljuk:

$\begin{aligned} P (X > t + s | X > t) & = \frac{P (X > t + s \cdot X > t)}{P (X > t} \\ = \frac{P (X > t + s)}{P (X > t))} \\ = \frac{1 - (1 - e^{- λ (t + s)})}{1 - (1 - e^{- λ t})} \\ = \frac{e^{- λ (t + s)}}{e^{- λ t}} \\ = \frac{e^{- λ t} \cdot e^{- λ s}}{e^{- λ t}} \\ = e^{- λ s} \\ = 1 - (1 - e^{- λ s}) \\ = P (X > s) \end{aligned}$

Vagyis a feltételből következő valószínűség független a feltételtől. Ez az eddigi ZH-kban majdnem mindig előfordult, valami olyasféle módon fogalmazva, hogy "tegyük fel egy buszra már öt perce várunk, mi a valószínűsége, hogy három percen belül érkezik?" Mely esetén nem kell feltételes valószínűséget számolnunk, csupán P(X < 3) értékét.

Természetesen a tulajdonság fordított esetben is érvényes, ekkor a következő képlettel (levezetés nélkül):

$P (X < t + s | X > t) = P (X < s)$

Egy haranggörbével jellemezhető eloszlás, mely a valós számok egész halmazához rendel értéket. Paramétereiként meg kell adnunk a várható értéket (m) és a szórást (σ). Használjuk például arra, hogy gyártósorok selejtes termékeinek arányát vagy a várt értéktől való eltérés valószínűségét megbecsüljük.

Mivel egy tetszőleges normál eloszlás sűrűség- és eloszlásfüggvényét egy improprius integrállal tudnánk csak kiszámolni, így helyette bevezetésre kerül az úgynevezett Fi függvény (Φ(X)), mely standardizált (vagyis melyre igaz, hogy m = 0 és σ = 1) normális eloszlások x értékeihez rendeli hozzá azok valószínűségéit. Ehhez a következő képletet alkalmazzuk:

$F (x) = Φ (\frac{x - m}{σ})$

Bár a standardizált normális eloszlás rendelkezik egy az eloszlásfüggvényhez hasonló kis-Fi-vel jelölt sűrűségfüggvénnyel is, ezt nem igazán használjuk az egyetemen, így itt nem kerül bemutatásra.

Változó	Érték
m
σ
x

Érték	Képlet	Eredmény
f(x)	$φ (\frac{x - m}{σ})$	-
F(x)	$Φ (\frac{x - m}{σ})$
E(X)	m
D(X)	σ

Változó	Érték
A
B
P(A < X < B)

Akad eset, hogy azt kérdezik tőlünk, hogy X mikor esik a várható értéktől egy adott sugarú távolságon belülre. Ennek képletét a következőképp írhatjuk fel, ahol Δ a sugár és p pedig a valószínűség:

$P (| X - m | < Δ) = p$

Ha minket Δ értéke érdekel, azt a következőképp tudjuk kiszámolni, ahol Φ^-1-nél a táblázat egy értékéhez keressük a sor és oszlopból eredő számot (vagyis pl. 0.9 esetén 1.28-ot kapunk, mivel Φ(1.28) = 0.8779):

$\begin{aligned} P (| X - m | < Δ) & = p \\ P (- Δ < X - m < Δ) & = p \\ P (- \frac{Δ}{σ} < X^{*} < \frac{Δ}{σ}) & = p \\ Φ (\frac{Δ}{σ}) - Φ (- \frac{Δ}{σ}) & = p \\ Φ (\frac{Δ}{σ}) - (1 - Φ (\frac{Δ}{σ})) & = p \\ 𝟐 𝚽 (\frac{𝚫}{𝛔}) - 𝟏 & = p \\ Φ (\frac{Δ}{σ}) & = \frac{p + 1}{2} \\ \frac{Δ}{σ} & = Φ^{- 1} (\frac{p + 1}{2}) \\ Δ & = σ \cdot Φ^{- 1} (\frac{p + 1}{2}) \end{aligned}$

Érdemes a vastagított képletet megjegyezni csak, mivel annak segítségével akár a p értékét, akár a Δ-t megkaphatjuk.

Olyan eloszlás, melynek eloszlásfüggvénye lineárisan növekszik két érték (a és b) között. A sűrűségfüggvénye emiatt a és b között egy x-től nem függő konstans, azon kívül pedig nulla.

Érték	Képlet	Eredmény
f(x)	${\begin{matrix} \frac{1}{b - a} & ha a \leq x \leq b \\ 0 & k \ddot{u} l \ddot{o} n b e n \end{matrix}$
F(x)	${\begin{matrix} 0 & ha x < a \\ \frac{x - a}{b - a} & ha a \leq x \leq b \\ 1 & ha b < x \end{matrix}$
E(X)	$\frac{a + b}{2}$
D(X)	$\frac{b - a}{\sqrt{12}}$

Változó	Érték
a
b
x

Változó	Érték
A
B
P(A < X < B)

Adott egy tetszőleges eloszlás melynek ismerjük a várható értékét (E(X)) és szórását (D(X)) és melyet n alkalommal mérünk.

Kellően nagy n esetén az eredeti eloszlástól függetlenül az egyes példányok összege és átlaga tetszőleges pontossággal megközelít egy-egy normális eloszlást az alább látható szabályok szerint.

Változó	Érték
E(X)
D(X)
n
x

Típus	Eloszlás	F(x)
Összeg	$\sum X \approx N (n m; σ \sqrt{n})$
Átlag	$X \approx N (m; \frac{σ}{\sqrt{n}})$

Segítségével durva becslést tudunk adni, hogy egy valószínűségi változó mennyire tér el annak várható értékétől.

$\begin{matrix} P (| X - E (X) | < k) \geq 1 - \frac{D^{2} (X)}{k^{2}} \\ P (| X - E (X) | \geq k) \leq \frac{D^{2} (X)}{k^{2}} \end{matrix}$

Változó	Érték
E(X)
D(X)
k

Változat	Eredmény
< k
≥ k

A Nagy Számok Törvénye kétféle dologra enged becslést adnunk.

Egyrészt megbecsülhetjük, hogy egy eloszlás relatív gyakorisága (vagyis a sikeres kísérletek száma (k) osztva az összes kísérlet számával (n)) mennyire közelíti meg a elméleti valósnűséget (p). Az elméleti valószínűségtől való távolság sugarát kis epszilonnal (ϵ) jelöljük.

$\begin{aligned} P (| \frac{k}{n} - p | < ϵ) & \geq 1 - \frac{p (1 - p)}{n ϵ^{2}} \\ \geq 1 - \frac{1}{4 n ϵ^{2}} \\ \geq P \end{aligned}$

Lássuk be, hogy bármely p érték esetén p(1 - p) ≤ 1/4, így a fent látható második egyenlőtlenség p értékétől függetlenül minden esetben fennáll.

Tetszőleges P alsó határ (vigyázz, ez nagy P, nem a kis p, az elméleti valószínűség!) és adott n vagy ϵ esetén meg tudjuk határozni a másik alsó határát:

$\begin{aligned} 1 - \frac{1}{4 n ε^{2}} & \geq P \\ - \frac{1}{4 n ε^{2}} & \geq P - 1 \\ \frac{1}{4 n ε^{2}} & \leq 1 - P \\ \frac{1}{4 ε^{2} (1 - P)} \leq n & vagy \frac{1}{\sqrt{4 n (1 - P)}} \leq ε \end{aligned}$

Változó	Értéke
n
ϵ
P

Lehetőségünk van ezen kívül azt is megbecsülnünk, hogy X eloszlás n példányának átlaga (melyet itt "kalapos" X-el jelölök) mekkora valószínűséggel esik a várható értéktől (m) egy ϵ sugarú tartományba.

$P (| \hat{X} - m | < ε) \geq 1 - \frac{σ^{2}}{n ε^{2}}$

Mivel rengeteg féle variáció van erre a két egyenlőtlenségre, nem tudok mindegyikhez kalkulátort ide tenni, így remélem a levezetés legalább segít.

III.
Konfidenciaintervallumok

A vizsgához szükségesek.

Adott X valószínűségi változó, melyet egy a méréseinket tartalmazó listával jellemzünk. Például:

Elem	Érték
X

Jel	Képlet	Érték
X	$\frac{\sum_{i = 1}^{n} X_{i}}{n}$
S_n	$\sqrt{\frac{1}{n} \sum_{i = 1}^{n} (X_{i} - X)^{2}}$
S^*_n	$\sqrt{\frac{n}{n - 1} S_{n}^{2}}$

Ekkor:

X jelöli a méréseinkből számolt átlagot.
S_n az úgynevezett empirikus szórást, mely egy torzított becslést ad az eloszlásunk szórására.
S^*_n pedig a korrigált tapasztalati szórás, mely egy torzítatlan becslést ad a szórásra.

Adott számunkra egy n elemű lista, mely egy normális eloszlás méréseiből áll. Az eloszlás szórása ismert számunkra (σ₀-val jelöljük), azonban a várható érték (m) nem. Szeretnénk meghatározni, hogy az ismert adatok alapján m milyen tartományba (úgynevezett konfidenciaintervallumba) esik bizonyos valószínűséggel.

Ehhez először is meg kell határoznunk egy ε értéket, melyet 1-ből kivonva megkapjuk a konfidenciaintervallum valószínűségét. Például 95%-os konfidenciaintervallum esetén (vagyis ε = 0.05) a következő áll fenn:

$P (alsó határ < m < felső határ) = 0.95$

Ahhoz, hogy ezt az alsó és felső határt megkaphassuk, a következő két képletet kell kiszámolnunk:

$[X - u_{ϵ} \frac{σ_{0}}{\sqrt{n}}; X + u_{ϵ} \frac{σ_{0}}{\sqrt{n}}]$

Adott ε esetén u_ε a következőképp számolható:

$\begin{aligned} 2 Φ (u_{ϵ}) - 1 & = 1 - ϵ \\ Φ (u_{ϵ}) & = \frac{2 - ϵ}{2} \\ Φ (u_{ϵ}) & = 1 - \frac{ϵ}{2} \\ u_{ϵ} & = Φ^{- 1} (1 - \frac{ϵ}{2}) \end{aligned}$

Minnél nagyobbra vesszük ε-t, annál pontosabb határokat kapunk (vagyis a felső és alsó határ egyre jobban közelít egymáshoz), azonban a pontosságért cserébe egyre kevésbé valószínűbb, hogy a várható érték valóban ebbe a tartományba is esik.

A határokat pontosíthatjuk még a lista elemszámának bővítésével, hisz ekkor n egyre nagyobbá válik, így a határokban szereplő kivont/hozzádott érték csökken. Ekkor a valószínűség nem változik, viszont mivel általában adott számunkra a lista, így ez a módszer nem használható gyakran.

Adott számunkra egy n elemű lista, mely egy normális eloszlás méréseiből áll. Az eloszlásnak se a szórását, se a várható értékét (m) nem ismerjük és az utóbbira szeretnénk egy becslést adni, hogy milyen tartományba esik bizonyos valószínűséggel (vagyis mekkora az eloszlás várható értékének bizonyos valószínűségű konfidenciaintervalluma).

Ehhez az előző esethez hasonlóan meghatározunk egy ε értéket, melyet 1-ből kivonva megkapjuk a konfidenciaintervallum valószínűségét. Ekkor az alsó és felső határt a következőképp számolhatjuk:

$[X - t_{ϵ} \frac{S_{n}^{*}}{\sqrt{n}}; X + t_{ϵ} \frac{S_{n}^{*}}{\sqrt{n}}]$

t_ε értékét a Student-eloszlás táblázatából kell kinéznünk. A számunkra megfelelő érték a táblázat n-1. sorában és ε. oszlopában lesz található. A korrigált tapasztalati szórás (S^*_n) kiszámolása az Alapok fül alatt található.

Fontos megjegyezni, hogy mivel ebben az esetben egy "becslés becslésével" van dolgunk (hisz a szórás maga is csupán véges sok adatból lett kiszámolva), így az itt kapott határok közötti eltérés a megadott szórásos esethez képest nagyobb lesz ugyanazon n darabszám esetén, hisz kevesebb konkrét adattal dolgoztunk.

Adott számunkra egy n elemű lista, mely egy normális eloszlás méréseiből áll. Meg szeretnénk becsülni az eloszlás szórása adott valószínűséggel milyen tartományba esik (vagyis mi a szórás konfidenciaintervalluma).

Ehhez a fentebb leírtak alapján ismét meghatározunk egy ε értéket, azonban máshogy számolunk vele mint eddig. Meg kell határoznunk két értéket, c₁ és c₂-t, melyeket a következő módon kapunk meg:

meghatározzuk ε / 2 és 1 - (ε / 2) értékeit,
kikeressük a Khi-négyzet (Х²) táblázat n-1. sorát és hozzá a két fentebb kiszámolt értékhez tartozó oszlopát,
a nagyobbik érték lesz c₂, a kisebbik c₁.

Az így kapott értékekből és a korrigált tapasztalati szórásból (S^*_n) a következőképp tudunk konfidenciaintervallumot számolni a szóráshoz:

$[\sqrt{n - 1} \cdot \frac{S_{n}^{*}}{\sqrt{c_{2}}}; \sqrt{n - 1} \cdot \frac{S_{n}^{*}}{\sqrt{c_{1}}}]$

IV.
Hipotézisvizsgálat

Hipotézisvizsgálatnak nevezezzük azt, amikor egy vagy több adathalmazról feltételezünk valamit (például, hogy mennyi a várható értéke) és ezen feltételezés helyességének a valószínűségét számszerűsíteni próbáljuk. A feltételezésünk az úgynevezett nullhipotézis (H₀), míg annak ellentéte vagy tagadása H₁.

Ahhoz, hogy el tudjuk dönteni H₀-t elfogadjuk vagy elvetjük, egy statisztikai próbát végzünk, melynek során általunk meghatározott pontossággal tudjuk megmondani mennyire is szeretnénk biztosak lenni abban, hogy a feltételezés helytálló. Ennek a pontosságnak a neve a szignifikancia szint és ε-al jelöljük. Például, ha ε = 0.05 és a statisztikai próba alapján H₀-t elfogadjuk, akkor az 95%-os valószínűséggel valóban igaz.

Ha H₀ igaz és mi ennek ellenére elvetettük, akkor úgynevezett elsőfajú hibát vétettünk, melynek nagysága megegyezik a szignifikancia szinttel, vagyis jelen esetben 5%. Ha viszont elfogadjuk H₀-t annak ellenére, hogy az hamis, akkor pedig másodfajú hibát követünk el. Ennek az értékét nem számoljuk egyetemen.

Fontos megjegyezni, hogy minnél inkább csökkentjük "manuálisan" az elsőfajú hiba értékét (vagyis ε értékét minnél kisebbre vesszük), a másodfajú hiba annál inkább nő. Helyette, ha kisebb elsőfajú hibát akarunk, akkor azt a minták számának növelésével tudjuk elérni.

	`H₀` igaz	`H₁` igaz
`H₀` elfogadva	Minden rendben	Másodfajú hiba
`H₁` elfogadva	Elsőfajú hiba	Minden rendben

A statisztikai próbához pedig először is meg kell határoznunk a szignifikancia szint és a rendelkezésre álló adatok száma alapján egy u_ε / t_ε értéket, mely mellé kell számolnunk egy u_n-1 / t_n-1 értéket is. Ennek mikéntjét a következő két fejezet mutatja be. Az így kapott szám abszolútértékét össze kell hasonlítanunk u_ε / t_ε-al és, ha kisebb, elfogadjuk H₀-t. Tehát,

$\begin{aligned} | t_{n - 1} | < t_{ϵ} & ⟹ H_{0} -t elfogadjuk \\ | t_{n - 1} | \geq t_{ϵ} & ⟹ H_{0} -t elvetjük \end{aligned}$

Adott egy adathalmazunk, amiről feltételezzük, hogy normális eloszlásból származik. Szeretnénk megbizonyosodni afelől, hogy ennek a normális eloszlásnak egy adott m a várható értéke (E(X)). Ezt nevezzük kétoldali t-próbának, mivel a hiba a normális eloszlás görbéjének mindkét oldalán megjelenik. Tehát,

$\begin{matrix} H_{0} : E (X) = m \\ H_{1} : E (X) \neq m \end{matrix}$

Ennek eldöntéséhez ki kell számolnunk t_n-1 értékét, mely a következő képlettel lehetséges:

$t_{n - 1} = \frac{X - m}{S_{n}^{*}} \sqrt{n}$

t_ε értékét pedig a táblázat n-1 sorából és a szignifikancia szintnek megfelelő oszlopából nézzük ki.

Példa kétoldali t-próbára

Adott számunkra egy normális eloszlásból származó adathalmaz, mely tíz uborkának a hosszát tartalmazza milliméterben:

Meg szeretnénk határozni 5%-os szignifikancia szint mellett, hogy kimondhatjuk-e, hogy az uborkák hosszának várható értéke 60 mm?

Először is határozzuk meg a két hipotézisünk:

$\begin{matrix} H_{0} : E (X) = 60 \\ H_{1} : E (X) \neq 60 \end{matrix}$

Ahhoz, hogy eldönthessük ezek közül melyiket fogadjuk el, számoljuk ki a tapasztalati átlagot és a korrigált szórást:

$\begin{aligned} X & = \frac{\sum_{i = 1}^{n} X_{i}}{n} & = 56.2 \\ S_{n}^{2} & = \frac{\sum_{i = 1}^{n} X_{i}^{2}}{n} - X^{2} & = 4.91 \\ S_{n}^{*} & = \sqrt{\frac{n}{n - 1} S_{n}^{2}} & = 5.18 \end{aligned}$

Ezek segítségével ki tudjuk számolni t₉ értékét:

$\begin{aligned} t_{9} & = \frac{X - m}{S_{n}^{*}} \sqrt{n} \\ = \frac{56.2 - 60}{5.18} \sqrt{10} \\ = - 2.32 \end{aligned}$

Végül meghatározzuk t_0.05 értékét, melyhez a 9. sor és a 0.05 oszlop elemét vesszük és összehasonlítjuk az előbb kapott értékkel:

$\begin{matrix} t_{9} = - 2.32; t_{0.05} = 2.26 \\ | - 2.32 | > 2.26 ⟹ H_{0} -t elvetjük \end{matrix}$

Mivel H₀-t elvetettük, így kimondhatjuk, hogy 5% szignifikancia szint mellett nem állíthatjuk, hogy az uborkák várható értéke 60 mm lenne.

Ha viszont 2%-os hibát engedtünk volna csak meg magunknak, akkor:

$\begin{matrix} t_{9} = - 2.32; t_{0.02} = 2.82 \\ | - 2.32 | < 2.82 ⟹ H_{0} -t elfogadjuk \end{matrix}$

Ebben az esetben mivel a nullhipotézist elfogadtuk, így kimondhatjuk, hogy 2%-os szignifikancia szint mellett az uborkák várható hossza 60 mm.

Lehetőségünk van ezen kívül olyan t-próbát is elvégezni, melyben E(X)-t nem egy konkrét értéknek feltételezzük, hanem, hogy egy bizonyos értéknél nagyobb vagy kisebb. Ezt nevezzük egyoldali t-próbának. Legyen ez az érték ismét m. Ekkor a hipotéziseink a következők:

$\begin{matrix} H_{0} : E (X) \leq m \\ H_{1} : E (X) > m \end{matrix}$

Vigyázz: Még akkor is, ha a feladat arra kér t-próbát, hogy a várható érték nagyobb mint m, a H₀ mindig az E(X) ≤ m ágat kapja. Tehát az ilyen feladatoknál valójában azt kell megvizsgálnunk, hogy el tudjuk-e vetni a nullhipotézist!

Ennél az esetnél mivel a hiba a normális eloszlás egyik oldalára esik csak, így t_ε megválasztásakor ugyanúgy az n-1 sor, de a szignifikancia szint kétszeresének oszlopát kell választanunk. Tehát, például ha 5%-os, vagyis 0.05-ös szignifikancia szinttel dolgozunk, akkor a 0.1-es oszlopot kell vizsgálnunk!

Példa egyoldali t-próbára

Megkérdeztünk hat diákot, hogy mennyi kávét ittak vizsgára készülés közben. A következő válaszokat adták literben:

1.3

0.0

0.8

1.4

0.9

0.7

Igaz-e, hogy átlagosan több mint fél litert ittak? Adjuk meg a hipotéziseket és döntsünk 5%-os szinten!

Ekkor a hipotéziseink a következők:

$\begin{matrix} H_{0} : E (X) \leq 0.5 \\ H_{1} : E (X) > 0.5 \end{matrix}$

Ahogy fentebb említettem, hiába érdekel minket, hogy fél liternél többet ittak, a H₀ hipotézis mégis a kisebb vagy egyenlő ágat kapja.

Következőleg kiszámoljuk a tapasztalati átlagot és korrigált szórást:

$\begin{aligned} X & = \frac{\sum_{i = 1}^{n} X_{i}}{n} & = 0.8500 \\ S_{n}^{2} & = \frac{\sum_{i = 1}^{n} X_{i}^{2}}{n} - X^{2} & = 0.2092 \\ S_{n}^{*} & = \sqrt{\frac{n}{n - 1} S_{n}^{2}} & = 0.5098 \end{aligned}$

(Itt csupán a következetesség miatt van ilyen részletesen leírva a folyamat, élesben a számológép mindkét lényegi értéket gombnyomásra számítja.)

Számítsuk most ki t₅ értékét:

$\begin{aligned} t_{5} & = \frac{X - m}{S_{n}^{*}} \sqrt{n} \\ = \frac{0.85 - 0.5}{0.5098} \sqrt{6} \\ = 1.711 \end{aligned}$

t_ε pedig a táblázat 5. sorának és 0.1-es oszlopának felel meg, hisz, ahogy fentebb leírtam, egyoldali próbánál a szignifikancia szint kétszeresének megfelelő oszlop alapján számolunk.

$\begin{matrix} t_{5} = 1.711, t_{0.1} = 2.015 \\ | 1.711 | < 2.015 ⟹ H_{0} -t elfogadjuk. \end{matrix}$

Mivel elfogadtuk a nullhipotézist, így H₁ elvetésre került, tehát kimondhatjuk, hogy 5%-os szignifikancia szint mellett a hallgatók átlagosan nem ittak többet mint fél liter kávé.

Adott egy adathalmazunk, melyről szeretnénk eldönteni, hogy egy bizonyos eloszlásból származik-e. Erre ad lehetőséget az úgynevezett Illeszkedésvizsgálat. Ekkor először is felbontjuk az adathalmazunk annyi esetre, ahány különféle értéket felvehet a várt eloszlásunk és meghatározzuk ezeknek az eseteknek a valószínűségét.

Az így kapott adatokból táblázatot alkotunk, majd ez alapján meghatározzuk a mintához tartozó Х² értéket a következő képlettel:

$χ^{2} = \sum_{i = i}^{n} \frac{(μ_{i} - n p_{i})^{2}}{n p_{i}}$

Majd végül ennek a számnak az abszolútértékét összehasonlítjuk a Х² táblázat részre bontások - 1. sorával és szignifikancia szintedik oszlopával és ha kisebb, akkor H₀-t elfogadjuk, vagyis az adathalmaz valóban illeszkedik a kívánt eloszlásra.

Példa érmék eloszlásának illesztésvizsgálatára

Adott egy érménk, amit 250 alkalommal feldobunk, megszámolva a fejek és írások számát. Az előbbi 140 alkalommal történt meg, az utóbbi 110. Döntsük el, hogy az érme fair-e (tehát 50-50% hogy egy dobás melyik oldalra esik)!

Először is írjuk fel a két hipotézist:

$\begin{matrix} H_{0} : P (X = fej) = \frac{1}{2} \\ H_{1} : P (X = fej) \neq \frac{1}{2} \end{matrix}$

Ahhoz, hogy számolni tudjunk, vegyük táblázatba a megadott adatokat esetekre bontva és azt is, hogy az egyes esetek számára milyen értékeket várnánk, ha valóban a megadott eloszlásból lettek volna mintavételezve:

	Fej	Írás
μ_i	140	110
np_i	125	125

Ekkor felhasználva a fent leírt képletet a következő Х² értéket kapjuk:

$\begin{aligned} χ^{2} & = \sum_{i = 1}^{n} \frac{(μ_{i} - n p_{i})^{2}}{n p_{i}} \\ = \frac{15^{2}}{125} + \frac{- 15^{2}}{125} \\ = 3.6 \end{aligned}$

Végül megkeressük a Х² táblából a 1. sor (mivel két részre osztottuk az adathalmazunk) és 0.05-höz tartozó oszlopot és összehasonlítjuk az előbb kapott értékkel:

$\begin{matrix} χ^{2} = 3.6, χ_{0.05}^{2} = 3.84 \\ | 3.6 | < 3.84 ⟹ H_{0} -t elfogadjuk \end{matrix}$

Tehát 5% hibával kimondhatjuk, hogy az érme fair.

I.Diszkrét eloszlások