Todennäköisyys ja tilastot


Todennäköisyyslaskenta ja tilastotiede

Diskreetin tilastollisen jakauman tunnuksia

Jakauman muodostavat luvut x1 , x2 , … , xn.
Keskilukuja
1. Keskiarvo
    \bar{x}=\frac{\sum_{i=1}^{n}{x}_{i}}{n}=\frac{\sum x}{n}
2. Keskiarvo väliaikaisen keskiarvon \bar{x}' avulla laskettuna
  \bar{x}=\bar{x}'+\frac{\sum_{i=1}^{n}({x}_{i}-\bar{x}')}{n}=\bar{x}'+\bar{d} ({d}_{i}={x}_{i}-\bar{x}')
3. Painotettu
    keskiarvo
 \bar{x}=\frac{\sum_{i=1}^{n}({a}_{i}{x}_{i})}{\sum_{i=1}^{n}{a}_{1}}=\frac{\sum ax}{\sum a}(ai on xi :n painokerroin)
4. Tyyppiarvo eli moodi Mo on se jakauman luku (tai luvut), jolla on suurin
     frekvenssi. 
5. Mediaani Md on suuruusjärjestykseen lajitellun jakauman keskimmäinen luku.
    Jos lukuja on parillinen määrä, niin Md on kahden keskimmäisen luvun keskiarvo.
Hajontalukuja
6. Vaihteluväli  Δ on jakauman suurimman ja pienimmän luvun erotus.
7. Keskipoikkeama (M.D.)
      
8. Keskihajonta  
    
    Otos keskihajonta
      {s}_{n-1}=\sqrt{\frac{\sum_{i=1}^{n}{\left({x}_{i}-\bar{x} \right)}^{2}}{n-1}}
9. Keskiarvon keskivirhe
 {s}_{\bar{x}}=\frac{s}{\sqrt{n}}
10. Varianssi = s2

 

Luokitellun tilastollisen jakauman tunnuslukuja

Luokitellussa luvut on jaettu k luokkaan, joiden frekvenssit ovat ƒ1, ƒ2, … , ƒk. Frekvenssien summa on sama kuin lukujen kokonais määrä n.
Keskilukuja
1. Keskiarvo \bar{x}=\frac{\sum_{i=1}^{k}{f}_{i}{x}_{i}}{\sum_{i=1}^{k}{f}_{i}}=\frac{\sum fx}{n}
2. Moodiluokka on se luokka (tai luokat), jolla on suurin frekvenssi.
3. Mediaaniluokka on se luokka, jonka alueella summafrekvenssi saa arvon (n / 2).
Hajontalukuja
4. Keskipoikkeama (M.D.) =\frac{\sum_{i=1}^{k}{f}_{i}\left|{x}_{i}-\bar{x} \right|}{n}
5. Keskihajonta s=\sqrt{\frac{\sum_{i=1}^{k}{f}_{i}{\left({x}_{i}-\bar{x} \right)}^{2}}{n}}
    Otoskeskihajonta {s}_{n-1}=\sqrt{\frac{\sum_{i=1}^{k}{f}_{i}{\left({x}_{i}-\bar{x} \right)}^{2}}{n-1}}

Kahden diskreetin muuttujan tilastollinen jakauma

Jakauman muodostavat lukuparit (x1, y1), (x2, y2), … , (xn, yn).
Muuttujien x ja y kovarianssi
 
Pearsonin korrelaatiokerroin (tulomomenttikerroin)
 r=\frac{\sum_{i=1}^{n}\left({x}_{i}-\bar{x} \right)\left({y}_{i}-\bar{y} \right)}{\sqrt{\sum_{i=1}^{n}{\left({x}_{i}-\bar{x} \right)}^{2}\sum_{i=1}^{n}{\left({y}_{i}-\bar{y} \right)}^{2}}}
 =\frac{n\sum xy-\sum x\sum y}{\sqrt{\left[n\sum {x}^{2}-{\left(\sum x \right)}^{2} \right]\left[n\sum {y}^{2}-{\left(\sum y \right)}^{2} \right]}}=\frac{{s}_{xy}}{{s}_{x}{s}_{y}}sx ja sy ovat muuttujien x ja y keskihajonnat
 Spearmanin järjestyskorrelaatiokerroin
 {r}_{s}=1-\frac{6\sum_{i=1}^{n}{{d}_{i}}^{2}}{n\left({n}^{2}-1 \right)}d1=parin(xi, yi) järjestyslukujen erotus
Korrelaation tulkinta
Korrelaatiokertoimen r arvot ovat välillä -1 ≤ r ≤ 1. Jos r = \pm 1, niin x ja y riippuvat toisistaan lineaarisesti. Korrelaatiokertoimen tarkempi tulkinta riippuu havaintoparien lukumäärästä n, mutta suuntaa antavasti voidaan todeta:
 
Suoran sovitus pistejoukkoon
 Jos y riippuu tilastollisesti lineaarisesti x:stä ja on tehty esim. mittaussarja (xi, yi), on parhaiten riippuvuutta kuvaavan suoran eli regressiosuoran y = bx + a
 kulmakerroin b=\frac{n\sum {x}_{i}{y}_{i}-\left(\sum {x}_{i} \right)\left(\sum {y}_{i} \right)}{n\sum {{x}_{i}}^{2}-{\left(\sum {x}_{i} \right)}^{2}} 
 ja vakioa=\frac{\sum {y}_{i}-b\sum {x}_{i}}{n}. 

Kombinaatio-oppi

Jos joukossa on n alkiota, niin niistä voidaan muodostaa erilaisia
– järjestyksiä eli permutaatioita n! = n (n -1) … * 2 * 1 kpl
– k alkiota käsittäviä järjestyksiä eli variaatioita
 {\left(n \right)}_{k}=n\left(n-1 \right)...\left(n-\left(k-1 \right) \right)=\frac{n!}{\left(n-k \right)!}\: kpl(laskimissa symboli nPr)
– k alkiota käsittäviä osajoukkoja eli kombinaatioita
 \begin{pmatrix} n\\k   \end{pmatrix}=\frac{n!}{k!\left(n-k \right)!}\: kpl(laskimissa symboli nCr)

Diskreetti todennäköisyys jakauma

Diskreetti satunnaismuuttuja X saa erilliset arvot x1, x2, … todennäköisyyksillä
p1, p2, … joiden summa on = 1
1. Odotusarvo E(X)=\mu =\sum_{i}^{}{p}_{i}{x}_{i}
2. Keskihajonta D(X)=\sigma =\sqrt{\sum_{i}^{}{p}_{i}{\left({x}_{i}-\mu  \right)}^{2}}
3. Varianssi ={\sigma }^{2}

Jatkuva todennäköisyysjakauma

Jatkuvan satunnaismuuttujan X arvojoukko olkoon väli E = [a, b].
Osavälit A = [c, d] ⊂ E ovat tapahtumia.
Satunnaismuuttujan X tiheysfunktiolle ƒ pätee:
1o ∀ x ∈ E: ƒ (x) ≥ 0 
 2^{\circ} \:\int_{a}^{b}f(x)\:dx=1jos E = , niin ehto on
  
Muuttujaan liittyvä kertymäfunktio on F(x)=P(X\leq x)=\int_{a}^{x}f(t)\:dt
1. Todennäköisyys P(A)=\int_{c}^{d}f(x)\:dx=F(d)-F(c)
  
2. Odotusarvo E(X)=\mu =\int_{a}^{b}xf(x)\: dx
3. Keskihajonta 
  D(X)=\sigma =\sqrt{\int_{a}^{b}{\left(x-\mu  \right)}^{2}f(x)\: dx}=\sqrt{E({x}^{2})-{\mu }^{2}}
4. Varianssi ={\sigma }^{2}

Normaalijakauma

Jos jatkuva satunnaismuuttuja X noudattaa normaalijakaumaa parametrein μ ja σ, niin merkitään X ~ N (μ, σ). Jos jakauma on normitettu, niin X ~ N (1, 0).
Jos X ~ N (μ, σ), niin Z=\frac{X-\mu }{\sigma }\sim N(0,1)
Tapahtuman A todennäköisyys 
 P(A)=P(c\leq X\leq d)=P\left(\frac{c-\mu }{\sigma }\leq Z\leq \frac{d-\mu }{\sigma } \right)=\Phi \left(\frac{d-\mu }{\sigma } \right)-\Phi \left(\frac{c-\mu }{\sigma } \right)
ks. kertymäfunktion arvotaulukko (linkki)

Diskreettejä jakaumia

JakaumaMäärittelyjoukkoPistetoden-
näköisyys
Parametrin rajatOdotusarvoKeskihajonta
binomijakaumak = 0, 1, … , n \begin{pmatrix} n\\k   \end{pmatrix}{p}^{k}{q}^{n-k}0 < p < 1
(q = 1 – p)
np \sqrt{npq}
geometrinen jakaumak = 0, 1, 2, …qk p0 < p < 1 \frac{q}{p} \frac{\sqrt{q}}{p}
Poisson ’ in jakaumak = 0, 1, 2, … \frac{{a}^{k}}{k!}{e}^{-a}a > 0a \sqrt{a}

Jatkuvia jakaumia

JakaumaMäärittely-
joukko
TiheysfunktioParametrin rajatOdotus-
arvo
Keski-
hajonta
normaalijakauma {\frac{1}{\sigma \sqrt{2\pi }}}e^{-\frac{1}{2}{\left(\frac{x-\mu }{\sigma } \right)}^{2}}σ > 0μσ
normitettu normaalijakauma {\frac{1}{\sigma \sqrt{\pi }}}e^{-\frac{1}{2}{x}^{2}} 01
eksponentti-
jakauma
+ {ae}^{-ax}a > 0 \frac{1}{a} \frac{1}{a}
tasainen jakauma[a, b] \frac{1}{b-a}b > a \frac{a+b}{2} \frac{b-a}{2\sqrt{3}}

Luottamusvälit

1. Perusjoukon odotusarvon μ luottamusväli
    95 %:n luottamustasolla on väli \left[\bar{x}-1,96\frac{s}{\sqrt{n}};\: \bar{x}+1,96\frac{s}{\sqrt{n}} \right]
    99 %:n luottamustasolla on väli \left[\bar{x}-2,58\frac{s}{\sqrt{n}};\: \bar{x}+2,58\frac{s}{\sqrt{n}} \right]
    99,9 %:n luottamustasolla on väli \left[\bar{x}-3,29\frac{s}{\sqrt{n}};\: \bar{x}+3,29\frac{s}{\sqrt{n}} \right]
Kaavoissa s on satunnaismuuttujan keskihajonta, \bar{x} satunnaismuuttujan otoksesta laskettu otoskeskiarvo ja n otoksen koko. Kun hajonta estimoidaan otoksesta, korvataan kertoimet 1,96; 2,58 ja 3,29 t-jakauman arvoilla tp, kun p = 0,05; p = 0,01 ja p = 0,001 sekä vapausasteluku n – 1.
2. Suhteellisen osuuden p luottamusväli
    95 %:n luottamustasolla on väli \left[\hat{p}-1,96s;\: \hat{p}+1,96s \right]
    99 %:n luottamustasolla on väli \left[\hat{p}-2,58s;\: \hat{p}+2,58s \right]
    99,9 %:n luottamustasolla on väli \left[\hat{p}-3,29s;\: \hat{p}+3,29s \right]
Kaavoissa \hat{p} ja s ovat satunnaismuuttujan otoksesta laskettavia tunnuslukuja; \hat{p} = otoksesta laskettu suhteellinen osuus, n = otoksen koko,
 s=\sqrt{\frac{\hat{p}\left(1-\hat{p} \right)}{n}}= suhteellisen osuuden otosjakauman keskihajonta.