Ako posúdiť štatistickú významnosť: 15 krokov (s obrázkami)

Testovanie hypotéz sa riadi štatistickou analýzou. Štatistická významnosť sa vypočíta pomocou p-hodnoty, ktorá hovorí o pravdepodobnosti pozorovaného výsledku za predpokladu, že určité tvrdenie (nulová hypotéza) je pravdivé.[1]
Ak je táto p-hodnota menšia ako stanovená hladina významnosti (zvyčajne 0.05), experimentátor môže predpokladať, že nulová hypotéza je nepravdivá a prijať alternatívnu hypotézu. Pomocou jednoduchého t-testu môžete vypočítať p-hodnotu a určiť významnosť medzi dvoma rôznymi skupinami súboru údajov.

Časť 1 z 3:Nastavenie vášho experimentu


Definujte svoje hypotézy. Prvým krokom pri posudzovaní štatistickej významnosti je definovanie otázky, na ktorú chcete odpovedať, a stanovenie hypotézy. Hypotéza je tvrdenie o vašich experimentálnych údajoch a rozdieloch, ktoré sa môžu vyskytovať v populácii. Pre každý experiment existuje nulová aj alternatívna hypotéza.[2]
Vo všeobecnosti budete porovnávať dve skupiny, aby ste zistili, či sú rovnaké alebo rozdielne.

  • Nulová hypotéza (H0) Všeobecne platí, že medzi vašimi dvoma súbormi údajov nie je žiadny rozdiel. Napríklad: Študenti, ktorí si prečítajú materiál pred hodinou, nemajú lepšie výsledné známky.
  • Alternatívna hypotéza (Ha) je opak nulovej hypotézy a je to tvrdenie, ktoré sa snažíte podložiť svojimi experimentálnymi údajmi. Napríklad: Študenti, ktorí si prečítajú materiál pred vyučovaním, majú lepšie výsledné známky.


Nastavte hladinu významnosti, aby ste určili, aké neobvyklé musia byť vaše údaje, aby sa mohli považovať za významné. Hladina významnosti (nazývaná aj alfa) je hranica, ktorú ste stanovili na určenie významnosti. Ak je vaša p-hodnota menšia alebo rovná stanovenej hladine významnosti, údaje sa považujú za štatisticky významné.[3]

  • Všeobecným pravidlom je, že hladina významnosti (alebo alfa) sa bežne stanovuje na 0.05, čo znamená, že pravdepodobnosť pozorovania rozdielov, ktoré vidíte vo svojich údajoch náhodou, je len 5 %.
  • Vyššia hladina spoľahlivosti (a teda nižšia p-hodnota) znamená, že výsledky sú významnejšie.
  • Ak chcete mať vyššiu dôveru vo svoje údaje, nastavte p-hodnotu nižšie na 0.01. Nižšie p-hodnoty sa vo všeobecnosti používajú vo výrobe pri zisťovaní chýb výrobkov. Je veľmi dôležité mať vysokú istotu, že každá časť bude fungovať presne tak, ako má.
  • Pri väčšine experimentov založených na hypotézach je hladina významnosti 0.05 je prijateľné.


Rozhodnite sa, či použijete jedno- alebo dvojvýberový test. Jedným z predpokladov t-testu je, že vaše údaje sú rozdelené normálne. Normálne rozdelenie údajov tvorí zvonovitú krivku, pričom väčšina vzoriek spadá do stredu.[4]
T-test je matematický test, ktorým sa zisťuje, či vaše údaje nepatria do normálneho rozdelenia, či už vyššie alebo nižšie, do „chvostov“ krivky.

  • Jednovýberový test je silnejší ako dvojvýberový test, pretože skúma potenciál vzťahu v jednom smere (napríklad nad kontrolnou skupinou), zatiaľ čo dvojvýberový test skúma potenciál vzťahu v oboch smeroch (napríklad nad kontrolnou skupinou alebo pod ňou).[5]
  • Ak si nie ste istí, či vaše údaje budú nad alebo pod kontrolnou skupinou, použite dvojchvostový test. To vám umožňuje testovať významnosť v oboch smeroch.
  • Ak viete, ktorým smerom očakávate, že budú vaše údaje smerovať, použite jednorozmerný test. V danom príklade očakávate, že sa známky študenta zlepšia, preto použijete jednootázkový test.


Určite veľkosť vzorky pomocou analýzy sily. Sila testu je pravdepodobnosť pozorovania očakávaného výsledku pri určitej veľkosti vzorky. Bežná hranica sily (alebo β) je 80 %. Analýza sily môže byť bez predbežných údajov trochu zložitá, pretože potrebujete určité informácie o očakávaných stredných hodnotách medzi jednotlivými skupinami a ich štandardných odchýlkach. Na určenie optimálnej veľkosti vzorky pre vaše údaje použite online kalkulačku analýzy sily.[6]

  • Výskumníci zvyčajne robia malú pilotnú štúdiu, aby získali informácie pre analýzu sily a určili veľkosť vzorky potrebnú pre väčšiu, komplexnú štúdiu.
  • Ak nemáte prostriedky na vykonanie komplexnej pilotnej štúdie, urobte niekoľko odhadov o možných stredných hodnotách na základe čítania literatúry a štúdií, ktoré mohli vykonať iní jednotlivci. To vám poskytne dobré východisko pre veľkosť vzorky.

Časť 2 z 3:Výpočet štandardnej odchýlky


Definujte vzorec pre štandardnú odchýlku. Štandardná odchýlka je mierou toho, ako sú vaše údaje rozptýlené. Poskytuje vám informáciu o tom, ako podobné sú jednotlivé body údajov v rámci vašej vzorky, čo vám pomôže určiť, či sú údaje významné. Na prvý pohľad sa rovnica môže zdať trochu komplikovaná, ale tieto kroky vás prevedú procesom výpočtu. Vzorec je s = √∑((xi – µ)2/(N – 1)).

  • s je štandardná odchýlka.
  • ∑ znamená, že spočítate všetky získané hodnoty vzorky.
  • xi predstavuje každú jednotlivú hodnotu z vašich údajov.
  • µ je priemer (alebo stredná hodnota) vašich údajov pre každú skupinu.
  • N je celkový počet vzoriek.


Spriemerujte vzorky v každej skupine. Ak chcete vypočítať štandardnú odchýlku, musíte najprv urobiť priemer vzoriek v jednotlivých skupinách. Priemer sa označuje gréckym písmenom mu alebo µ. Ak to chcete urobiť, jednoducho spočítajte jednotlivé vzorky a potom ich vydeľte celkovým počtom vzoriek.[7]

  • Ak chceme napríklad zistiť priemernú známku skupiny, ktorá si prečítala materiál pred vyučovaním, pozrime sa na niektoré údaje. Pre jednoduchosť použijeme súbor údajov s 5 bodmi: 90, 91, 85, 83 a 94.
  • Súčet všetkých vzoriek: 90 + 91 + 85 + 83 + 94 = 443.
  • Súčet vydeľte počtom vzoriek, N = 5: 443/5 = 88.6.
  • Priemerná známka tejto skupiny je 88.6.


Odpočítajte každú vzorku od priemeru. Ďalšia časť výpočtu zahŕňa (xi – µ) časť rovnice. Od práve vypočítaného priemeru odpočítate každú vzorku. V našom príklade skončíte s piatimi odčítaniami.

  • (90 – 88.6), (91- 88.6), (85 – 88.6), (83 – 88.6) a (94 – 88.6).
  • Vypočítané čísla sú teraz 1.4, 2.4, -3.6, -5.6 a 5.4.


Každé z týchto čísel vynásobte štvorcom a sčítajte ich. Každé z nových čísel, ktoré ste práve vypočítali, bude teraz štvorcové. Tento krok sa postará aj o prípadné negatívne znamienka. Ak máte po tomto kroku alebo na konci výpočtu záporné znamienko, možno ste na tento krok zabudli.

  • V našom príklade teraz pracujeme s 1.96, 5.76, 12.96, 31.36 a 29.16.
  • Ak tieto štvorce spočítame, dostaneme: 1.96 + 5.76 + 12.96 + 31.36 + 29.16 = 81.2.


Vydelte celkovým počtom vzoriek mínus 1. Vzorec delí N – 1, pretože koriguje skutočnosť, že ste nepočítali celú populáciu; na odhad beriete vzorku populácie všetkých študentov.[8]

  • Odpočítajte: N – 1 = 5 – 1 = 4
  • Delenie: 81.2/4 = 20.3


Urobte druhú odmocninu. Keď ste vydelili počet vzoriek mínus jedna, z tohto výsledného čísla urobte druhú odmocninu. Toto je posledný krok pri výpočte štandardnej odchýlky. Existujú štatistické programy, ktoré tento výpočet vykonajú za vás po zadaní prvotných údajov.

  • V našom príklade je štandardná odchýlka výsledných známok študentov, ktorí čítali pred vyučovaním: s =√20.3 = 4.51.

Časť 3 z 3:Určenie významnosti


Vypočítajte rozptyl medzi vašimi 2 skupinami vzorky. Až do tohto bodu sa príklad zaoberal iba 1 zo skupín vzoriek. Ak sa snažíte porovnať 2 skupiny, budete mať zrejme údaje z oboch skupín. Vypočítajte štandardnú odchýlku druhej skupiny vzoriek a použite ju na výpočet rozptylu medzi 2 experimentálnymi skupinami. Vzorec pre rozptyl je sd = √((s1/N1) + (s2/N2)).[9]

  • sd je rozptyl medzi vašimi skupinami.
  • s1 je štandardná odchýlka skupiny 1 a N1 je veľkosť vzorky skupiny 1.
  • s2 je štandardná odchýlka skupiny 2 a N2 je veľkosť vzorky skupiny 2.
  • Pre náš príklad povedzme, že údaje zo skupiny 2 (študenti, ktorí nečítali pred vyučovaním) mali veľkosť vzorky 5 a štandardnú odchýlku 5.81. Rozdiel je:
    • sd = √((s1)2/N1) + ((s2)2/N2))
    • sd = √(((4.51)2/5) + ((5.81)2/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.


Vypočítajte t-skóre vašich údajov. T-skóre umožňuje previesť údaje do podoby, ktorá umožňuje ich porovnanie s inými údajmi. T-skóre umožňuje vykonať t-test, ktorý umožňuje vypočítať pravdepodobnosť, že sa dve skupiny od seba významne líšia. Vzorec pre t-skóre je: t = (µ1 – µ2)/sd.[10]

  • µ1 je priemer prvej skupiny.
  • µ2 je priemer druhej skupiny.
  • sd je rozptyl medzi vašimi vzorkami.
  • Použite väčší priemer ako µ1 takže nebudete mať zápornú t-hodnotu.
  • Pre náš príklad povedzme, že priemer vzorky pre skupinu 2 (tí, ktorí nečítali) bol 80. Skóre t je: t = (µ1 – µ2)/sd = (88.6 – 80)/3.29 = 2.61.


Určte stupne voľnosti vašej vzorky. Pri použití t-skóre sa počet stupňov voľnosti určí pomocou veľkosti vzorky. Sčítajte počet vzoriek z každej skupiny a potom odčítajte dve. Pre náš príklad sú stupne voľnosti (d.f.) je 8, pretože v prvej skupine je päť vzoriek a v druhej skupine je päť vzoriek ((5 + 5) – 2 = 8).[11]


Na vyhodnotenie významnosti použite t tabuľku. Tabuľka t-skóre[12]
a stupne voľnosti nájdete v štandardnej štatistickej knihe alebo na internete. Pozrite sa na riadok obsahujúci stupne voľnosti pre vaše údaje a nájdite p-hodnotu, ktorá zodpovedá vášmu t-skóre.

  • S 8 d.f. a t-skóre je 2.61, p-hodnota pre jednosmerný test je medzi 0.01 a 0.025. Keďže sme stanovili hladinu významnosti menšiu alebo rovnú 0.05, naše údaje sú štatisticky významné. S týmito údajmi zamietame nulovú hypotézu a prijímame alternatívnu hypotézu:[13]
    študenti, ktorí si prečítajú materiál pred hodinou, majú lepšie výsledné známky.

  • Zvážte následnú štúdiu. Mnohí výskumní pracovníci robia malú pilotnú štúdiu s niekoľkými meraniami, ktorá im pomôže pochopiť, ako navrhnúť väčšiu štúdiu. Vykonanie ďalšej štúdie s väčším počtom meraní vám pomôže zvýšiť istotu vášho záveru.

    • Následná štúdia vám pomôže určiť, či niektorý z vašich záverov neobsahoval chybu typu I (pozorovanie rozdielu, keď rozdiel neexistuje, alebo nesprávne zamietnutie nulovej hypotézy) alebo chybu typu II (nepozorovanie rozdielu, keď rozdiel existuje, alebo nesprávne prijatie nulovej hypotézy).[14]
  • Odkazy