Ako vypočítať hodnotu P: 7 krokov (s obrázkami)

hodnotu P je štatistické meradlo, ktoré pomáha vedcom určiť, či sú ich hypotézy správne alebo nie. Hodnoty P sa používajú na určenie toho, či sú výsledky ich experimentu v rámci normálneho rozsahu hodnôt pre sledované udalosti. Zvyčajne, ak je hodnota P súboru údajov nižšia ako určitá vopred stanovená hodnota (ako napríklad 0.05), vedci zamietnu „nulovú hypotézu“ svojho experimentu – inými slovami, vylúčia hypotézu, že premenné ich experimentu mali nie významný vplyv na výsledky. Dnes sa hodnoty p zvyčajne nachádzajú v referenčnej tabuľke tak, že sa najprv vypočíta chí kvadrát hodnota.

Kroky


Určte hodnotu vášho experimentu očakávaná výsledky. Zvyčajne, keď vedci vykonávajú experiment a pozorujú výsledky, majú vopred predstavu o tom, ako budú vyzerať „normálne“ alebo „typické“ výsledky. Môže vychádzať z minulých experimentálnych výsledkov, dôveryhodných súborov údajov z pozorovaní, vedeckej literatúry a/alebo iných zdrojov. Pri experimente určte očakávané výsledky a vyjadrite ich ako číslo.

  • Príklad: Povedzme, že predchádzajúce štúdie ukázali, že v celoštátnom meradle sa pokuty za prekročenie rýchlosti udeľujú častejšie červeným autám ako modrým. Povedzme, že priemerné výsledky na národnej úrovni ukazujú preferenciu červených áut v pomere 2:1. Analýzou pokút za prekročenie rýchlosti, ktoré udeľuje polícia v našom meste, chceme zistiť, či aj polícia v našom meste vykazuje túto tendenciu. Ak by sme v našom meste náhodne vybrali 150 pokút za prekročenie rýchlosti, ktoré boli udelené buď červeným, alebo modrým autám, očakávali by sme 100 byť pre červené autá a 50 byť pre modré autá ak polícia v našom meste udeľuje pokuty podľa národnej predpojatosti.


Určte experimentálnu veličinu pozorované výsledky. Teraz, keď ste určili očakávané hodnoty, môžete vykonať experiment a zistiť skutočné (alebo „pozorované“) hodnoty. Opäť vyjadrite tieto výsledky ako čísla. Ak manipulujeme s niektorými experimentálnymi podmienkami a pozorovanými výsledkami líšia z tohto očakávaného výsledku sú možné dve možnosti: buď sa to stalo náhodou, alebo naša manipulácia s experimentálnymi premennými spôsobila rozdielu. Účelom zistenia p-hodnoty je v podstate určiť, či sa pozorované výsledky líšia od očakávaných výsledkov do takej miery, že „nulová hypotéza“ – hypotéza, že neexistuje vzťah medzi experimentálnou premennou (premennými) a pozorovanými výsledkami – je dostatočne nepravdepodobná na to, aby sa zamietla

  • Príklad: Povedzme, že v našom meste sme náhodne vybrali 150 pokút za prekročenie rýchlosti, ktoré boli udelené buď červeným, alebo modrým autám. Zistili sme, že 90 lístkov bolo pre červené autá a 60 boli pre modré autá. Tieto výsledky sa líšia od našich očakávaných výsledkov 100 a 50, resp. Spôsobila naša experimentálna manipulácia (v tomto prípade zmena zdroja našich údajov z celoštátneho na miestny) túto zmenu výsledkov, alebo je polícia nášho mesta ako neobjektívne ako naznačuje národný priemer, a my pozorujeme len náhodnú odchýlku? Hodnota p nám to pomôže určiť.


Určte hodnotu vášho experimentu stupňov voľnosti. Stupne voľnosti sú mierou veľkosti variability zahrnutej do výskumu, ktorá je určená počtom skúmaných kategórií. Rovnica pre stupne voľnosti je Stupne voľnosti = n-1, kde „n“ je počet kategórií alebo premenných analyzovaných vo vašom experimente.

  • Príklad: Náš experiment má dve kategórie výsledkov: jednu pre červené autá a druhú pre modré autá. V našom experimente teda máme 2-1 = 1 stupeň voľnosti. Ak by sme porovnávali červené, modré a zelené autá, dostali by sme 2 stupňov voľnosti, a tak ďalej.


Porovnajte očakávané výsledky s pozorovanými výsledkami pomocou chí kvadrát. Chi kvadrát (písaný „x2“) je číselná hodnota, ktorá meria rozdiel medzi experimentom očakávaný a pozorované hodnoty. Rovnica pre chí kvadrát je: x2 = Σ((o-e)2/e), kde „o“ je pozorovaná hodnota a „e“ je očakávaná hodnota.[1]
Súčet výsledkov tejto rovnice pre všetky možné výsledky (pozri nižšie).

  • Všimnite si, že táto rovnica obsahuje Σ (sigma) operátor. Inými slovami, budete musieť vypočítať ((|o-e|-.05)2/e) pre každý možný výsledok, potom výsledky spočítajte, aby ste dostali hodnotu chí kvadrátu. V našom príklade máme dva výsledky – buď je auto, ktoré dostalo pokutu, červené, alebo modré. Takto by sme vypočítali ((o-e)2/e) dvakrát – raz pre červené autá a raz pre modré autá.
  • Príklad: Dosadíme naše očakávané a pozorované hodnoty do rovnice x2 = Σ((o-e)2/e). Nezabudnite, že kvôli operátoru sigma budeme musieť vykonať ((o-e)2/e) dvakrát – raz pre červené autá a raz pre modré autá. Naša práca by prebiehala nasledovne:
    • x2 = ((90-100)2/100) + (60-50)2/50)
    • x2 = ((-10)2/100) + (10)2/50)
    • x2 = (100/100) + (100/50) = 1 + 2 = 3 .


Vyberte si Hladina významnosti. Teraz, keď poznáme stupne voľnosti nášho experimentu a hodnotu chí kvadrát, musíme urobiť už len poslednú vec, aby sme mohli zistiť našu hodnotu p – musíme sa rozhodnúť pre hladinu významnosti. Hladina významnosti je v podstate mierou toho, akú istotu chceme mať o našich výsledkoch – nízke hodnoty významnosti zodpovedajú nízkej pravdepodobnosti, že výsledky experimentu sa stali náhodou, a naopak. Hladiny významnosti sa zapisujú ako desatinné číslo (napríklad 0.01), čo zodpovedá percentuálnej šanci, že náhodný výber vzorky by vytvoril taký veľký rozdiel, aký ste pozorovali, ak by neexistoval žiadny základný rozdiel v populáciách.

  • Častým omylom je, že p=0.01 znamená, že existuje 99 % pravdepodobnosť, že výsledky boli spôsobené manipuláciou vedca s experimentálnymi premennými[2]
    Dôveryhodný zdroj
    PubMed Central
    Archív časopisov z U.S. Národné ústavy zdravia
    Prejsť na zdroj
    . Toto NIE JE tento prípad. Ak by ste si obliekli nohavice pre šťastie v sedem rôznych dní a akciový trh by každý z týchto dní vzrástol, mali by ste p<0.01, ale aj tak by ste sa mohli oprávnene domnievať, že výsledok vznikol skôr náhodou ako súvislosťou medzi trhom a vašimi nohavicami.
  • Podľa konvencie vedci zvyčajne stanovujú hodnotu významnosti pre svoje experimenty na 0.05 alebo 5 percent.[3]
    To znamená, že výsledky experimentu, ktoré spĺňajú túto hladinu významnosti, majú nanajvýš 5 % šancu, že sa budú reprodukovať v procese náhodného výberu. Pri väčšine experimentov sa generovanie výsledkov, ktoré sú tak nepravdepodobné, že by vznikli náhodným výberom, považuje za „úspešné“ preukázanie korelácie medzi zmenou experimentálnej premennej a pozorovaným účinkom.
  • Príklad: V prípade nášho príkladu s červeným a modrým autom sa budeme riadiť vedeckou konvenciou a hladinu významnosti stanovíme na 0.05.


Použite tabuľku rozdelenia chí kvadrát na aproximáciu p-hodnoty. Vedci a štatistici používajú veľké tabuľky hodnôt na výpočet hodnoty p pre svoj experiment. Tieto tabuľky sú spravidla zostavené tak, že zvislá os vľavo zodpovedá stupňom voľnosti a vodorovná os hore zodpovedá p-hodnote. Tieto tabuľky použite tak, že najprv zistíte svoje stupne voľnosti a potom prečítate tento riadok naprieč zľava doprava, kým nenájdete prvú hodnotu väčšia ako je vaša hodnota chí kvadrátu. Pozrite sa na príslušnú hodnotu p v hornej časti stĺpca – vaša hodnota p sa nachádza medzi touto hodnotou a ďalšou najväčšou hodnotou (tou, ktorá je hneď naľavo od nej.)

  • Tabuľky rozdelenia chí kvadrátov sú dostupné z rôznych zdrojov – ľahko ich nájdete na internete alebo v učebniciach prírodných vied a štatistiky. Ak ju nemáte po ruke, použite tú na obrázku vyššie alebo bezplatnú online tabuľku, napríklad tú, ktorú poskytuje medcalc.org tu.
  • Príklad: Náš chí-kvadrát bol 3. Použime teda tabuľku rozdelenia chí kvadrát na obrázku vyššie na zistenie približnej hodnoty p. Keďže vieme, že náš experiment má len 1 stupňa voľnosti, začneme v najvyššom riadku. Budeme postupovať zľava doprava pozdĺž tohto riadku, kým nenájdeme hodnotu vyššiu ako 3 – naša hodnota chí kvadrátu. Prvá, s ktorou sa stretávame, je 3.84. Keď sa pozrieme na začiatok tohto stĺpca, vidíme, že zodpovedajúca hodnota p je 0.05. To znamená, že naša hodnota p je medzi 0.05 a 0.1 (ďalšia najväčšia hodnota p v tabuľke).

  • Rozhodnite sa, či nulovú hypotézu zamietnete alebo ponecháte v platnosti. Keďže ste zistili približnú hodnotu p pre váš experiment, môžete sa rozhodnúť, či zamietnete nulovú hypotézu vášho experimentu (pre pripomenutie, ide o hypotézu, že experimentálne premenné, s ktorými ste manipulovali nie ovplyvniť výsledky, ktoré ste pozorovali.) Ak je vaša hodnota p nižšia ako hodnota významnosti, gratulujeme – ukázali ste, že výsledky vášho experimentu by boli veľmi nepravdepodobné, ak by neexistovala skutočná súvislosť medzi premennými, ktorými ste manipulovali, a pozorovaným účinkom. Ak je vaša hodnota p vyššia ako hodnota významnosti, nemôžete s istotou tvrdiť, že.

    • Príklad: Naša hodnota p je medzi 0.05 a 0.1 . nie je menšia ako 0.05, takže, bohužiaľ, sme nemôže zamietnuť našu nulovú hypotézu. To znamená, že sme nedosiahli kritérium, ktoré sme si stanovili, aby sme mohli povedať, že polícia v našom meste dáva pokuty červeným a modrým autám v miere, ktorá sa výrazne líši od celoštátneho priemeru.
    • Inými slovami, náhodný výber vzorky z národných údajov by priniesol výsledok, ktorý by bol o 10 lístkov odlišný od národného priemeru v 5 – 10 % prípadov. Keďže sme hľadali, aby toto percento bolo menšie ako 5 %, nemôžeme povedať, že sme sure Polícia v našom meste je menej zaujatá voči červeným autám.
  • Odkazy