Ako vykonať analýzu údajov (s obrázkami)

Analýza údajov je dôležitým krokom pri hľadaní odpovede na experimentálnu otázku. Analýza údajov z dobre navrhnutej štúdie pomáha výskumníkovi odpovedať na otázky. Na základe týchto údajov môžete tiež vyvodiť závery, ktoré prehĺbia výskum a prispejú k budúcim štúdiám. Udržiavanie dobre organizovaných údajov počas procesu zberu pomôže oveľa ľahšie vykonať krok analýzy.

Časť 1 zo 4:Usporiadanie údajov


Na usporiadanie údajov použite elektronickú databázu. Skopírujte údaje do nového súboru na úpravu. Nikdy nechcete pracovať s hlavným súborom údajov v prípade, že sa počas procesu analýzy niečo poškodí. Program, ako je napríklad Excel, vám umožní usporiadať všetky údaje do tabuľky, v ktorej sa dá ľahko vyhľadávať. K údajom môžete pridať filtre, ktoré vám uľahčia kopírovanie a vkladanie diskrétnych súborov údajov medzi súbormi.[1]

  • Dávajte pozor pri prenose údajov do hlavnej tabuľky. Je ľahké omylom skopírovať a vložiť do nesprávnych stĺpcov alebo riadkov.
  • V prípade, že sa s údajmi niečo stane, vždy sa môžete vrátiť k pôvodnému hlavnému súboru.

Kódovanie textových odpovedí do číselnej podoby. Ak pracujete s údajmi z prieskumu, ktoré majú písomné odpovede, budete musieť údaje pred ich analýzou zakódovať do číselnej podoby.[2]
Možno budete musieť vytvoriť vlastný systém kódovania odpovedí na základe získaných informácií a otázok, na ktoré sa snažíte pomocou údajov odpovedať.

  • Odpovede „Nie“ kódujte ako „0“ a odpovede „Áno“ ako „1.“


Vytvorte systém na zoskupovanie údajov. Keď začnete zbierať údaje, začnite premýšľať o najlepšom spôsobe, ako všetko zoskupiť. Ak pracujete s ľudskými subjektmi alebo odpoveďami, budete musieť každej osobe prideliť číselný alebo písmenný kód na ochranu dôvernosti.[3]

  • Najjednoduchšie môže byť mať všetky skupiny na samostatných listoch v rámci jedného dokumentu, v úplne samostatných dokumentoch alebo v rôznych stĺpcoch/riadkoch v rámci jedného listu.
  • Porozprávajte sa s ostatnými, ktorí robili podobnú analýzu údajov, aby ste získali predstavu o tom, ako najlepšie usporiadať svoje údaje.
  • Napríklad: Ak chcete zistiť rozdiely medzi mužmi a ženami, mali by ste sa uistiť, že všetky údaje mužov boli zoskupené a všetky údaje žien boli zoskupené.


Skontrolujte, či v údajoch nie sú chyby. Pri organizovaní údajov môže dochádzať k častému kopírovaniu a vkladaniu medzi súbormi. Pravidelne kontrolujte hlavný súbor s údajmi, ktoré ste usporiadali, aby ste sa uistili, že čísla neboli pomiešané alebo umiestnené do nesprávnych stĺpcov.[4]

  • Ak musíte údaje zadávať ručne, uistite sa, že ste všetko, čo sa zadáva, dvakrát skontrolovali.

Časť 2 zo 4:Výber štatistických testov


Vykonajte t-test na porovnanie dvoch skupín. T-test je veľmi bežný štatistický test, ktorý sa používa na porovnanie priemerov (stredných hodnôt) vzoriek. Jednovýberový t-test sa používa na testovanie, či je priemerná vzorka štatisticky významne odlišná od známej hodnoty. Dvojvýberový t-test sa používa na testovanie, či majú dve skupiny štatisticky rozdielne stredné hodnoty.[5]

  • Jednovýberové t-testy sa zvyčajne používajú vo fyzike a pri výrobe výrobkov: poznáte hodnotu, ktorú by mala mať vaša vzorka, takže porovnávate priemer, ktorý ste dostali, s touto známou hodnotou.[6]
  • T-testy s dvoma vzorkami sa bežne používajú v biomedicínskej a klinickej oblasti.


Použite ANOVA na analýzu priemerov skupín. ANOVA (analýza rozptylu) sa veľmi často používa v biomedicínskych oblastiach na porovnanie priemerov viacerých skupín. ANOVA je veľmi silný nástroj na hľadanie rozdielov, keď sa zaoberáte mnohými porovnaniami.

  • Jednocestnú ANOVA možno použiť na porovnanie priemerov viacerých skupín s jednou kontrolnou skupinou. Ak by ste napríklad mali jednu kontrolnú skupinu a tri testovacie skupiny, použili by ste jednocestnú ANOVA na porovnanie všetkých priemerov a zistenie, či sa niektoré z nich líšia.[7]
  • Dvojcestná ANOVA sa používa na porovnanie priemerov viacerých skupín s viacerými premennými. Napríklad, ak by ste chceli zistiť, či genotyp aj pohlavie organizmu ovplyvňujú vaše údaje, vykonali by ste dvojcestnú ANOVA voči kontrolným skupinám.[8]


Spustite lineárna regresia na testovanie účinkov premenných. Test lineárnej regresie skúma odchýlku nezávislej premennej a testuje, či táto odchýlka spôsobuje odchýlku pozorovanú v závislej premennej.[9]

  • Tento test sa používa, keď chcete zmerať silu asociácie medzi dvoma premennými.
  • Ak by ste napríklad chceli otestovať vzťah medzi vašou srdcovou frekvenciou a rýchlosťou, ktorou sa pohybujete na bežeckom páse, použili by ste lineárnu regresiu.


Na porovnanie dvoch regresných priamok použite ANCOVA. Ak chcete porovnať vzťah dvoch rôznych skupín k tej istej premennej, môžete použiť ANCOVA (analýzu kovariancie). ANCOVA vám umožňuje kontrolovať rozdiely, ktoré môžete pozorovať z nezávislej premennej medzi dvoma skupinami.[10]

  • Ak by ste napríklad chceli otestovať, či muži a ženy majú pri rôznych teplotách rozdielnu pokojovú srdcovú frekvenciu, použili by ste ANCOVA. Vytvorili by ste dve regresné priamky (jednu pre ženy a jednu pre mužov) srdcovej frekvencie v závislosti od teploty. Potom by ste použili ANCOVA na porovnanie týchto dvoch riadkov, aby ste zistili, či sa líšia.


Preskúmajte ďalšie štatistické testy na vlastnú päsť. Uvedené testy nie sú vyčerpávajúcim zoznamom dostupných testov. Toto sú niektoré z najčastejšie používaných testov, ale existuje mnoho variácií a zložitejších testov, ktoré môžu byť pre vaše údaje vhodnejšie. Pri plánovaní experimentov si dôkladne vyhľadajte, ktoré testy použiť.

  • Na internete nájdete niekoľko užitočných grafov a článkov, ktoré vám pomôžu pri výbere testu na základe údajov, ktoré zhromažďujete.[11]
    Dôveryhodný zdroj
    PubMed Central
    Archív denníka z U.S. Národné ústavy zdravia
    Prejsť na zdroj
  • Viac informácií nájdete v článkoch NIH a na univerzitách alebo v online štatistických knihách.

Časť 3 zo 4:Analýza údajov


Jasne definujte výskumné otázky. Nikdy nestrácajte zameranie štúdie a držte sa plánu výskumu a definovaných premenných. Dobrá výskumná stratégia zahŕňa vykonávanie dobre navrhnutých experimentov a zhromažďovanie správneho množstva údajov na zodpovedanie výskumnej otázky.

  • Pred začatím zberu údajov by ste mali presne vedieť, koľko vzoriek budete zbierať v každej skupine a aké štatistické testy budete vykonávať.


Poraďte sa so štatistikom. Štatistika sa môže veľmi rýchlo skomplikovať, najmä pri veľkých súboroch údajov. Pred začatím experimentu všetko prediskutujte so štatistikom. Môžu vám pomôcť zistiť, aké testy sú vhodné na analýzu vašich údajov a koľko vzoriek budete potrebovať v každej skupine, aby ste mali správnu silu na vykonanie testov.[12]

  • Je tiež dobré stretnúť sa s nimi znova po zozbieraní údajov. Môžu vám pomôcť analyzovať údaje a uistiť sa, že všetko bolo vykonané správne.
  • Opýtajte sa ich na správny rozsah vašej štúdie, aké typy štatistických testov vám pomôžu odpovedať na vaše výskumné otázky a aké sú obmedzenia testov.
  • Nezabudnite, že štatistický test jednoducho hovorí o pravdepodobnosti výskytu alebo nevyskytu výsledku. Musíte byť opatrní, aby ste si nezamieňali štatistickú významnosť s klinickou významnosťou alebo fyziologickou relevantnosťou.[13]


Spustite vybrané štatistické testy. Po zhromaždení a príprave údajov môžete začať vykonávať všetky testy, ktoré ste sa rozhodli vykonať pred začiatkom experimentu. Na tento proces by sa mali používať programy určené na analýzu údajov. Tieto testy sú zložité a je oveľa jednoduchšie ich vykonať pomocou programu, ako je SAS, R, Stata alebo GraphPad Prism.

  • SAS, Stata a R vyžadujú určité skúsenosti s programovaním. Možno sa budete musieť poradiť s niekým, kto je vyškolený na používanie týchto programov, alebo absolvovať kurz, aby ste sa v ich používaní zdokonalili.

Časť 4 zo 4:Prezentácia údajov


Vytvorte grafy, ktoré majú kvalitu publikácie. Existuje mnoho softvérových programov, ktoré umožňujú premeniť údaje na pekné grafy. Programy na štatistickú analýzu majú aj možnosti tvorby grafov, ktoré vytvárajú obrázky v publikačnej kvalite. Preneste svoje údaje do niektorého z týchto programov a vytvorte z nich graf.[14]

  • Bežne používané programy sú GraphPad Prism a R.


Jasne označte všetky osi. Pri prezentácii údajov je dôležité všetko jasne označiť, aby ľudia mohli ľahko interpretovať, čo im graf hovorí. Všetky osi musia byť označené ľahko čitateľným písmom s dostatočne veľkou veľkosťou, aby sa dali prečítať bez žmurkania.[15]

  • Ak máte v jednom grafe viacero súborov údajov, uistite sa, že sú všetky správne označené.


Na označenie významnosti použite hviezdičky. Na obrázkoch, ktoré majú významné rozdiely medzi skupinami, to chcete uviesť priamo na obrázku. Nakreslite čiaru medzi dvoma skupinami, ktoré sa významne líšia, a nad čiaru umiestnite hviezdičku.

  • Uistite sa, že legenda k obrázku vysvetľuje, čo znamená hviezdička, aký štatistický test bol použitý a aká bola skutočná p-hodnota testu.


Zoskupte podobné údaje. Ak máte viacero grafov údajov, ktoré sú si podobné, zoskupte ich do jedného obrázku. Pomôže vám pochopiť údaje, ak sa budete môcť pozrieť na všetky podobné údaje súčasne. Je jednoduchšie vidieť trendy a vyvodiť závery o vašich údajoch.

  • Mnohé programy majú editory grafov, ktoré umožňujú aj vytváranie rozloženia viacerých grafov.
  • Uistite sa, že všetky grafy majú rovnakú veľkosť písma a medzi súbormi údajov sa používajú rovnaké symboly.

  • Napíšte podrobnú legendu k obrázku. Legenda k obrázku umožňuje každému, kto sa pozerá na vaše údaje, pochopiť, čo presne sa v grafe prezentuje. V legende by sa mal čitateľ dozvedieť, koľko replikátov je v každej skupine a aké štatistické testy boli použité na analýzu údajov.[16]

    • V legende by mali byť uvedené aj podrobnosti o štatistike: z-skóre, t-skóre, p-hodnoty, stupne voľnosti atď.
  • Odkazy