3 spôsoby náhodného výberu vzorky

Keď robíte pozorovania a závery o populácii, náhodný výber je užitočným nástrojom. Môže byť ťažké alebo nemožné pracovať s údajmi z celej skupiny populácie, ale náhodná vzorka vám môže poskytnúť reprezentatívny prierez populácie a umožní vám robiť závery o celej skupine. V závislosti od veľkosti a zložitosti populácie, s ktorou pracujete, existuje niekoľko rôznych typov náhodného výberu, ktoré môžete použiť. V prípade menších, homogénnejších skupín je dobrou voľbou jednoduchý náhodný výber. Ak sa zaoberáte väčšou alebo rôznorodejšou skupinou, zvoľte radšej stratifikovaný alebo zhlukový výber vzoriek.

Metóda 1 z 3: Jednoduchý náhodný výber


Používajte jednoduchý náhodný výber pre malé alebo homogénne populácie. Ak chcete vykonať jednoduchý náhodný výber, musíte mať prístup k úplnému rámcu výberu – to znamená k zoznamu všetkých členov populácie, z ktorej budete vyberať vzorku. Taktiež by všetci členovia populácie mali mať pomerne podobné charakteristiky, inak vaša vzorka nemusí byť veľmi zmysluplná.[1]

  • Toto môže byť napríklad dobrá možnosť, ak váš výberový súbor tvoria všetci žiaci materských škôl z jedného okresu verejnej predmestskej školy. Ide o dobre definovanú, pomerne obmedzenú populáciu jednotlivcov, ktorí majú pravdepodobne podobné charakteristiky (napríklad vek a sociálno-ekonomický status).
  • Jednoduchá náhodná vzorka je menej pravdepodobná v prípade väčšej alebo rôznorodejšej skupiny, napríklad všetkých študentov K-12 v Kalifornii.


Definujte svoju populáciu. Začnite určením presnej veľkosti a charakteristík vášho výberového súboru. Na opis veľkosti celkovej populácie použite premennú N. Náhodnú vzorku budete vyberať z tejto populácie.[2]

  • Napríklad povedzme, že skúmate konkrétnu skupinu záhadných slimákov chovaných v akváriu. Ak je v nádrži 53 slimákov, potom N=53.


Určite požadovanú veľkosť vzorky. Vaša náhodná vzorka bude pozostávať zo skupiny jednotlivcov, ktorí sú aspoň teoreticky reprezentatívni pre celú populáciu. Vyberte, koľko členov populácie chcete vybrať, a definujte vzorku pomocou premennej n.[3]

  • Ak sa napríklad rozhodnete odobrať vzorku 10 z 53 slimákov v nádrži, potom n=10.
  • Hoci neexistuje žiadne stanovené číslo, ktoré by ste museli použiť pre veľkosť vzorky, môžete použiť kalkulačku veľkosti vzorky, ktorá vám pomôže určiť najlepšiu veľkosť vzorky na základe požadovanej úrovne spoľahlivosti a rozpätia chyby (alebo intervalu spoľahlivosti). Vyhľadajte „kalkulačka veľkosti vzorky.“

Majte na pamäti: Väčšie vzorky zvyčajne poskytujú presnejšie informácie s menším rozpätím chyby. V prípade malej, homogénnej populácie však majú menšie vzorky tendenciu byť významnejšie, ako by to bolo v prípade väčšej, rozmanitejšej populácie.[4]


Každému členovi populácie priraďte identifikačné číslo. Predtým, ako si vyberiete vzorku, budete potrebovať spôsob, ako identifikovať jednotlivé osoby vo vašej populácii. Každému členovi populácie N prideľte jedinečné číslo alebo iný identifikátor.[5]

  • Mohli by ste napríklad jednoducho očíslovať svoje slimáky od 1 do 53.
  • Prípadne môžete identifikovať členov populácie podľa mena alebo názvu. Napríklad, ak vašu populáciu tvoria knihy, názov každej knihy by mohol slúžiť na jej identifikáciu vo vzorke.[6]


Ak máte malú populáciu, vyberte vzorku losovaním. Ak je vaša populácia a veľkosť vzorky relatívne malá, potom je lotéria rýchlym a jednoduchým spôsobom, ako získať vzorku. Napíšte si identifikačné číslo alebo meno každého člena populácie na samostatné prúžky papiera, potom ich vložte do misky a premiešajte ich. Z misky vytiahnite vopred určený počet prúžkov, aby ste vytvorili vzorku.[7]

  • Napríklad, ak vyberáte vzorku 10 slimákov z populácie 53, potom môžete vylosovať čísla 6, 1, 34, 12, 9, 52, 16, 2, 20 a 8.
  • Každý člen populácie bude mať rovnakú šancu byť vylosovaný, čím sa vytvorí skutočne náhodná vzorka.
  • Ak chcete vypočítať presnú pravdepodobnosť, že sa vyberie ktorýkoľvek 1 jedinec, vydeľte veľkosť vzorky (n) celkovým počtom populácie (N) a vynásobte 100 %. Napríklad 10/53 x 100 % = 18.87 %, čo znamená, že každý slimák má približne 19 % šancu, že sa dostane do vzorky.


Pri väčších vzorkách použite generátor náhodných čísel. Ak je vaša vzorka príliš veľká na to, aby ste mohli ľahko uskutočniť lotériu, dobrou alternatívou je generátor náhodných čísel.[8]
Do generátora zadajte rozsah čísel vo vašej populácii a nastavte ho tak, aby vytvoril súbor náhodných celých čísel rovnakej veľkosti ako vaša vzorka.

  • Ak napríklad vyberáte vzorku 500 žiakov materskej školy z populácie 2 000 žiakov, generátor náhodných čísel je dobrou voľbou.
  • Na internete nájdete rôzne generátory náhodných čísel. Skúste použiť generátor celočíselných množín na stránke http://www.náhodný.org.


Odoberte viacero vzoriek „bez výmeny“, aby ste sa vyhli duplicite. Ak plánujete odobrať viac ako jednu vzorku, možno budete chcieť zabezpečiť, aby sa v rôznych vzorkách nevyskytovali tí istí jednotlivci. Na tento účel budete musieť z budúcich vzoriek vylúčiť predtým odobraté vzorky. Tento postup sa nazýva „jednoduchý náhodný výber bez náhrady“ (SRSWOR).[9]

  • Ak napríklad vyberáte vzorky žrebovaním, vyčleňte čísla pre všetkých členov populácie, ktorých nechcete zahrnúť do žrebovania.
  • Ak používate generátor náhodných čísel, hľadajte taký, ktorý vám umožní vylúčiť konkrétne celé čísla z náhodne vygenerovaných súborov.
  • Jednoduchý náhodný výber, ktorý umožňuje duplicitu, sa nazýva „jednoduchý náhodný výber s nahradením“ (SRSWR).

Metóda 2 z 3: Stratifikovaný náhodný výber


Rozhodnite sa pre stratifikovaný výber vzoriek, ak potrebujete podrobnejšiu analýzu. Stratifikovaný náhodný výber môže poskytnúť zmysluplnejšie výsledky, ak pracujete s väčšími a rôznorodejšími populáciami. Túto možnosť vyberte, ak chcete mať možnosť pozrieť sa na to, ako vaše študijné premenné fungujú v rôznych podskupinách vášho celkového výberového súboru.[10]

  • Ak sa napríklad zaujímate o spokojnosť s prácou medzi zamestnanými ľuďmi v meste, stratifikovaný výber môže byť dobrou voľbou, pretože vaša vzorka bude zahŕňať veľký počet ľudí s veľmi rozdielnym vzdelaním, platmi a pracovnými skúsenosťami.


Rozdeľte svoju populáciu do vrstiev podľa spoločných charakteristík. Po definovaní rámca vzorky populácie (N) sa rozhodnite, ako chcete zoskupiť členov populácie. Budete potrebovať poznať celkový počet jedincov v celej populácii, ako aj počet jedincov v každej vrstve.[11]

  • Ak napríklad skúmate skupinu 500 slimákov, môžete ju rozdeliť na vrstvy slimákov s červenými, modrými a čiernymi ulitami. Z celkovej populácie (N=500) môže vašu vrstvu tvoriť 287 červených slimákov, 67 modrých slimákov a 146 čiernych slimákov.
  • V tomto príklade je Nˬ1=287, Nˬ2=67 a Nˬ3=146.


Rozhodnite o požadovanej veľkosti vzorky pre každú vrstvu. Pri stratifikovanom výbere vzoriek existujú rôzne spôsoby výberu veľkosti vzorky. Prístup, ktorý použijete, bude čiastočne závisieť od toho, aké zdroje máte k dispozícii a ako presné chcete mať výsledky. Dva bežné prístupy sú: [12]

  • Rovnomerné rozdelenie. Pri tomto prístupe by ste vybrali rovnakú veľkosť vzorky (e.g., n=25) z každej vrstvy. Ak použijete tento prístup, majte na pamäti, že vaše výsledky môžu byť skreslené, ak sú niektoré skupiny populácie zastúpené lepšie ako iné.
  • Pomerné prideľovanie. To zahŕňa výber veľkosti vzorky, ktorá je úmerná veľkosti každej vrstvy. Na to použite vzorec nˬi = (n/N)Nˬi, kde nˬi je veľkosť vzorky pre jednotlivé vrstvy, n je celková veľkosť vzorky, N je celková veľkosť populácie a Nˬi je veľkosť vrstvy.


Z každej vrstvy vyberte náhodnú vzorku. Na základe veľkosti vzorky, ktorú ste si určili, vytvorte náhodnú vzorku pre každú vrstvu. Môžete to urobiť buď pomocou techniky lotérie, alebo generátora náhodných čísel. Výsledné vzorky by mali byť reprezentatívne pre rôzne segmenty vašej celkovej populácie.[13]

  • Ak by ste sa napríklad rozhodli, že zo skupiny 500 slimákov vyberiete vzorku 100 slimákov, pri použití stratégie pomerného rozdelenia by ste museli vybrať náhodnú vzorku 57 červených slimákov, 13 modrých slimákov a 30 čiernych slimákov.

Metóda 3 z 3: Náhodný zhlukový výber


Použite náhodný zhlukový výber, ak sú iné metódy nepraktické. Ak máte do činenia s obrovskou alebo široko rozptýlenou populáciou, jednoduchý alebo stratifikovaný výber vzorky môže byť ťažký alebo nemožný. V týchto situáciách budete musieť náhodne vybrať niekoľko menších skupín, s ktorými budete pracovať a ktoré, dúfajme, budú reprezentatívne pre celú populáciu.[14]

  • Ak by ste napríklad chceli urobiť štúdiu o túlavých mačkách v Chicagu, zhromaždiť údaje o celej populácii by pravdepodobne nebolo možné. Náhodný zhlukový výber by dobre fungoval v takejto situácii.
  • Majte na pamäti, že zhlukový výber nie je taký spoľahlivý ako iné typy náhodného výberu. V mnohých situáciách je to však najmenej nákladná a najefektívnejšia forma výberu vzorky.[15]


Rozdeľte svoju populáciu do niekoľkých skupín, ktoré sa nazývajú klastre. Keď ste definovali populáciu, s ktorou chcete pracovať, rozdeľte ju na niekoľko vhodných skupín, pre ktoré môžete ľahko získať prístup k dobre definovaným výberovým rámcom. Tieto zhluky budú tvoriť základ vašich údajov pre výber vzorky.[16]

  • Napríklad v prípade vašej štúdie o túlavých mačkách v Chicagu môžete údaje rozdeliť podľa jednotlivých štvrtí, pre ktoré máte kompletné záznamy o miestnych populáciách túlavých mačiek.


Vezmite náhodnú vzorku zhlukov. Rozhodnite, koľko zhlukov chcete použiť na získanie reprezentatívnej vzorky, a potom použite techniku jednoduchého náhodného výberu na výber tohto počtu zhlukov. Tým získate vzorovú skupinu, z ktorej budete získavať údaje.[17]

  • Napríklad, ak máte údaje o túlavých mačkách z 25 chicagských štvrtí, môžete sa rozhodnúť študovať mačky v 5 z týchto skupín.
  • Na výber skupín, ktoré chcete študovať, použite lotériu alebo generátor náhodných čísel.

  • Vytvorte si súbor údajov od každého jednotlivca v rámci každého zhluku. Zhlukový výber sa od iných foriem náhodného výberu líši tým, že neberiete náhodnú vzorku jednotlivcov zo skupiny populácie. Namiesto toho analyzujte celú populáciu každého zoskupenia, aby ste získali výsledky.[18]

    Tip: Keď robíte zhlukový výber, spravidla získate presnejšie výsledky, ak vezmete väčší počet menších zhlukov. Výber vzoriek len z niekoľkých väčších zhlukov je však jednoduchší a efektívnejší.[19]

  • Odkazy