3 spôsoby výpočtu odchýlky

Rozptyl je mierou toho, ako je súbor údajov rozložený. Je to užitočné pri vytváraní štatistických modelov, pretože nízky rozptyl môže byť znakom toho, že príliš prispôsobujete údaje. Výpočet odchýlky môže byť zložitý, ale keď si vzorec osvojíte, stačí dosadiť správne čísla, aby ste našli svoju odpoveď.

Pomoc pri výpočte odchýlky


Kontrolný list o odchýlkach

Podpora wikiHow a odomknite všetky vzorky.

Metóda 1 z 2:Výpočet rozptylu vzorky


Zapíšte si súbor vzoriek údajov. Vo väčšine prípadov majú štatistici prístup len k vzorke alebo k podmnožine populácie, ktorú skúmajú. Napríklad namiesto analýzy populácie „náklady na každé auto v Nemecku“ by štatistik mohol zistiť náklady na náhodnú vzorku niekoľkých tisíc áut. Túto vzorku môže použiť na získanie dobrého odhadu nákladov na nemecké auto, ale pravdepodobne nebude presne zodpovedať skutočným číslam.

  • Príklad: Pri analýze počtu predaných muffinov každý deň v bufete náhodne vyberiete šesť dní a dostanete tieto výsledky: 38, 37, 36, 28, 18, 14, 12, 11, 10.7, 9.9. Toto je vzorka, nie populácia, pretože nemáte údaje o každom dni, keď bola kaviareň otvorená.
  • Ak máte každý údajov v populácii, prejdite radšej na nižšie uvedenú metódu.


Zapíšte vzorec pre výberový rozptyl. Rozptyl súboru údajov hovorí o tom, ako sú jednotlivé body údajov rozptýlené. Čím bližšie je rozptyl k nule, tým tesnejšie sú dátové body zoskupené. Pri práci s výberovými súbormi údajov použite na výpočet rozptylu nasledujúci vzorec: [1]

  • s2{\displaystyle s^{2}}

    = ∑[(

    xi{\displaystyle x_{i}}

    – x̅)

    2{\displaystyle ^{2}}

    ]/(n – 1)

  • s2{\displaystyle s^{2}}

    je rozptyl. Rozptyl sa vždy meria v štvorcových jednotkách.

  • xi{\displaystyle x_{i}}

    predstavuje člen vo vašom súbore údajov.

  • ∑, čo znamená „súčet“, hovorí, že pre každú hodnotu treba vypočítať nasledujúce výrazy
    xi{\displaystyle x_{i}}

    , potom ich sčítajte.

  • x̅ je priemer vzorky.
  • n je počet dátových bodov.


Vypočítajte priemer vzorky. Symbol x̅ alebo „x-bar“ označuje priemer vzorky.[2]
Vypočítajte to tak, ako by ste vypočítali akýkoľvek priemer: spočítajte všetky dátové body a potom ich vydeľte počtom dátových bodov.[3]
Expertný zdroj
Mario Banuelos, PhD
Asistent profesora matematiky
Expertný rozhovor. 11. decembra 2021.

  • Príklad: Najskôr sčítajte svoje dátové body: 17 + 15 + 23 + 7 + 9 + 13 = 84
    Potom svoju odpoveď vydeľte počtom dátových bodov, v tomto prípade šiestimi: 84 ÷ 6 = 14.
    Priemer vzorky = x̅ = 14.
  • Priemer si môžete predstaviť ako „stredový bod“ údajov. Ak sa údaje zhlukujú okolo strednej hodnoty, rozptyl je nízky. Ak je rozptýlená ďaleko od priemeru, rozptyl je vysoký.[4]
    Odborný zdroj
    Mario Banuelos, PhD
    Odborný asistent matematiky
    Rozhovor s odborníkom. 11. decembra 2021.


Odpočítajte priemer z každého dátového bodu. Teraz je čas vypočítať

xi{\displaystyle x_{i}}

– x̅, kde

xi{\displaystyle x_{i}}

je každé číslo vo vašom súbore údajov. Každá odpoveď hovorí o odchýlke daného čísla od priemeru, alebo zjednodušene povedané, ako ďaleko je od priemeru.[5]
Expert Zdroj
Mario Banuelos, PhD
Odborný asistent matematiky
Expertný rozhovor. 11. decembra 2021.

  • Príklad:

    x1{\displaystyle x_{1}}

    – x̅ = 17 – 14 = 3

    x2{\displaystyle x_{2}}

    – x̅ = 15 – 14 = 1

    x3{\displaystyle x_{3}}

    – x̅ = 23 – 14 = 9

    x4{\displaystyle x_{4}}

    – x̅ = 7 – 14 = -7

    x5{\displaystyle x_{5}}

    – x̅ = 9 – 14 = -5

    x6{\displaystyle x_{6}}

    – x̅ = 13 – 14 = -1

  • Svoju prácu si ľahko skontrolujete, pretože vaše odpovede by sa mali rovnať nule. Vyplýva to z definície priemeru, pretože záporné odpovede (vzdialenosť od priemeru k menším číslam) presne vyrušia kladné odpovede (vzdialenosť od priemeru k väčším číslam).


Každý výsledok vyčíslite na druhú stranu. Ako je uvedené vyššie, váš aktuálny zoznam odchýlok (

xi{\displaystyle x_{i}}

– x̅) súčet je nula. To znamená, že „priemerná odchýlka“ bude tiež vždy nulová, takže to nič nehovorí o tom, ako sú údaje rozložené. Ak chcete vyriešiť tento problém, nájdite štvorec každej odchýlky. Tým sa všetky stanú kladnými číslami, takže záporné a kladné hodnoty sa už nerušia na nulu.[6]

  • Príklad:
    (

    x1{\displaystyle x_{1}}

    – x̅)

    2=32=9{\displaystyle ^{2}=3^{2}=9}

    (x2{\displaystyle (x_{2}}

    – x̅)

    2=12=1{\displaystyle ^{2}=1^{2}=1}

    92 = 81
    (-7)2 = 49
    (-5)2 = 25
    (-1)2 = 1

  • Teraz máte hodnotu (
    xi{\displaystyle x_{i}}

    – x̅)

    2{\displaystyle ^{2}}

    pre každý dátový bod vo vašej vzorke.


Nájdite súčet štvorcových hodnôt. Teraz je čas vypočítať celý čitateľ vzorca: ∑[(

xi{\displaystyle x_{i}}

– x̅)

2{\displaystyle ^{2}}

]. Veľké písmeno sigma, ∑, vám hovorí, aby ste pre každú hodnotu nasledujúceho člena sčítali hodnotu

xi{\displaystyle x_{i}}

. Už ste vypočítali (

xi{\displaystyle x_{i}}

– x̅)

2{\displaystyle ^{2}}

pre každú hodnotu

xi{\displaystyle x_{i}}

vo vašej vzorke, takže všetko, čo musíte urobiť, je sčítať výsledky všetkých štvorcových odchýlok.[7]
Odborný zdroj
Mario Banuelos, PhD
Odborný asistent matematiky
Rozhovor s odborníkom. 11. decembra 2021.

  • Príklad: 9 + 1 + 81 + 49 + 25 + 1 = 166.


Vydelte n – 1, kde n je počet dátových bodov. Pred časom štatistici pri výpočte rozptylu vzorky jednoducho delili n. Tým získate priemernú hodnotu štvorcovej odchýlky, ktorá dokonale zodpovedá rozptylu tejto vzorky. Ale nezabudnite, že vzorka je len odhad väčšej populácie. Ak by ste zobrali inú náhodnú vzorku a vykonali rovnaký výpočet, dostali by ste iný výsledok. Ako sa ukázalo, delením n – 1 namiesto n získate lepší odhad rozptylu väčšej populácie, čo vás skutočne zaujíma. Táto korekcia je taká bežná, že je v súčasnosti akceptovanou definíciou rozptylu vzorky.[8]

  • Príklad: Vo vzorke je šesť dátových bodov, takže n = 6.
    Rozptyl vzorky =

    s2=16661={\displaystyle s^{2}={\frac {166}{6-1}}=}

    33.2


Rozumieť rozptylu a štandardnej odchýlke. Všimnite si, že keďže vo vzorci bol exponent, rozptyl sa meria v jednotke štvorca pôvodných údajov. To môže sťažiť intuitívne pochopenie. Namiesto toho je často užitočné použiť štandardnú odchýlku. Svoju námahu ste však nepremárnili, pretože smerodajná odchýlka je definovaná ako odmocnina z rozptylu. Preto sa píše rozptyl vzorky

s2{\displaystyle s^{2}}

, a štandardná odchýlka vzorky je

s{\displaystyle s}

.

  • Napríklad štandardná odchýlka uvedenej vzorky = s = √33.2 = 5.76.

Metóda 2 z 2:Výpočet rozptylu populácie


Začnite so súborom údajov o populácii. Pojem „populácia“ označuje celkový súbor relevantných pozorovaní. Ak napríklad skúmate vek obyvateľov Texasu, vaša populácia bude obsahovať vek každého jedného obyvateľa Texasu. Za normálnych okolností by ste pre takýto veľký súbor údajov vytvorili tabuľku, ale tu je menší príklad súboru údajov:

  • Príklad: V miestnosti akvária je presne šesť akvárií s rybami. V šiestich nádržiach sa nachádzajú nasledujúce počty rýb:

    x1=5{\displaystyle x_{1}=5}

    x2=5{\displaystyle x_{2}=5}

    x3=8{\displaystyle x_{3}=8}

    x4=12{\displaystyle x_{4}=12}

    x5=15{\displaystyle x_{5}=15}

    x6=18{\displaystyle x_{6}=18}


Napíšte vzorec pre populačný rozptyl. Keďže populácia obsahuje všetky údaje, ktoré potrebujete, tento vzorec vám poskytne presný rozptyl populácie. Aby sa odlíšil od výberového rozptylu (ktorý je len odhadom), štatistici používajú rôzne premenné:[9]

  • σ
    2{\displaystyle ^{2}}

    = (∑(

    xi{\displaystyle x_{i}}

    – μ)

    2{\displaystyle ^{2}}

    )/n

  • σ
    2{\displaystyle ^{2}}

    = populačný rozptyl. Toto je sigma s malým začiatočným písmenom, na štvorček. Rozptyl sa meria v štvorcových jednotkách.

  • xi{\displaystyle x_{i}}

    predstavuje člen vo vašom súbore údajov.

  • Výrazy vnútri ∑ sa vypočítajú pre každú hodnotu
    xi{\displaystyle x_{i}}

    , potom súčet.

  • μ je populačný priemer
  • n je počet dátových bodov v populácii


Nájdite strednú hodnotu populácie. Pri analýze populácie symbol μ („mu“) predstavuje aritmetický priemer. Ak chcete zistiť priemer, spočítajte všetky dátové body a potom ich vydeľte počtom dátových bodov.

  • Môžete si predstaviť priemer ako „priemer“, ale buďte opatrní, pretože toto slovo má v matematike viacero definícií.
  • Príklad: priemer = μ =

    5+5+8+12+15+186{\displaystyle {\frac {5+5+8+12+15+18}{6}}}

    = 10.5


Odpočítajte priemer z každého dátového bodu. Dátové body blízke strednej hodnote budú mať za následok rozdiel blízky nule. Zopakujte úlohu odčítania pre každý údajový bod a možno začnete mať predstavu o tom, ako sú údaje rozložené.

  • Príklad:

    x1{\displaystyle x_{1}}

    – μ = 5 – 10.5 = -5.5

    x2{\displaystyle x_{2}}

    – μ = 5 – 10.5 = -5.5

    x3{\displaystyle x_{3}}

    – μ = 8 – 10.5 = -2.5

    x4{\displaystyle x_{4}}

    – μ = 12 – 10.5 = 1.5

    x5{\displaystyle x_{5}}

    – μ = 15 – 10.5 = 4.5

    x6{\displaystyle x_{6}}

    – μ = 18 – 10.5 = 7.5


Každú odpoveď vynásobte štvorcom. Práve teraz budú niektoré z vašich čísel z posledného kroku záporné a niektoré kladné. Ak si svoje údaje predstavíte na číselnej priamke, tieto dve kategórie predstavujú čísla naľavo od priemeru a čísla napravo od priemeru. Toto nie je dobré na výpočet rozptylu, pretože tieto dve skupiny sa navzájom vyrušia. Každé číslo odmocnite tak, aby boli všetky kladné.

  • Príklad:
    (

    xi{\displaystyle x_{i}}

    – μ)

    2{\displaystyle ^{2}}

    pre každú hodnotu i od 1 do 6:
    (-5.5)

    2{\displaystyle ^{2}}

    = 30.25
    (-5.5)

    2{\displaystyle ^{2}}

    = 30.25
    (-2.5)

    2{\displaystyle ^{2}}

    = 6.25
    (1.5)

    2{\displaystyle ^{2}}

    = 2.25
    (4.5)

    2{\displaystyle ^{2}}

    = 20.25
    (7.5)

    2{\displaystyle ^{2}}

    = 56.25


Nájdite priemer svojich výsledkov. Teraz máte pre každý dátový bod hodnotu, ktorá súvisí (nepriamo) s tým, ako ďaleko je tento dátový bod od priemeru. Vezmite priemer týchto hodnôt tak, že ich všetky sčítate a potom vydelíte počtom hodnôt.

  • Príklad:
    Rozptyl populácie =

    30.25+30.25+6.25+2.25+20.25+56.256=145.56={\displaystyle {\frac {30.25+30.25+6.25+2.25+20.25+56.25}{6}}={\frac {145.5}{6}}=}

    24.25


  • Vzťahujte to späť k vzorcu. Ak si nie ste istí, ako to zodpovedá vzorcu na začiatku tejto metódy, skúste si celú úlohu napísať rukou:

    • Po zistení rozdielu od priemeru a odmocnení máte hodnotu (
      x1{\displaystyle x_{1}}

      – μ)

      2{\displaystyle ^{2}}

      , (

      x2{\displaystyle x_{2}}

      – μ)

      2{\displaystyle ^{2}}

      , a tak ďalej až do (

      xn{\displaystyle x_{n}}

      – μ)

      2{\displaystyle ^{2}}

      , kde

      xn{\displaystyle x_{n}}

      je posledným údajom v súbore.

    • Ak chcete zistiť priemer týchto hodnôt, spočítajte ich a vydeľte n: ( (
      x1{\displaystyle x_{1}}

      – μ)

      2{\displaystyle ^{2}}

      + (

      x2{\displaystyle x_{2}}

      – μ)

      2{\displaystyle ^{2}}

      + … + (

      xn{\displaystyle x_{n}}

      – μ)

      2{\displaystyle ^{2}}

      ) / n

    • Po prepísaní čitateľa v sigma zápise dostaneme (∑(
      xi{\displaystyle x_{i}}

      – μ)

      2{\displaystyle ^{2}}

      )/n, vzorec pre odchýlku.

  • Odkazy

      https://www.youtube.com/watch?v=VgKHjVDK0uM

      http://stattrek.com/statistika/poznámka.aspx

      Mario Banuelos, PhD. Odborný asistent matematiky. Rozhovor s odborníkom. 11. decembra 2021.

      Mario Banuelos, PhD. Odborný asistent matematiky. Rozhovor s odborníkom. 11. decembra 2021.

      Mario Banuelos, PhD. Odborný asistent matematiky. Rozhovor s odborníkom. 11. decembra 2021.

      https://www.youtube.com/watch?v=sOb9b_AtwDg

      Mario Banuelos, PhD. Odborný asistent matematiky. Rozhovor s odborníkom. 11. decembra 2021.

      https://www.youtube.com/watch?v=sOb9b_AtwDg

      https://www.youtube.com/watch?v=VgKHjVDK0uM