logo

Rozptyl

Rozptyl je nameraná hodnota používaná na zistenie, ako sú údaje rozložené vzhľadom na strednú alebo priemernú hodnotu súboru údajov. Používa sa na zistenie, ako sú distribučné údaje rozložené vzhľadom na strednú alebo priemernú hodnotu. Symbol použitý na definovanie rozptylu je σ2. Je to štvorec štandardnej odchýlky.

V štatistike sa používajú dva typy rozptylu,



  • Vzorový rozptyl
  • Rozptyl populácie

Rozptyl populácie sa používa na určenie toho, ako každý údajový bod v konkrétnej populácii kolíše alebo je rozložený, zatiaľ čo rozptyl vzorky sa používa na nájdenie priemeru štvorcových odchýlok od priemeru.

V tomto článku sa dozvieme o Rozptyl (vzorka, populácia), ich vzorce, vlastnosti a ďalšie v detailoch.

Obsah



Čo je rozptyl?

Meriame rôzne hodnoty údajov a tieto hodnoty sa používajú na rôzne účely. Údaje môžu byť uvedené v dvoch typoch zoskupených údajov alebo nezoskupených (diskrétnych) údajoch. Ak sú údaje uvedené vo forme intervalov tried, nazývajú sa zoskupené údaje, zatiaľ čo ak sú údaje uvedené vo forme jedného údajového bodu, označujú sa ako diskrétny alebo nezoskupený údajový bod. Rozptyl je miera rozptylu údajov vzhľadom na strednú hodnotu údajov. Hovorí nám, ako sú dáta rozptýlené v danej dátovej hodnote. Môžeme jednoducho vypočítať rozptyl vzorky a rozptyl populácie pre zoskupené aj nezoskupené údaje.

Definícia rozptylu

Rozptyl je štatistická miera, ktorá kvantifikuje rozšírenie alebo rozptyl súboru údajových bodov. Udáva, do akej miery sa jednotlivé dátové body v súbore údajov líšia od priemeru (priemeru) súboru údajov

Typy rozptylu

Rozptyl daných údajov môžeme definovať v dvoch typoch,



  • Rozptyl populácie
  • Vzorový rozptyl

Teraz sa o nich dozvieme podrobne.

Rozptyl populácie

Populačný rozptyl sa používa na zistenie šírenia danej populácie. Populácia je definovaná ako skupina ľudí a všetci ľudia v tejto skupine sú súčasťou populácie. Hovorí nám o tom, ako sa mení populácia skupiny vzhľadom na priemernú populáciu.

Všetci členovia skupiny sú známi ako populácia. Keď chceme zistiť, ako sa každý údajový bod v danej populácii líši alebo je rozložený, použijeme rozptyl populácie. Používa sa na určenie štvorcovej vzdialenosti každého dátového bodu od priemeru populácie.

Vzorový rozptyl

Ak sú údaje o populácii veľmi veľké, je ťažké vypočítať rozptyl populácie súboru údajov. V takom prípade vezmeme vzorku údajov z daného súboru údajov a nájdeme rozptyl tohto súboru údajov, ktorý sa nazýva vzorový rozptyl. Pri výpočte priemeru vzorky dbáme na to, aby sme vypočítali priemer vzorky, t. j. priemer súboru údajov vzorky, nie priemer populácie. Vzorový rozptyl môžeme definovať ako priemer druhej mocniny rozdielu medzi bodom údajov vzorky a priemerom vzorky.

Symbol rozptylu

Symbol pre rozptyl je zvyčajne reprezentovaný gréckym písmenom sigma na druhú (σ²), keď sa odkazuje na rozptyl populácie. Pre rozptyl vzorky sa často označuje ako s².

Príklad rozptylu

Koncept rozptylu môžeme pochopiť pomocou príkladu uvedeného nižšie.

Nájdite rozptyl údajov {4,6,8,10}

Riešenie:

Priemer = (4+6+8+10)/4 = 7

4 (4-7)2 9
6 (6-7)2 1
8 (8-7)2 1
10 (10-7)2 9

Rozptyl = (9+1+1+9)/4 = 20/4 = 5

Rozptyl údajov je teda 5

Vzorec rozptylu

Rozptyl pre súbor údajov je označený symbolom σ2. Pre údaje o populácii sa jeho vzorec rovná súčtu štvorcových rozdielov údajových záznamov od priemeru vydelenému počtom záznamov. Zatiaľ čo pri vzorových údajoch delíme hodnotu čitateľa rozdielom medzi počtom záznamov a jednotkou.

Vzorec pre rozptyl

Ak je súbor údajov vzorka, vzorec rozptylu je daný:

p 2 = ∑ (x i - X) 2 /(n – 1)

kde,

  • X je priemer súboru údajov vzorky
  • n je celkový počet pozorovaní

Vzorec rozptylu populácie

Ak máme súbor údajov o populácii, vzorec je napísaný ako,

p 2 = ∑ (x i - X) 2 /n

kde,

  • X je priemer súboru údajov o populácii
  • n je celkový počet pozorovaní

Môžeme tiež vypočítať rozptyl pre zoskupené a nezoskupené súbory údajov. Rôzne vzorce pre rozptyl sú,

aktuálny dátum v jazyku java

Vzorec rozptylu pre zoskupené údaje

Pre zoskupené údaje je vzorec rozptylu diskutovaný nižšie,

Vzorový vzorec pre odchýlky pre zoskupené údaje (σ 2 ) = ∑ f(m i - X) 2 /(n-1)

Vzorec rozptylu populácie pre zoskupené údaje (str 2 ) = ∑ f(m i - X) 2 /n

kde,

  • f je frekvencia každého intervalu
  • m i je stred ithinterval
  • X je priemer zoskupených údajov

Pre zoskupené údaje sa priemer vypočíta ako:

Priemer = ∑ (f i X i ) / ∑ f i

Vzorec rozptylu pre nezoskupené údaje

Pre nezoskupené údaje je vzorec rozptylu diskutovaný nižšie,

  • Vzorový vzorec pre odchýlky pre nezoskupené údaje (str 2 ) = ∑ (x i - X) 2 /(n-1)
  • Vzorec rozptylu populácie pre nezoskupené údaje (str 2 ) = ∑ (x i - X) 2 /n

kde X je priemer zoskupených údajov

Vzorec na výpočet rozptylu

Vzorec použitý na výpočet rozptylu je uvedený na obrázku nižšie,

Vzorec rozptylu

Ako vypočítať rozptyl?

Vo všeobecnosti rozptyl znamená rozptyl štandardu populácie. Kroky na výpočet rozptylu daného súboru hodnôt sú:

Krok 1: Vypočítajte priemer pozorovania pomocou vzorca (priemer = súčet pozorovaní/počet pozorovaní)

Krok 2: Vypočítajte druhú mocninu rozdielov hodnôt údajov od priemeru. (hodnota údajov – priemer)2

Krok 3: Vypočítajte priemer druhej mocniny rozdielov daných hodnôt, ktoré sa nazývajú rozptyl súboru údajov.

(Variancia = súčet štvorcových rozdielov / počet pozorovaní)

Rozptyl a štandardná odchýlka

Rozptyl a Štandardná odchýlka obe sú mierou centrálnej tendencie, ktorá nám hovorí o rozsahu, v akom sa hodnoty súboru údajov odchyľujú od centrálnej alebo strednej hodnoty súboru údajov.

Pre každý daný súbor údajov existuje určitý vzťah medzi rozptylom a štandardnou odchýlkou.

Rozptyl = (štandardná odchýlka) 2

Rozptyl je definovaný ako druhá mocnina štandardnej odchýlky, t. j. ak vezmeme druhú mocninu štandardnej odchýlky pre akúkoľvek skupinu údajov, získame rozptyl daného súboru údajov. rozptyl je definovaný pomocou symbolu p 2 keďže p sa používa na definovanie štandardnej odchýlky súboru údajov. Rozptyl súboru údajov je vyjadrený v jednotkách na druhú, zatiaľ čo štandardná odchýlka súboru údajov je vyjadrený v jednotke podobnej priemeru súboru údajov.

Uč sa viac: Rozptyl a štandardná odchýlka

Rozptyl binomického rozdelenia

Binomické rozdelenie je diskrétne rozdelenie pravdepodobnosti, ktoré nám hovorí o počte pozitívnych výsledkov v binomickom experimente vykonanom n-krát. Výsledok binomického experimentu je 0 alebo 1, teda buď pozitívny alebo negatívny.

V binomickom experimente o n pokusov a kde je uvedená pravdepodobnosť každého pokusu p , potom sa rozptyl binomického rozdelenia zadá pomocou,

p 2 = np (1 – p)

kde 'napr' je definovaný ako priemer hodnôt binomického rozdelenia.

Rozptyl Poissonovho rozdelenia

Distribúcia jedov je definované ako diskrétne rozdelenie pravdepodobnosti, ktoré sa používa na definovanie pravdepodobnosti „n“ počtu udalostí vyskytujúcich sa v časovom období „x“. Priemer v Poissonovom rozdelení je definovaný symbolom l.

V Poissonovom rozdelení sú priemer a rozptyl daného súboru údajov rovnaké. Rozptyl Poissonovho rozdelenia je daný pomocou vzorca,

p 2 = λ

Rozptyl rovnomernej distribúcie

Pri rovnomernom rozdelení sú údaje o rozdelení pravdepodobnosti spojité. Výsledok týchto experimentov leží v rozsahu medzi špecifickou hornou hranicou a špecifickou dolnou hranicou, a preto sa tieto distribúcie nazývajú aj obdĺžnikové distribúcie. Ak je horná hranica alebo maximálna hranica b a dolná hranica alebo minimálna hranica je a potom sa rozptyl rovnomerného rozdelenia vypočíta pomocou vzorca,

p 2 = (1/12) (b – a) 2

Priemer rovnomerného rozdelenia je daný pomocou vzorca,

Priemer = (b + a) / 2

kde,

  • b je horná hranica rovnomerného rozdelenia
  • a je spodná hranica rovnomerného rozdelenia

Rozptyl a kovariancia

Rozptyl súboru údajov definuje volatilitu všetkých hodnôt súboru údajov vzhľadom na strednú hodnotu súboru údajov. Kovariancia nám hovorí, ako náhodné premenné navzájom súvisia, a hovorí nám, ako zmena jednej premennej ovplyvňuje zmenu iných premenných.

Kovariancia môže byť pozitívna alebo negatívna, pozitívna kovariancia znamená, že obe premenné sa pohybujú rovnakým smerom vzhľadom na strednú hodnotu, zatiaľ čo negatívna kovariancia znamená, že obe premenné sa pohybujú v opačných smeroch vzhľadom na strednú hodnotu.

Pre dve náhodné premenné x a y, kde x je závislá premenná a y je nezávislá premenná, sa kovariancia vypočíta pomocou vzorca uvedeného na nižšie priloženom obrázku.

Kovariančný vzorec

Vlastnosti rozptylu

Rozptyl sa široko používa v matematike, štatistike a iných vedných odboroch na rôzne účely. Rozptyl má rôzne vlastnosti, ktoré sa široko používajú na riešenie rôznych problémov. Niektoré zo základných vlastností rozptylu sú,

  • Rozptyl súboru údajov je nezáporná veličina a nulová hodnota rozptylu znamená, že všetky hodnoty súboru údajov sú rovnaké.
  • Vyššia hodnota rozptylu nám hovorí, že všetky hodnoty údajov súboru údajov sú značne rozptýlené, t. j. sú ďaleko od strednej hodnoty súboru údajov.
  • Nižšia hodnota rozptylu nám hovorí, že všetky hodnoty údajov súboru údajov sú blízko seba, t. j. sú veľmi blízko strednej hodnoty súboru údajov.

Pre akékoľvek konštantné „c“

  • Var(x + c) = Var(x)

kde X je náhodná premenná

  • Var(cx) = c2

kde X je náhodná premenná

Tiež, ak a a b sú konštantná hodnota a X je potom náhodná premenná,

  • Var(ax + b) = a2

Pre nezávislé premenné x1, X2, X3…,Xnmy to vieme,

  • Kde (x1+ x2+……+ xn) = Var(x1) + Kde(x2) +……..+Kde(xn)

Ľudia tiež čítajú:

  • Priemerná
  • Režim
  • Rozdiel medzi rozptylom a štandardnou odchýlkou

Príklady variačného vzorca

Príklad 1: Vypočítajte rozptyl údajov vzorky: 7, 11, 15, 19, 24.

Riešenie:

Máme údaje 7, 11, 15, 19, 24

Nájdite priemer údajov.

x̄ = (7 + 11 + 15 + 19 + 24)/5
= 76/5
= 15,2

Pomocou vzorca pre rozptyl dostaneme,

p2= ∑ (xi- X)2/(n – 1)
= (67,24 + 17,64 + 0,04 + 14,44 + 77,44)/(5 – 1)
= 176,8/4
= 44,2

Príklad 2: Vypočítajte počet pozorovaní, ak je rozptyl údajov 12 a súčet štvorcových rozdielov údajov od priemeru je 156.

Riešenie:

Máme,

(Xi- X)2= 156

p2= 12

Pomocou vzorca pre rozptyl dostaneme,

koľko filmov s nemožnými úlohami existuje

p2= ∑ (xi- X)2/n

12 = 156/n

n = 156/12

n = 13

Príklad 3: Vypočítajte rozptyl pre daný údaj

Xi

fi

10 1
4 3
6 5
8 1

Riešenie:

Priemer (x̄) = ∑(fiXi)/∑(fi)

= (10×1 + 4×3 + 6×5 + 8×1)/(1+3+5+1)
= 60/10 = 6

n = ∑(fi) = 1+3+5+1 = 10

Xi

fi

fiXi

(Xi- X)

(Xi- X)2

fi(Xi- X)2

10 1 10 4 16 16
4 3 12 -2 4 12
6 5 30 0 0 0
8 1 8 2 4 8

teraz

p 2 = (∑ i n f i (X i - X) 2 /n)

= [(16 + 12 + 0 +8)/10]
= 3,6

Rozptyl (σ2) = 3,6

Príklad 4: Nájdite rozptyl nasledujúcej tabuľky údajov

Trieda

Frekvencia

0-10 3
10-20 6
20-30 4
30-40 2
40-50 1

Riešenie:

Trieda

Xi

fi

f×Xi

Xi – μ

(Xi – μ)2

f×(Xi – μ)2

0-10

5

3

pätnásť

- pätnásť

225

675

10-20

pätnásť

6

90

-5

25

150

20-30

25

4

100

5

25

100

30-40

35

2

70

pätnásť

225

450

40-50

Štyri

1

Štyri

odstráňte vyrovnávaciu pamäť npm

25

625

625

Celkom

16

320

2000

Priemer (μ) = ∑(fi xi)/∑(fi)
= 320/16 = 20

p 2 = (∑ i n f i (X i – m) 2 /n)

= [(2000)/(16)]
= (125)

Rozptyl daného súboru údajov je 125.

Zhrnutie – rozptyl

Rozptyl je štatistická miera, ktorá ukazuje, ako veľmi sa hodnoty v súbore údajov líšia od priemeru. Pomáha nám porozumieť šíreniu alebo rozptylu údajových bodov. Existujú dva hlavné typy rozptylu: rozptyl populácie, ktorý meria, ako sa rozložia údajové body v celej populácii, a rozptyl vzorky, ktorý meria, ako sa rozložia údajové body vo vzorke. Rozptyl sa označuje ako σ² a je druhou mocninou štandardnej odchýlky. Na výpočet rozptylu nájdete priemer údajov, odčítate priemer z každého údajového bodu, umocníte rozdiely a potom spriemerujete tieto štvorcové rozdiely. Rozptyl je dôležitý, pretože nám pomáha pochopiť variabilitu v rámci súboru údajov. Vysoký rozptyl naznačuje, že dátové body sú široko rozložené, zatiaľ čo nízky rozptyl naznačuje, že sú blízko priemeru. Rozptyl je vždy nezáporný, pretože zahŕňa kvadratúru rozdielov.

Časté otázky o odchýlke

Čo je rozptyl v štatistike?

Rozptyl je definovaný ako rozptyl hodnôt súboru údajov vzhľadom na strednú hodnotu súboru údajov. Rozptyl súboru údajov hovorí, do akej miery sa hodnoty v konkrétnom súbore údajov rozprestierajú od strednej hodnoty.

Čo je to symbol variácie?

Používame symboly σ2, s2 a Var(x) na označenie rozptylu súboru údajov.

Čo je to vzorec rozptylu?

Rozptyl súboru údajov sa vypočíta pomocou vzorca,

p 2 = E[( X – m ) 2 ]

Čo hovorí Variance?

Rozptyl sa používa na zistenie rozsahu rozptylu údajov, t. j. hovorí nám, ako sú hodnoty v súbore údajov rozložené vzhľadom na strednú hodnotu. Pre väčšiu hodnotu rozptylu sú hodnoty široko rozložené vzhľadom na strednú hodnotu, zatiaľ čo pri menšej hodnote rozptylu sú hodnoty tesne rozložené vzhľadom na strednú hodnotu

Aký je vzťah medzi rozptylom a štandardnou odchýlkou?

Pre daný súbor údajov je rozptyl súboru údajov druhou mocninou štandardnej odchýlky tohto súboru údajov. Tento vzťah je vyjadrený ako,

Rozptyl = (štandardná odchýlka) 2

Ako vypočítate rozptyl?

Na výpočet rozptylu najskôr nájdete priemer (priemer) súboru údajov. Potom odčítajte priemer od každého údajového bodu a výsledok umocnite. Nakoniec spriemerujte tieto štvorcové rozdiely.

Prečo je rozptyl dôležitý?

Rozptyl je rozhodujúci pre pochopenie distribúcie údajov v rámci súboru údajov. Pomáha pri určovaní toho, ako sú dátové body rozložené od priemernej hodnoty, čo naznačuje variabilitu alebo konzistenciu v rámci dát.

Aký je rozdiel medzi rozptylom a štandardnou odchýlkou?

Zatiaľ čo rozptyl aj štandardná odchýlka merajú rozptyl údajov, štandardná odchýlka je druhou odmocninou rozptylu. Smerodajná odchýlka je vyjadrená v rovnakých jednotkách ako údaje, vďaka čomu je lepšie interpretovateľná na označenie rozpätia.

Môže byť rozptyl negatívny?

Nie, rozptyl nemôže byť záporný. Keďže sa počíta ako priemer druhej mocniny rozdielov od priemeru, výsledná hodnota je vždy nezáporná.