logo

Ako nájsť štandardnú odchýlku v R?

V tomto článku budeme diskutovať o tom, ako nájsť štandardnú odchýlku v R Programovací jazyk . Smerodajná odchýlka R je mierou rozptylu hodnôt. Môže byť tiež definovaná ako druhá odmocnina rozptylu.

Vzorec štandardnej odchýlky vzorky:



s = sqrt{frac{1}{N-1}displaystylesumlimits_{i=1}^N(x_i-overline{x})^2 }

kde,

  • s = štandardná odchýlka vzorky
  • N = Počet subjektov
  • overline{x}= Priemer entít

V zásade existujú dva rôzne spôsoby, ako vypočítať štandardnú odchýlku v programovacom jazyku R, pričom oba sú uvedené nižšie.



Metóda 1: Naivný prístup

Pri tejto metóde výpočtu smerodajnej odchýlky budeme používať vyššie uvedený štandardný vzorec vzorovej smerodajnej odchýlky v jazyku R.

livecricket.is

Príklad 1:

R

v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)>
>
>

Výkon:



[1]   25.53886>

Príklad 2:

R

v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)>
>
>

Výkon:

[1] 2.676004>

Metóda 2: Použitie sd()

Funkcia sd() sa používa na vrátenie štandardnej odchýlky.

Syntax: sd(x, na.rm = FALSE)

Parametre:

    x: číselný vektor, matica alebo dátový rámec.na.rm: odstrániť chýbajúce hodnoty?

Návrat: Vzorová smerodajná odchýlka x.

Príklad 1:

R

v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sd>(v)> print>(s)>
>
>

Výkon:

[1] 25.53886>

Príklad 2:

importovať skener java

R

v <->c>(71,48,98,65,45,27,39,61,50,24,17)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)>
>
>

Výkon:

[1] 23.52175>

Príklad 3:

R

v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)>
>
>

Výkon:

[1] 2.676004>

Vypočítajte smerodajnú odchýlku dátového rámca:

Oboma metódami môžeme vypočítať smerodajnú odchýlku dátového rámca. môžeme vziať súbor údajov o dúhovke a pre každý stĺpec vypočítame štandardnú odchýlku.

Príklad 1:

R

data>(iris)> sd>(iris$Sepal.Length)> sd>(iris$Sepal.Width)> sd>(iris$Petal.Length)> sd>(iris$Petal.Width)>
>
>

Výkon:

[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377>

Môžeme tiež vypočítať štandardnú odchýlku pre celý dátový rámec spolu s pomocou funkcie Apply.

R

# Load the iris dataset> data>(iris)> # Calculate the standard deviation for each column> std_deviation <->apply>(iris[, 1:4], 2, sd)> # Display the standard deviation values> print>(std_deviation)>
>
>

Výkon:

Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377>

Stĺpce 1 až 4 množiny údajov o dúhovke, čo sú číselné stĺpce nesúce merania premenných, sa vyberajú pomocou výrazu iris[, 1:4] v kóde vyššie.

Funkcia sd sa aplikuje na každý stĺpec (označený 2) vybranej podmnožiny množiny údajov o dúhovke pomocou funkcie použiť. Výsledné hodnoty štandardnej odchýlky sú uložené vo vektore std_deviation pre každý stĺpec.

kat timpf čisté imanie