logo

Pravoskosená distribúcia: Čo to znamená?

feature_right_skewed_histogram

Študovať štatistiky? Potom ste pri popise údajov pravdepodobne počuli frázu „normálne rozdelenie“. Ale čo slovné spojenie „vychýlené správne“? Ako vyzerá histogram skosený doprava? A čo to spôsobuje?

formátovať reťazec java

V tomto článku vám uvádzame príklady histogramov zošikmených doprava a vysvetľujeme, ako sa líšia od grafov normálneho rozdelenia.

Obrázok funkcie: Monika miesto /Wikimedia Commons

Čo je normálna distribúcia?

Skôr než vysvetlíme, čo to znamená, keď sú údaje skreslené správne, zopakujme si definíciu normálneho rozdelenia.

Pri normálnej distribúcii, dve alebo viac premenných zdieľajú priamy vzťah, aby a symetrický súbor údajov , na ktorom ľavá polovica zrkadlí pravú polovicu. Tieto grafy sú tzv zvonové krivky vďaka ich jasne definovanému zvonovitému tvaru:

body_normal_distribution-300 x 215

konverzia int na reťazec v jazyku Java

Na grafe normálneho rozdelenia priemer (priemer), medián a režim sú rovnaké . Všetky tieto body predstavujú stred údajov alebo vrchol grafu.

Čo znamená šikmá doprava?

Zatiaľ čo normálna distribúcia je jednou z najbežnejších foriem distribúcie, nie všetky súbory údajov sledujú túto základnú krivku. Inými slovami, niektoré histogramy sú skreslené doprava alebo doľava .

Pri pravo zošikmenej distribúcii (známej aj ako „pozitívne zošikmené“ rozdelenie) väčšina údajov spadá na pravú alebo kladnú stranu vrcholu grafu. teda histogram sa skresľuje tak, že jeho pravá strana (alebo „chvost“) je dlhšia ako ľavá strana.

body_right_skewed_histogram

Príklad histogramu skoseného doprava.

Na pravo zošikmenom histograme sú priemer, medián a režim rôzne. V tomto prípade je režim najvyšším bodom histogramu, zatiaľ čo medián a priemer spadajú napravo od neho (alebo vizuálne napravo od vrcholu). Poznač si to stredná vôľa vždy byť napravo od mediánu .

body_skewed_right_left

Graf A je skosený doprava, zatiaľ čo graf B je skosený doľava. Pri pravo zošikmených grafoch sa priemer vždy nachádza napravo od režimu (t. j. vrchol). ( Asitgoes /Wikimedia Commons) )

Tieto vlastnosti to nakoniec urobia ťažké priradiť typickú hodnotu pretože na pravo zošikmenom grafe nie je jasný stredový bod. Naproti tomu pri normálnom rozdelení, pretože priemer, medián a režim sú všetky rovnaké a sú stredobodom množiny údajov, môžete túto hodnotu jednoducho použiť na presnejšie zovšeobecnenie údajov.

Čo spôsobuje pravotočivý histogram?

Údaje sú zvyčajne skreslené doprava výsledkom nižšej hranice v súbore údajov (zatiaľ čo údaje skreslené doľava sú výsledkom vyššej hranice). Ak sú teda spodné hranice množiny údajov extrémne nízke v porovnaní so zvyškom údajov, spôsobí to skreslenie údajov.

vznášajúce sa v css

Ďalšou príčinou krivica je štartovacie efekty . Napríklad, ak má postup spočiatku veľa úspechov počas dlhého počiatočného obdobia, môže to spôsobiť pozitívne skreslenie údajov. (Naopak, obdobie spustenia s niekoľkými počiatočnými zlyhaniami môže negatívne skresliť údaje.)