logo

Kovariančná matica

Kovariančná matica je typ matice používaný na opis hodnôt kovariancie medzi dvoma položkami v náhodnom vektore. Je tiež známa ako matica rozptylu a kovariancie, pretože rozptyl každého prvku je reprezentovaný pozdĺž hlavnej uhlopriečky matice a kovariancia je reprezentovaná medzi nediagonálnymi prvkami. Kovariančná matica je zvyčajne štvorcová matica. Je tiež pozitívne semi-určitý a symetrický. Táto matica je užitočná, pokiaľ ide o stochastické modelovanie a analýzu hlavných komponentov.

Čo je kovariančná matica?

The rozptyl -kovariančná matica je a štvorcovú maticu s diagonálnymi prvkami, ktoré predstavujú rozptyl a nediagonálnymi komponentmi, ktoré vyjadrujú kovarianciu. Kovariancia premennej môže mať akúkoľvek reálnu hodnotu – kladnú, zápornú alebo nulovú. Pozitívna kovariancia naznačuje, že tieto dve premenné majú pozitívny vzťah, zatiaľ čo negatívna kovariancia naznačuje, že nemajú. Ak sa dva prvky spolu nelíšia, majú nulovú kovarianciu.



Uč sa viac, Diagonálna matica

Príklad kovariančnej matice

Povedzme, že existujú 2 množiny údajov X = [10, 5] a Y = [3, 9]. Rozptyl množiny X = 12,5 a rozptyl množiny Y = 18. Kovariancia medzi oboma premennými je -15. Kovariančná matica je nasledovná:

egin{bmatrix} Variance~of~Set~X & Coorelation~of~Both~Sets Coorelation~of~Both~Sets& Variance~of~Set~Y end{bmatrix}=egin{bmatrix} 12.5 & -15 -15& 18 end{bmatrix}

Vzorec kovariančnej matice

Všeobecná forma kovariančnej matice je daná takto:

Kovariančná matica

kde,

  • Vzorový rozptyl: kde (x1) =frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1}
  • Ukážka Covarinace: (x1, a1) =frac{sum_{1}^{n}left (x_{i} -overline{x} ight )left(y_{i}-overline{y} ight)}{n-1}
  • Populačný rozptyl: kde (xn) =frac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n}
  • Populačná kovariancia: (xn, an) =frac{sum_{1}^{n}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{n}

Tu, m je priemerná populácia

overline x je priemer vzorky

n je počet pozorovaní

X i je pozorovanie v množine údajov x

Pozrime sa na formát kovariančnej matice 2 ⨯ 2 a 3 ⨯ 3

2 2 Matica kovariancie

Vieme, že v 2 ⨯ 2 matice sú tam dva riadky a dva stĺpce. Preto môže byť kovariančná matica 2 ⨯ 2 vyjadrená akoegin{bmatrix}mathrm{var(x)}& mathrm{cov(x,y)} \mathrm{cov(x,y)} &mathrm{var(y)}end{bmatrix}

3 3 Matica kovariancie

V matici 3⨯3 sú 3 riadky a 3 stĺpce. Vieme, že v kovariančnej matici sú diagonálne prvky rozptyl a nediagonálne prvky sú kovariancia. Preto kovariančnú maticu 3⨯3 možno zadať akoegin{bmatrix}mathrm{var(x)}&mathrm{cov(x,y)} &mathrm{cov(x,z)} \mathrm{cov(x,y)} &mathrm{var(y)} &mathrm{cov(y,z)} \mathrm{cov(x,z)} &mathrm{cov(y,z)} &mathrm{var(z)} \end{bmatrix}

Ako nájsť kovariančnú maticu?

Rozmery kovariančnej matice sú určené počtom premenných v danom súbore údajov. Ak sú v množine iba dve premenné, potom by kovariančná matica mala dva riadky a dva stĺpce. Podobne, ak má súbor údajov tri premenné, jeho kovariančná matica by mala tri riadky a tri stĺpce.

Údaje sa týkajú známok, ktoré dosiahli Anna, Caroline a Laura v psychológii a histórii. Vytvorte kovariančnú maticu.

Študent Psychológia (X) História (Y)
Anna 80 70
Caroline 63 dvadsať
Laura 100 päťdesiat

Je potrebné dodržať nasledujúce kroky:

Krok 1: Nájdite priemer premennej X. Spočítajte všetky pozorovania v premennej X a získaný súčet vydeľte počtom členov. Teda (80 + 63 + 100)/3 = 81.

Krok 2: Odpočítajte priemer zo všetkých pozorovaní. (80 – 81), (63 – 81), (100 – 81).

Krok 3: Vezmite vyššie uvedené štvorce rozdielov a potom ich spočítajte. Takže (80 – 81)2+ (63 – 81)2+ (100 – 81)2.

Krok 4: Nájdite rozptyl X tak, že hodnotu získanú v kroku 3 vydelíte o 1 menšou ako je celkový počet pozorovaní. var(X) = [(80 – 81)2+ (63 – 81)2+ (100 – 81)2] / (3 – 1) = 343.

Krok 5: Podobne zopakujte kroky 1 až 4 a vypočítajte rozptyl Y. Var(Y) = 633.

Krok 6: Vyberte pár premenných.

Krok 7: Odpočítajte priemer prvej premennej (X) od všetkých pozorovaní; (80 – 81), (63 – 81), (100 – 81).

Krok 8: Opakujte to isté pre premennú Y; (70 – 47), (20 – 47), (50 – 47).

Krok 9: Vynásobte zodpovedajúce výrazy: (80 – 81) (70 – 47), (63 – 81) (20 – 47), (100 – 81) (50 – 47).

Krok 10: Nájdite kovarianciu sčítaním týchto hodnôt a ich delením (n – 1). Cov(X, Y) = (80 – 81)(70 – 47) + (63 – 81)(20 – 47) + (100 – 81)(50 – 47)/3-1 = 481.

Krok 11: Na usporiadanie výrazov použite všeobecný vzorec pre kovariančnú maticu. Matica sa stáva:egin{bmatrix} 343 & 481 481& 633 end{bmatrix}

Vlastnosti kovariančnej matice

Vlastnosti kovariančnej matice sú uvedené nižšie:

  • Kovariančná matica je vždy štvorcová, čo znamená, že počet riadkov v kovariančnej matici sa vždy rovná počtu stĺpcov v nej.
  • Kovariančná matica je vždy symetrická, čo znamená, že transponovať kovariančnej matice sa vždy rovná pôvodnej matici.
  • Kovariančná matica je vždy pozitívna a polodefinitívna.
  • The vlastné hodnoty kovariančnej matice sú vždy skutočné a nezáporné.

Čítaj viac,

  • Typy matíc
  • Násobenie matice
  • Rozptyl a štandardná odchýlka

Vyriešené príklady na kovariančnej matici

Príklad 1: Známky dosiahnuté 3 študentmi z fyziky a biológie sú uvedené nižšie:

Študentfyzika (X)biológia (Y)
A 92 80
B 60 30
C 100 70

Vypočítajte kovariančnú maticu z vyššie uvedených údajov.

vlastnosti série panda

Riešenie:

Vzorová kovariančná matica je daná pomocoufrac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1} .

Tu, μX= 84, n = 3

var(x) = [(92 – 84)2+ (60 – 84)2+ (100 – 84)2] / (3 – 1) = 448

Takže, μa= 60, n = 3

var(y) = [(80 – 60)2+ (30 – 60)2+ (70 – 60)2] / (3 – 1) = 700

Teraz cov(x, y) = cov(y, x) = [(92 – 84)(80 – 60) + (60 – 84)(30 – 60) + (100 – 84)(70 – 60)] / (3 – 1) = 520.

Populačná kovariančná matica je daná ako:egin{bmatrix} 448 & 520 520& 700 end{bmatrix}

Príklad 2. Pripravte populačnú kovariančnú maticu z nasledujúcej tabuľky:

VekPočet ľudí
29 68
26 60
30 58
35 40

Riešenie:

Rozptyl populácie je daný podľafrac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n} .

Tu, μX= 56,5, n = 4

var(x) = [(68 – 56,5)2+ (60 – 56,5)2+ (58 – 56,5)2+ (40 – 56,5)2]/4 = 104,75

Takže, μa= 30, n = 4

var(y) = [(29 – 30)2+ (26 – 30)2+ (30 – 30)2+ (35 – 30)2]/4 = 10,5

Teraz cov(x, y) =frac{sum_{1}^{4}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{4}

cov(x, y) = -27

Populačná kovariančná matica je daná ako: egin{bmatrix} 104.7 &-27 -27& 10.5 end{bmatrix}

Príklad 3. Interpretujte nasledujúcu kovariančnú maticu:

egin{bmatrix} & X & Y & Z X & 60 & 32 & -4 Y & 32 & 30 & 0 Z & -4 & 0 & 80 end{bmatrix}

sieť a typy sietí

Riešenie:

  1. Diagonálne prvky 60, 30 a 80 označujú odchýlky v súboroch údajov X, Y a Z. Y ukazuje najnižší rozptyl, zatiaľ čo Z zobrazuje najvyšší rozptyl.
  2. Kovariancia pre X a Y je 32. Keďže ide o kladné číslo, znamená to, že keď sa X zvyšuje (alebo znižuje), Y sa tiež zvyšuje (alebo znižuje)
  3. Kovariancia pre X a Z je -4. Keďže ide o záporné číslo, znamená to, že keď sa X zvyšuje, Z klesá a naopak.
  4. Kovariancia pre Y a Z je 0. To znamená, že medzi týmito dvoma súbormi údajov neexistuje žiadny predvídateľný vzťah.

Príklad 4. Nájdite vzorovú kovariančnú maticu pre nasledujúce údaje:

XAS
75 10.5 Štyri
65 12.8 65
22 7.3 74
pätnásť 2.1 76
18 9.2 56

Riešenie:

Vzorová kovariančná matica je daná pomocoufrac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1} .

n = 5, mX= 22,4, var(X) = 321,2 / (5 – 1) = 80,3

ma= 12,58, var(Y) = 132,148 / 4 = 33,037

mS= 64, var(Z) = 570/4 = 142,5

cov(X, Y) =frac{sum_{1}^{5}left ( x_{i} -22.4 ight )left ( y_{i}-12.58 ight ) }{5-1} = -11.76

cov(X, Z) =frac{sum_{1}^{5}left ( x_{i} -22.4 ight )left ( z_{i}-64 ight ) }{5-1} = 34.97

cov(Y, Z) = frac{sum_{1}^{5}left ( y_{i} -12.58 ight )left ( z_{i}-64 ight ) }{5-1} = -40.87

Kovariančná matica je daná ako:

egin{bmatrix} 80.3 & -13.865 &14.25 -13.865 & 33.037 & -39.5250 14.25 & -39.5250 & 142.5 end{bmatrix}

Časté otázky o kovariančnej matici

1. Definujte kovariančnú maticu

Kovariančná matica je typ matice používanej na opis hodnôt kovariancie medzi dvoma položkami v náhodnom vektore.

2. Aký je vzorec pre maticu kovariancie?

Vzorec pre kovariančnú maticu je uvedený ako

left[egin{array}{ccc} operatorname{Var}left(x_1 ight) & ldots ldots & operatorname{Cov}left(x_n, x_1 ight) vdots & ldots & vdots vdots & ldots & vdots operatorname{Cov}left(x_n, x_1 ight) & ldots ldots & operatorname{Var}left(x_n ight) end{array} ight]

Kde, Vzorový rozptyl: kde (x1) =frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1}

  • Ukážka Covarinace: (x1, a1) =frac{sum_{1}^{n}left (x_{i} -overline{x} ight )left(y_{i}-overline{y} ight)}{n-1}
  • Populačný rozptyl: kde (xn) =frac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n}
  • Populačná kovariancia: (xn, an) =frac{sum_{1}^{n}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{n}

3. Aká je všeobecná forma 3 ⨯ 3 kovariančnej matice?

Všeobecná forma 3 ⨯ 3 kovariančnej matice je daná takto:

egin{bmatrix}mathrm{var(x)}&mathrm{cov(x,y)} &mathrm{cov(x,z)} \mathrm{cov(x,y)} &mathrm{var(y)} &mathrm{cov(y,z)} \mathrm{cov(x,z)} &mathrm{cov(y,z)} &mathrm{var(z)} \end{bmatrix}

4. Aké sú vlastnosti kovariančnej matice?

Kovariančná matica je štvorcová matica a má tiež symetrický charakter, t. j. transpozícia pôvodnej matice dáva samotnú pôvodnú maticu.

5. Aké sú sektory, v ktorých je možné použiť kovariančnú maticu?

Kovariančná matica sa používa v oblasti matematiky, strojového učenia, financií a ekonómie. Kovariančná matica sa používa v Cholskey Decomposition na vykonávanie simulácie Monte Carlo, ktorá sa používa na vytváranie matematických modelov.