logo

Ako používať funkciu lm () v R na prispôsobenie lineárnych modelov?

V tomto článku sa naučíme, ako použiť funkciu lm() na prispôsobenie lineárnych modelov v programovacom jazyku R.

Lineárny model sa používa na predpovedanie hodnoty neznámej premennej na základe nezávislých premenných. Väčšinou sa používa na zisťovanie vzťahu medzi premennými a prognózovaním. Funkcia lm() sa používa na prispôsobenie lineárnych modelov dátovým rámcom v jazyku R. Môže sa použiť na vykonanie regresie, jednovrstvovej analýzy rozptylu a analýzy kovariancie na predpovedanie hodnoty zodpovedajúcej údajom, ktoré nie sú v dátovom rámci. Tie sú veľmi nápomocné pri predpovedaní ceny nehnuteľností, predpovedi počasia atď.



Na prispôsobenie lineárneho modelu v jazyku R pomocou lm() Najprv použijeme funkciu data.frame() na vytvorenie vzorového dátového rámca, ktorý obsahuje hodnoty, ktoré musia byť prispôsobené lineárnemu modelu pomocou regresnej funkcie. Potom použijeme funkciu lm() na prispôsobenie určitej funkcie danému dátovému rámcu.

Syntax:

lm( fit_vzorec, dataframe )



Parameter:

    Fiting_formula: určuje vzorec pre lineárny model. dátový rámec: určuje názov dátového rámca, ktorý obsahuje dáta.

Potom môžeme použiť funkciu sumár() na zobrazenie súhrnu lineárneho modelu. Funkcia Summary() interpretuje najdôležitejšie štatistické hodnoty pre analýzu lineárneho modelu.

odstránenie zo zoznamu polí

Syntax:



zhrnutie( lineárny_model )

Súhrn obsahuje nasledujúce kľúčové informácie:

    Reziduálna štandardná chyba: určuje štandardnú odchýlku chyby, kde druhá odmocnina rozptylu odpočítava n mínus 1 + # zahrnutých premenných namiesto delenia n-1. Viacnásobné R-Squared: určuje, ako dobre váš model zodpovedá údajom. Upravené R-štvorce: normalizuje viacero R-kvadratúr tým, že berie do úvahy, koľko vzoriek máte a koľko premenných používate. F-Statistic: je globálny test, ktorý kontroluje, či je aspoň jeden z vašich koeficientov nenulový.

Príklad: Príklad na zobrazenie použitia funkcie lm().

R




# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view summary of linear model> summary>(linear_model)>

>

>

Výkon:

Volajte:

lm(vzorec = y ~ x^2, údaje = df)

Zvyšky:

1 2 3 4 5

2 000 e+00 5 329 e-15 -3 000 e+00 -2 000 e+00 3 000 e+00

Koeficienty:

Odhad Std. Chyba t hodnota Pr(>|t|)

(Zachytenie) -7,0000 3,0876 -2,267 0,10821

x 6,0000 0,9309 6,445 0,00757 **

Signif. kódy: 0 ‘***’ 0,001 ‘**’ 0,01 ‘*’ 0,05 ‘.’ 0,1 ‘ ’ 1

Zvyšková štandardná chyba: 2,944 pri 3 stupňoch voľnosti

Viacnásobná R-kvadratúra: 0,9326, Upravená R-kvadratúra: 0,9102

F-štatistika: 41,54 na 1 a 3 DF, p-hodnota: 0,007575

Diagnostické grafy

Diagnostické grafy nám pomáhajú zobraziť vzťah medzi rôznymi štatistickými hodnotami modelu. Pomáha nám pri analýze rozsahu odľahlých hodnôt a efektívnosti prispôsobeného modelu. Na zobrazenie diagnostických grafov lineárneho modelu používame funkciu plot() v jazyku R.

Syntax:

plot( lineárny_model )

Príklad: Diagnostické grafy pre vyššie uvedený lineárny model.

R




# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view diagnostic plot> plot>(linear_model)>

>

>

Výkon:

Vykreslenie lineárneho modelu

Vyššie uvedený lineárny model môžeme vykresliť, aby sme ho dobre vizualizovali pomocou metódy abline(). Najprv vykreslíme bodový graf údajových bodov a potom ho prekryjeme abline grafom lineárneho modelu pomocou funkcie abline().

Syntax:

plot( df$x, df$y)

java print

abline( Lineárny_model )

Príklad: Vykreslenie lineárneho modelu

R




reťazec na int
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Plot abline plot> plot>( df$x, df$y )> abline>( linear_model)>

>

>

Výkon:

Predpovedajte hodnoty pre neznáme dátové body pomocou prispôsobeného modelu

Na predpovedanie hodnôt pre nové vstupy pomocou vyššie uvedeného prispôsobeného lineárneho modelu používame funkciu predikcie (). Funkcia predikcie () berie model a dátový rámec s neznámymi dátovými bodmi a predpovedá hodnotu pre každý dátový bod podľa prispôsobeného modelu.

Syntax:

predpovedať (model, údaje)

Parameter:

    model: určuje lineárny model. údaje: určuje dátový rámec s neznámymi dátovými bodmi.

Príklad: Predpovedanie nových vstupov

R




# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Predict values> predict>( linear_model, newdata =>data.frame>(x=>c>(15,16,17)) )>

>

>

Výkon:

1 2 3 83 89 95>