logo

R – Dátové rámce

R Programovací jazyk je programovací jazyk s otvoreným zdrojovým kódom, ktorý sa široko používa ako štatistický softvér a nástroj na analýzu údajov. Dátové rámce v jazyku R sú generické dátové objekty R, ktoré sa používajú na ukladanie tabuľkových údajov.

Dátové rámce možno tiež interpretovať ako matice, kde každý stĺpec a matice môžu mať rôzne typy údajov. R DataFrame sa skladá z troch hlavných komponentov, údajov, riadkov a stĺpcov.



R Štruktúra dátových rámcov

Ako môžete vidieť na obrázku nižšie, takto je štruktúrovaný dátový rámec.

Údaje sú prezentované v tabuľkovej forme, čo uľahčuje ovládanie a pochopenie.

R - Data FramesGeeksforgeeks

R – Dátové rámce



Vytvorte dátový rámec v programovacom jazyku R

Na vytvorenie dátového rámca R použite data.frame() funkciu a potom odovzdajte každý z vektorov, ktoré ste vytvorili, ako argumenty do funkcie.

R






# R program to create dataframe> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # print the data frame> print>(friend.data)>

>

>

Výkon:

 friend_id friend_name 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni>

Získajte štruktúru dátového rámca R

Je možné získať štruktúru dátového rámca R pomocou str() funkcia v R.

Dokáže zobraziť aj vnútornú štruktúru veľkých zoznamov, ktoré sú vnorené. Poskytuje jednoriadkový výstup pre základné objekty R, čím dáva používateľovi vedieť o objekte a jeho zložkách.

R




ssis tutoriál

# R program to get the> # structure of the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # using str()> print>(>str>(friend.data))>

>

>

Výkon:

'data.frame': 5 obs. of 2 variables:  $ friend_id : int 1 2 3 4 5  $ friend_name: chr 'Sachin' 'Sourav' 'Dravid' 'Sehwag' ... NULL>

Súhrn údajov v dátovom rámci R

V dátovom rámci R možno štatistický súhrn a charakter údajov získať aplikáciou zhrnutie() funkciu.

Je to všeobecná funkcia používaná na vytváranie výsledkových súhrnov výsledkov rôznych funkcií prispôsobenia modelu. Funkcia vyvoláva konkrétne metódy, ktoré závisia od triedy prvého argumentu.

R




# R program to get the> # summary of the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # using summary()> print>(>summary>(friend.data))>

>

>

Výkon:

 friend_id friend_name   Min. :1 Length:5   1st Qu.:2 Class :character   Median :3 Mode :character   Mean :3   3rd Qu.:4   Max. :5>

Extrahovať údaje z dátového rámca v R

Extrahovanie údajov z dátového rámca R znamená prístup k jeho riadkom alebo stĺpcom. Jeden môže extrahovať konkrétny stĺpec z dátového rámca R pomocou jeho názvu stĺpca.

R




# R program to extract> # data from the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Extracting friend_name column> result <->data.frame>(friend.data$friend_name)> print>(result)>

>

>

Výkon:

 friend.data.friend_name 1 Sachin 2 Sourav 3 Dravid 4 Sehwag 5 Dhoni>

Rozbaľte dátový rámec v jazyku R

Dátový rámec v R možno rozšíriť pridaním nových stĺpcov a riadkov do už existujúceho dátového rámca R.

R




# R program to expand> # the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Expanding data frame> friend.data$location <->c>(>'Kolkata'>,>'Delhi'>,> >'Bangalore'>,>'Hyderabad'>,> >'Chennai'>)> resultant <- friend.data> # print the modified data frame> print>(resultant)>

gimp odstraňuje pozadie

>

>

Výkon:

 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>

V R je možné vykonávať rôzne typy operácií na dátovom rámci, ako napr prístup k riadkom a stĺpcom, výber podmnožiny dátového rámca, úprava dátových rámcov, vymazanie riadkov a stĺpcov v dátovom rámci , atď.

Pozrite si prosím Operácie dátového rámca v R vedieť o všetkých typoch operácií, ktoré možno vykonávať na dátovom rámci.

Prístup k položkám v dátovom rámci R

Pomocou single môžeme vybrať a pristupovať k akémukoľvek prvku z dátového rámca$>,zátvorky[ ] or>dvojité zátvorky[[]]>na prístup k stĺpcom z dátového rámca.

R




# creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Access Items using []> friend.data[1]> # Access Items using [[]]> friend.data[[>'friend_name'>]]> # Access Items using $> friend.data$friend_id>

>

>

Výkon:

 friend_id 1 1 2 2 3 3 4 4 5 5 Access Items using [[]] [1] 'Sachin' 'Sourav' 'Dravid' 'Sehwag' 'Dhoni'   Access Items using $ [1] 1 2 3 4 5>

Počet riadkov a stĺpcov

Pomocou funkcie dim môžeme zistiť, koľko riadkov a stĺpcov sa nachádza v našom dátovom rámci.

R




# creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # find out the number of rows and clumns> dim>(friend.data)>

>

>

Výkon:

[1] 5 2>

Pridajte riadky a stĺpce do dátového rámca R

Do R DataFrame môžete jednoducho pridávať riadky a stĺpce. Vloženie pomáha pri rozširovaní už existujúceho DataFrame bez potreby nového.

Pozrime sa, ako pridať riadky a stĺpce do DataFrame? s príkladom:

Pridajte riadky do dátového rámca R

Ak chcete pridať riadky do dátového rámca, môžete použiť vstavanú funkciu rbind().

Nasledujúci príklad demonštruje fungovanie rbind() v R Data Frame.

R




# Creating a dataframe representing products in a store> Products <->data.frame>(> >Product_ID =>c>(101, 102, 103),> >Product_Name =>c>(>'T-Shirt'>,>'Jeans'>,>'Shoes'>),> >Price =>c>(15.99, 29.99, 49.99),> >Stock =>c>(50, 30, 25)> )> # Print the existing dataframe> cat>(>'Existing dataframe (Products): '>)> print>(Products)> # Adding a new row for a new product> New_Product <->c>(104,>'Sunglasses'>, 39.99, 40)> Products <->rbind>(Products, New_Product)> # Print the updated dataframe after adding the new product> cat>(>' Updated dataframe after adding a new product: '>)> print>(Products)>

>

>

Výkon:

Existing dataframe (Products):   Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25  Updated dataframe after adding a new product:   Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25 4 104 Sunglasses 39.99 40>

Pridajte stĺpce do dátového rámca R

Ak chcete pridať stĺpce do dátového rámca, môžete použiť vstavanú funkciu cbind().

Nasledujúci príklad demonštruje fungovanie cbind() v R Data Frame .

R




# Existing dataframe representing products in a store> Products <->data.frame>(> >Product_ID =>c>(101, 102, 103),> >Product_Name =>c>(>'T-Shirt'>,>'Jeans'>,>'Shoes'>),> >Price =>c>(15.99, 29.99, 49.99),> >Stock =>c>(50, 30, 25)> )> # Print the existing dataframe> cat>(>'Existing dataframe (Products): '>)> print>(Products)> # Adding a new column for 'Discount' to the dataframe> Discount <->c>(5, 10, 8)># New column values for discount> Products <->cbind>(Products, Discount)> # Rename the added column> colnames>(Products)[>ncol>(Products)] <->'Discount'> # Renaming the last column> # Print the updated dataframe after adding the new column> cat>(>' Updated dataframe after adding a new column 'Discount': '>)> print>(Products)>

>

>

Výkon:

Existing dataframe (Products):   Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25  Updated dataframe after adding a new column 'Discount':   Product_ID Product_Name Price Stock Discount 1 101 T-Shirt 15.99 50 5 2 102 Jeans 29.99 30 10 3 103 Shoes 49.99 25 8>

Odstrániť riadky a stĺpce

Dátový rámec v R odstráni stĺpce a riadky z už existujúceho dátového rámca R.

Odstrániť riadok v R DataFrame

R




inštalácia baterky
library>(dplyr)> # Create a data frame> data <->data.frame>(> >friend_id =>c>(1, 2, 3, 4, 5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,>'Dravid'>,>'Sehwag'>,>'Dhoni'>),> >location =>c>(>'Kolkata'>,>'Delhi'>,>'Bangalore'>,>'Hyderabad'>,>'Chennai'>)> )> data> # Remove a row with friend_id = 3> data <->subset>(data, friend_id != 3)> data>

>

>

Výkon:

 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai   # Remove a row with friend_id = 3   friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>

Vo vyššie uvedenom kóde sme najskôr vytvorili dátový rámec tzv údajov s tromi stĺpcami: friend_id , meno_priateľa , a umiestnenie . Ak chcete odstrániť riadok pomocou friend_id rovná 3 sme použili podmnožina() funkciu a špecifikoval podmienku friend_id != 3 . Tým sa odstránil riadok s friend_id rovný 3.

Odstrániť stĺpec v R DataFrame

R




library>(dplyr)> # Create a data frame> data <->data.frame>(> >friend_id =>c>(1, 2, 3, 4, 5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,>'Dravid'>,>'Sehwag'>,>'Dhoni'>),> >location =>c>(>'Kolkata'>,>'Delhi'>,>'Bangalore'>,>'Hyderabad'>,>'Chennai'>)> )> data> # Remove the 'location' column> data <->select>(data, -location)> data>

príklady automatov dfa

>

>

Výkon:

 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>Odstráňte stĺpec 'location' friend_id friend_name 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni>

Ak chcete odstrániť umiestnenie stĺpec sme použili vybrať () funkcie a špecifikované - umiestnenie . The znak znamená, že chceme odstrániť umiestnenie stĺpec. Výsledný dátový rámec údajov bude mať iba dva stĺpce: friend_id a meno_priateľa .

Kombinovanie dátových rámcov v R

Existujú 2 spôsoby, ako kombinovať dátové rámce v R. Môžete ich kombinovať vertikálne alebo horizontálne.

Pozrime sa na oba prípady na príklade:

Vertikálne skombinujte dátový rámec R

Ak chcete skombinovať 2 dátové rámce vertikálne, môžete použiť funkcia rbind(). Táto funkcia funguje pre kombináciu dvoch alebo viacerých dátových rámcov.

R




# Creating two sample dataframes> df1 <->data.frame>(> >Name =>c>(>'Alice'>,>'Bob'>),> >Age =>c>(25, 30),> >Score =>c>(80, 75)> )> df2 <->data.frame>(> >Name =>c>(>'Charlie'>,>'David'>),> >Age =>c>(28, 35),> >Score =>c>(90, 85)> )> # Print the existing dataframes> cat>(>'Dataframe 1: '>)> print>(df1)> cat>(>' Dataframe 2: '>)> print>(df2)> # Combining the dataframes using rbind()> combined_df <->rbind>(df1, df2)> # Print the combined dataframe> cat>(>' Combined Dataframe: '>)> print>(combined_df)>

>

>

Výkon:

Dataframe 1:   Name Age Score 1 Alice 25 80 2 Bob 30 75  Dataframe 2:   Name Age Score 1 Charlie 28 90 2 David 35 85  Combined Dataframe:   Name Age Score 1 Alice 25 80 2 Bob 30 75 3 Charlie 28 90 4 David 35 85>

Horizontálne kombinovať R dátový rámec:

Ak chcete skombinovať 2 dátové rámce horizontálne, môžete použiť funkcia cbind(). Táto funkcia funguje pre kombináciu dvoch alebo viacerých dátových rámcov.

R




# Creating two sample dataframes> df1 <->data.frame>(> >Name =>c>(>'Alice'>,>'Bob'>),> >Age =>c>(25, 30),> >Score =>c>(80, 75)> )> df2 <->data.frame>(> >Height =>c>(160, 175),> >Weight =>c>(55, 70)> )> # Print the existing dataframes> cat>(>'Dataframe 1: '>)> print>(df1)> cat>(>' Dataframe 2: '>)> print>(df2)> # Combining the dataframes using cbind()> combined_df <->cbind>(df1, df2)> # Print the combined dataframe> cat>(>' Combined Dataframe: '>)> print>(combined_df)>

>

>

Výkon:

Dataframe 1:   Name Age Score 1 Alice 25 80 2 Bob 30 75  Dataframe 2:   Height Weight 1 160 55 2 175 70  Combined Dataframe:   Name Age Score Height Weight 1 Alice 25 80 160 55 2 Bob 30 75 175 70>

Prečítajte si tiež:

  • R – Objekty
  • Dátové štruktúry v programovaní R

V tomto článku sme sa zaoberali R dátové rámce, a všetky základné operácie, ako je vytváranie, prístup, súhrn, pridávanie a odstraňovanie. Cieľom tohto článku je oboznámiť vás s dátovými rámcami v R, aby ste ich mohli použiť vo svojich projektoch.

Dúfam, že vám to pomôže pochopiť koncept dátových rámcov v R a môžete ľahko implementovať dátový rámec R vo svojich projektoch.