logo

Čítanie obsahu súboru CSV v programovaní R – funkcia read.csv().

read.csv() funkcia v jazyku R sa používa na čítanie súborov s hodnotami oddelenými čiarkami. Importuje údaje vo forme a dátový rámec.

Syntax: read.csv(súbor, hlavička, sep, dec) Parametre: súbor: cesta k súboru obsahujúcemu údaje, ktoré sa majú importovať do R. hlavička: logická hodnota. Ak je hodnota TRUE, read.csv() predpokladá, že váš súbor má riadok hlavičky, takže riadok 1 je názov každého stĺpca. Ak to tak nie je, môžete pridať hlavičku argumentu = FALSE. september: znak oddeľovača polí dec: znak použitý v súbore pre desatinné čiarky.



Dátová premenná bude obsahovať obsah súboru CSV, keď použijeme funkciu read.csv(), hoci môžete použiť inú premennú.

Funkcia read.csv() tiež akceptuje množstvo voliteľných argumentov, ktoré môžeme použiť na úpravu procedúry importu. môžeme sa rozhodnúť považovať prvý riadok za názvy stĺpcov, vybrať znak oddeľovača a ďalšie. Ďalšie informácie o týchto možnostiach nájdete v dokumentácii read.csv().

Uistite sa, že súbor je v správnom formáte CSV so správnymi oddeľovačmi a znakmi úvodzoviek zadaním správnej cesty k súboru alebo adresy URL metóde read.csv().



Príklad 1: Čítanie súboru z rovnakého priečinka

R






# R program to read a csv file> # Get content into a data frame> data <->read.csv>(>'CSVFileExample.csv'>,> >header =>FALSE>, sep =>' '>)> > # Printing content of Text File> print>(data)>

>

>

Výkon:

 V1 V2 V3 1 100 AB ab 2 200 CD cd 3 300 EF ef 4 400 GH gh 5 500 IJ ij>

Príklad 2: Čítanie súborov z rôznych adresárov

R

java triedenie zoznamu polí




# Simple R program to read csv file> x <->read.csv>(>' D://Datas//myfile.csv '>)> > # print x> print>(x)>

>

>

Výkon:

 X V1 V2 V3 1 1 100 a1 b1 2 2 200 a2 b2 3 3 300 a3 b3>

Príklad 3: Čítanie súboru CSV s iným oddeľovačom

R


java metódy



data <->read.csv>(>'path/to/your/file.csv'>, sep =>';'>)>

>

>

Možnosť sep je nastavená na ; v tomto príklade to znamená, že súbor CSV používa ako oddeľovač bodkočiarku (;), a nie štandardnú čiarku (,).

Príklad 4: Spracovanie prvého riadka ako názvov stĺpcov

R




data <->read.csv>(>'path/to/your/file.csv'>, header =>TRUE>)>

>

>

Prvý riadok súboru CSV sa štandardne považuje za názvy stĺpcov, pretože argument hlavičky je nastavený na hodnotu TRUE. Ak prvý riadok nášho CSV súboru neobsahuje názvy stĺpcov, môžeme importovať údaje bez nich nastavením hlavičky = FALSE.

Príklad 4: Určenie tried stĺpcov

R




data <->read.csv>(>'path/to/your/file.csv'>,> >colClasses =>c>(>'character'>,>'numeric'>,>'integer'>))>

>

>

Triedy pre každý stĺpec v CSV súbore môžeme definovať pomocou voľby colClasses. Pre túto ilustráciu bude prvý stĺpec interpretovaný ako znak, druhý ako číslo a tretí ako celé číslo. Keď chceme spravovať dátové typy jednotlivých stĺpcov.

Príklad 5: Preskakovanie riadkov a zadávanie chýbajúcich hodnôt

R




data <->read.csv>(>'path/to/your/file.csv'>, skip = 3, na.strings =>c>(>''>,>'NA'>))>

>

predobjednávkový prechod stromu
>

Pomocou argumentu preskočiť môžeme na začiatku súboru CSV preskočiť konkrétny počet riadkov. Prvé tri riadky na tomto obrázku budú vynechané. Hodnoty, ktoré by sa mali považovať za chýbajúce hodnoty (NA), špecifikuje an. reťazcový argument. Reťazec NA a prázdne reťazce sú v tejto situácii rozpoznané ako chýbajúce hodnoty.