DataFrame Pandas je 2-rozmerná označená dátová štruktúra ako tabuľka s riadkami a stĺpcami. Veľkosť a hodnoty DataFrame sú meniteľné, t.j. môžu byť modifikované.
DataFrame sa väčšinou používa pri analýze údajov a manipulácii s nimi. Umožňuje vám ukladať údaje v tabuľkovej forme, ako je databáza SQL, MS Excel alebo Tabuľky Google, čo uľahčuje vykonávanie aritmetických operácií s údajmi.
Je to najčastejšie používaný objekt Pandy. The Funkcia DataFrame(). sa používa na vytvorenie DataFrame v Pandas. Pandas DataFrame môžete vytvoriť aj viacerými spôsobmi.
Syntax Pandas Dataframe().
pandas.DataFrame(údaje, index, stĺpce)
npm clean cache force
Parametre:
- údajov : Je to množina údajov, z ktorej sa má vytvoriť DataFrame. Môže to byť zoznam, slovník, skalárna hodnota, séria a polia atď.
- index : Je to voliteľné, predvolene index DataFrame začína od 0 a končí pri poslednej hodnote údajov (n-1). Explicitne definuje označenie riadku.
- stĺpci : Tento parameter sa používa na poskytnutie názvov stĺpcov v DataFrame. Ak nie je predvolene definovaný názov stĺpca, bude mať hodnotu od 0 do n-1.
Vrátenie:
- Objekt DataFrame
Teraz, keď sme diskutovali o funkcii DataFrame(), pozrime sa na rôzne spôsoby vytvorenia DataFrame:
Rôzne spôsoby vytvorenia dátového rámca v Pythone
Existuje niekoľko spôsobov, ako vytvoriť a Dátový rámec Pandas v Python . DataFrame môžete vytvoriť pomocou nasledujúcich metód:
- Vytvorte Pandas DataFrame pomocou funkcie DataFrame().
- Vytvorte Pandas DataFrame zo zoznamu zoznamov
- Vytvorte Pandas DataFrame zo slovníka ndarray/list
- Vytvorte Pandas DataFrame zo zoznamu slovníkov
- Vytvorte Pandas DataFrame zo slovníka Series
- Vytvorenie DataFrame pomocou funkcie zip().
- Vytvorenie DataFrame explicitným preukázaním indexového označenia
Vytvorte prázdny dátový rámec pomocou metódy DataFrame().
DataFrame v Pythone môže byť vytvorený pomocou funkcie DataFrame() v Knižnica Pandy . Stačí zavolať funkciu pomocou konštruktora DataFrame a vytvoriť DataFrame.
Príklad : Vytvorenie prázdneho DataFrame pomocou funkcie DataFrame() v Pythone
Python3
# Importing Pandas to create DataFrame> import> pandas as pd> # Creating Empty DataFrame and Storing it in variable df> df> => pd.DataFrame()> # Printing Empty DataFrame> print> (df)> |
>
>
Výkon:
Empty DataFrame Columns: [] Index: []>
Vytvorte DataFrame zo zoznamov zoznamov
Ak chcete vytvoriť Pandas DataFrame z a zoznam zoznamov, môžete použiť funkciu pd.DataFrame(). Táto funkcia berie ako vstup zoznam zoznamov a vytvára DataFrame s rovnakým počtom riadkov a stĺpcov ako zoznam vstupov.
Príklad : Vytváranie DataFrame zo zoznamov zoznamov pomocou metódy DataFrame().
Python3
# Import pandas library> import> pandas as pd> # initialize list of lists> data> => [[> 'tom'> ,> 10> ], [> 'nick'> ,> 15> ], [> 'juli'> ,> 14> ]]> # Create the pandas DataFrame> df> => pd.DataFrame(data, columns> => [> 'Name'> ,> 'Age'> ])> # print dataframe.> print> (df)> |
>
>
Výkon:
Name Age 0 tom 10 1 nick 15 2 juli 14>
Vytvorte DataFrame zo Dictionary of ndArray/Lists
Ak chcete vytvoriť DataFrame z a slovník z ndarrays /lists, všetky polia musia mať rovnakú dĺžku. Ak sa odovzdá index, index dĺžky by sa mal rovnať dĺžke polí.
Ak sa neodovzdá žiadny index, potom bude predvolene index rozsah (n), kde n je dĺžka poľa.
Príklad : Vytvorenie DataFrame zo slovníka ndarray/lists
Python3
java zberný rámec
# Python code demonstrate creating> # DataFrame from dict narray / lists> # By default addresses.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'nick'> ,> 'krish'> ,> 'jack'> ],> > 'Age'> : [> 20> ,> 21> ,> 19> ,> 18> ]}> # Create DataFrame> df> => pd.DataFrame(data)> # Print the output.> print> (df)> |
>
>
Výkon:
Name Age 0 Tom 20 1 nick 21 2 krish 19 3 jack 18>
Poznámka: Pri vytváraní DataFrame pomocou slovníka budú kľúčmi slovníka štandardne názvy stĺpcov. Názvy stĺpcov môžeme poskytnúť aj explicitne pomocou parametra stĺpca.
Vytvorte DataFrame zo zoznamu slovníkov
Pandas DataFrame je možné vytvoriť prechodom zoznamy slovníkov ako vstupné údaje. V predvolenom nastavení budú kľúče slovníka brané ako stĺpce.
Python3
stiahnite si videá z youtube vlc
# Python code demonstrate how to create> # Pandas DataFrame by lists of dicts.> import> pandas as pd> # Initialize data to lists.> data> => [{> 'a'> :> 1> ,> 'b'> :> 2> ,> 'c'> :> 3> },> > {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates DataFrame.> df> => pd.DataFrame(data)> # Print the data> print> (df)> |
>
>
Výkon:
a b c 0 1 2 3 1 10 20 30>
Ďalším príkladom je vytvorenie Pandas DataFrame odovzdaním zoznamov slovníkov a indexy riadkov .
Python3
# Python code demonstrate to create> # Pandas DataFrame by passing lists of> # Dictionaries and row indices.> import> pandas as pd> # Initialize data of lists> data> => [{> 'b'> :> 2> ,> 'c'> :> 3> }, {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates pandas DataFrame by passing> # Lists of dictionaries and row index.> df> => pd.DataFrame(data, index> => [> 'first'> ,> 'second'> ])> # Print the data> print> (df)> |
>
>
Výkon:
b c a first 2 3 NaN second 20 30 10.0>
Vytvorte DataFrame zo slovníka Series
Ak chcete vytvoriť DataFrame zo slovníka séria , môže byť slovník odovzdaný na vytvorenie DataFrame. Výsledný index je zjednotením všetkých sérií odovzdaných indexovaných.
Príklad: Vytvorenie DataFrame zo slovníka sérií.
Python3
čo je gb
# Python code demonstrate creating> # Pandas Dataframe from Dicts of series.> import> pandas as pd> # Initialize data to Dicts of series.> d> => {> 'one'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ]),> > 'two'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ])}> # creates Dataframe.> df> => pd.DataFrame(d)> # print the data.> print> (df)> |
>
>
Výkon:
one two a 10 10 b 20 20 c 30 30 d 40 40>
Vytvorte DataFrame pomocou funkcie zip().
Dva zoznamy je možné zlúčiť pomocou funkcia zip(). . Teraz vytvorte Pandas DataFrame zavolaním funkcie pd.DataFrame().
Príklad: Vytvorenie DataFrame pomocou funkcie zip().
Python3
# Python program to demonstrate creating> # pandas Dataframe from lists using zip.> import> pandas as pd> # List1> Name> => [> 'tom'> ,> 'krish'> ,> 'nick'> ,> 'juli'> ]> # List2> Age> => [> 25> ,> 30> ,> 26> ,> 22> ]> # get the list of tuples from two lists.> # and merge them by using zip().> list_of_tuples> => list> (> zip> (Name, Age))> # Assign data to tuples.> list_of_tuples> # Converting lists of tuples into> # pandas Dataframe.> df> => pd.DataFrame(list_of_tuples,> > columns> => [> 'Name'> ,> 'Age'> ])> # Print data.> print> (df)> |
>
>
Výkon:
Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>
Vytvorte DataFrame explicitným preukázaním indexového označenia
Ak chcete vytvoriť DataFrame explicitným poskytnutím indexového označenia, môžete použiť parameter index konštruktora pd.DataFrame(). Parameter index berie ako vstup zoznam indexových označení a DataFrame použije tieto označenia pre riadky DataFrame.
Príklad: Vytvorenie DataFrame explicitným preukázaním indexového označenia
Python3
verilog vždy
# Python code demonstrate creating> # pandas DataFrame with indexed by> # DataFrame using arrays.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'Jack'> ,> 'nick'> ,> 'juli'> ],> > 'marks'> : [> 99> ,> 98> ,> 95> ,> 90> ]}> # Creates pandas DataFrame.> df> => pd.DataFrame(data, index> => [> 'rank1'> ,> > 'rank2'> ,> > 'rank3'> ,> > 'rank4'> ])> # print the data> print> (df)> |
>
>
Výkon:
Name marks rank1 Tom 99 rank2 Jack 98 rank3 nick 95 rank4 juli 90>
Záver
Python Pandas DataFrame je podobný tabuľke s riadkami a stĺpcami. Je to dvojrozmerná dátová štruktúra a je veľmi užitočná na analýzu dát a manipuláciu s nimi.
V tomto návode sme diskutovali o viacerých spôsoboch vytvorenia Pandas DataFrame. S týmto tutoriálom budete schopní zvládnuť akúkoľvek komplexnú požiadavku na vytvorenie DataFrame.