V tomto článku budeme diskutovať o Pandas DataFrame.set_index() v Pythone. Python vyniká ako vynikajúci jazyk na analýzu údajov, najmä vďaka svojmu vynikajúcemu ekosystému balíkov zameraných na údaje. Medzi týmito balíkmi pandy zohráva významnú úlohu pri zjednodušovaní importu a analýzy údajov.
Syntax Pandas DataFrame.set_index().
Syntax: DataFrame.set_index(keys, drop=True, append=False, inplace=False, over_integrity=False)
Parametre:
- kľúče: Názov stĺpca alebo zoznam názvov stĺpcov.
- pokles: Boolovská hodnota, ktorá, ak je True, zruší stĺpec použitý pre index.
- pripojiť: Ak je hodnota True, pripojí zadaný stĺpec k existujúcemu stĺpcu indexu.
- na mieste: Ak je True, zmeny sa vykonajú v samotnom DataFrame.
- over_integrity: Ak je hodnota True, skontroluje nový stĺpec indexu, či neobsahuje duplikáty.
Čo je Pandas DataFrame.set_index() ?
Dátový rámec Pandas. set_index() metóda sa používa na priradenie zoznamu, série alebo iného dátového rámca ako indexu daného dátového rámca. Je to užitočné najmä pri kombinovaní viacerých dátových rámcov, čo umožňuje jednoduchú úpravu indexu. Zatiaľ čo stĺpec indexu možno zadať počas vytvárania dátového rámca, set_index() poskytuje flexibilný spôsob neskoršej zmeny indexu. V podstate vám umožňuje nastaviť zoznam, sériu alebo údajový rámec ako index údajového rámca. Niekedy je však dátový rámec vytvorený z dvoch alebo viacerých dátových rámcov, a preto je možné neskôr index zmeniť pomocou tejto metódy.
Ak chcete stiahnuť použitý súbor CSV, kliknite na Tu.
Pandas DataFrame.set_index() Príklady
Nižšie sú uvedené správne ilustrácie príkladov pre Pandas DataFrame.set_index().
- Pandy Nastavte Index na Stĺpec
- Viacnásobný indexový stĺpec
- Nastavenie singlu Plávajúci stĺpec ako Index
- Nastavenie tri stĺpce ako MultiIndex
- Pandas Set Index špecifického stĺpca
Pandy Nastavte Index na Stĺpec
V tomto príklade meníme stĺpec Index, stĺpec Krstné meno sa stal indexovým stĺpcom dátového rámca.
Python3
# importing pandas package> import> pandas as pd> # making data frame from csv file> data>=> pd.read_csv(>'employees.csv'>)> # setting first name as index column> data.set_index(>'First Name'>, inplace>=> True>)> # display> data.head()> |
abeceda čísel
>
>
Výkon : Pred operáciou -

Po operácii -

Ako je znázornené na výstupných obrázkoch, indexový stĺpec bol skôr radom čísel, ale neskôr bol nahradený Krstným menom.
Pandy Nastaviť index na viacnásobný indexový stĺpec
V tomto príklade budú dva stĺpce vytvorené ako indexový stĺpec. Parameter Drop sa používa na zrušenie stĺpca a parameter append sa používa na pripojenie odovzdaných stĺpcov k už existujúcemu stĺpcu indexu.
Python3
css komentár
# importing pandas package> import> pandas as pd> # making data frame from csv file> data>=> pd.read_csv(>'employees.csv'>)> # setting first name as index column> data.set_index([>'First Name'>,>'Gender'>], inplace>=> True>,> >append>=> True>, drop>=> False>)> # display> data.head()> |
>
>
mysql zmeniť typ stĺpca
Výkon:

Ako je znázornené na výstupnom obrázku, údaje majú 3 indexové stĺpce.
Pandas Dataframe Index Nastavenie jedného Plávajúci stĺpec ako Index
V tomto príklade nižšie uvedený útržok kódu používa knižnicu Pandas na vytvorenie dátového rámca s názvom „df“ z vnoreného zoznamu údajov študentov. Nastaví stĺpec „Agg_Marks“ ako index a zobrazí výsledný DataFrame so stĺpcami „Názov“, „Vek“, „Mesto“ a „Krajina“.
Python3
# importing pandas library> import> pandas as pd> # creating and initializing a nested list> students>=> [[>'jack'>,>34>,>'Sydeny'>,>'Australia'>,>85.96>],> >[>'Riti'>,>30>,>'Delhi'>,>'India'>,>95.20>],> >[>'Vansh'>,>31>,>'Delhi'>,>'India'>,>85.25>],> >[>'Nanyu'>,>32>,>'Tokyo'>,>'Japan'>,>74.21>],> >[>'Maychan'>,>16>,>'New York'>,>'US'>,>99.63>],> >[>'Mike'>,>17>,>'las vegas'>,>'US'>,>47.28>]]> # Create a DataFrame object> df>=> pd.DataFrame(students,> >columns>=>[>'Name'>,>'Age'>,>'City'>,>'Country'>,>'Agg_Marks'>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>,>'e'>,>'f'>])> # here we set Float column 'Agg_Marks' as index of data frame> # using dataframe.set_index() function> df>=> df.set_index(>'Agg_Marks'>)> # Displaying the Data frame> df> |
parciálny odvodený symbol latex
>
>
Výkon :
Name Age City Country Agg_Marks 85.96 jack 34 Sydeny Australia 95.20 Riti 30 Delhi India 85.25 Vansh 31 Delhi India 74.21 Nanyu 32 Tokyo Japan 99.63 Maychan 16 New York US 47.28 Mike 17 las vegas US>
Vo vyššie uvedenom príklade sme nastavili stĺpec „ Agg_Marks “ ako index dátového rámca.
Nastavenie indexu dátového rámca Pandas tri stĺpce ako MultiIndex
V tomto príklade kód uvedený nižšie využíva Pandas na vytvorenie dátového rámca „df“ z údajov študentov so stĺpcami „Meno“, „Vek“, „Mesto“, „Krajina“, „Agg_Marks“ a „ID“. Využíva funkciu „set_index()“ na vytvorenie viacúrovňového indexu pomocou „Name“, „City“ a „ID“ a potom zobrazí výsledný DataFrame.
Python3
# importing pandas library> import> pandas as pd> # creating and initializing a nested list> students>=> [[>'jack'>,>34>,>'Sydeny'>,>'Australia'>,>85.96>,>400>],> >[>'Riti'>,>30>,>'Delhi'>,>'India'>,>95.20>,>750>],> >[>'Vansh'>,>31>,>'Delhi'>,>'India'>,>85.25>,>101>],> >[>'Nanyu'>,>32>,>'Tokyo'>,>'Japan'>,>74.21>,>900>],> >[>'Maychan'>,>16>,>'New York'>,>'US'>,>99.63>,>420>],> >[>'Mike'>,>17>,>'las vegas'>,>'US'>,>47.28>,>555>]]> # Create a DataFrame object> df>=> pd.DataFrame(students,> >columns>=>[>'Name'>,>'Age'>,>'City'>,>'Country'>,>'Agg_Marks'>,>'ID'>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>,>'e'>,>'f'>])> # Here we pass list of 3 columns i.e 'Name', 'City' and 'ID'> # to dataframe.set_index() function> # to set them as multiIndex of dataframe> df>=> df.set_index([>'Name'>,>'City'>,>'ID'>])> # Displaying the Data frame> df> |
>
>
Výkon :
Age Country Agg_Marks Name City ID jack Sydeny 400 34 Australia 85.96 Riti Delhi 750 30 India 95.20 Vansh Delhi 101 31 India 85.25 Nanyu Tokyo 900 32 Japan 74.21 Maychan New York 420 16 US 99.63 Mike las vegas 555 17 US 47.28>
Vo vyššie uvedenom príklade nastavíme stĺpce „ názov ', ' Mesto “, a “ ID “ ako multiIndex dátového rámca.
Pandas Set Index špecifického stĺpca
V tomto príklade nižšie uvedený kód ukazuje, ako použiť Pandas na vytvorenie DataFrame, nastaviť konkrétny stĺpec (v tomto prípade „Názov“) ako index pomocouset_index()>a potom zobrazí pôvodné aj upravené DataFrame. Theinplace=True>Parameter zabezpečuje, že zmeny sa aplikujú priamo na DataFrame bez potreby opätovného priradenia.
Python3
kat timpf čisté imanie
import> pandas as pd> # Creating a sample DataFrame> data>=> {>'Name'>: [>'Geek1'>,>'Geek2'>,>'Geek3'>],> >'Age'>: [>25>,>30>,>35>],> >'City'>: [>'New York'>,>'San Francisco'>,>'Los Angeles'>]}> df>=> pd.DataFrame(data)> # Displaying the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Using set_index() to set 'Name' column as the index> df.set_index(>'Name'>, inplace>=>True>)> # Displaying the DataFrame after setting the index> print>(>'
DataFrame after set_index:'>)> print>(df)> |
>
>
Výkon :
Original DataFrame: Name Age City 0 Geek1 25 New York 1 Geek2 30 San Francisco 2 Geek3 35 Los Angeles DataFrame after set_index: Age City Name Geek1 25 New York Geek2 30 San Francisco Geek3 35 Los Angeles>