logo

Pridanie nového stĺpca do existujúceho DataFrame v Pandas

Pridanie nových stĺpcov do existujúceho DataFrame je základnou úlohou pri analýze údajov pandy . Umožňuje vám obohatiť vaše údaje o ďalšie informácie a uľahčiť ďalšiu analýzu a manipuláciu. Tento článok preskúma rôzne metódy pridávania nových stĺpcov, vrátane jednoduchého priradeniainsert()>metóda,assign()>metóda. Poďme diskutovať o pridávaní nových stĺpcov do existujúceho DataFrame Pandas.

Čo je Pandas DataFrame?

A DataFrame Pandas je dvojrozmerná, veľkosťou meniteľná, potenciálne heterogénna tabuľková dátová štruktúra s označenými osami (riadky a stĺpce). Je to základná dátová štruktúra v ekosystéme vedy o údajoch Python a poskytuje výkonný spôsob práce s tabuľkovými údajmi.



Tu sú niektoré kľúčové vlastnosti Pandas DataFrame:

  • Reprezentácia údajov: Ukladá údaje vo formáte tabuľky s riadkami a stĺpcami.
  • Heterogénne typy údajov: Môže obsahovať rôzne typy údajov v rôznych stĺpcoch (napr. celé čísla, pohyblivé čísla, reťazce, boolovské hodnoty).
  • Označenie: Každý riadok a stĺpec má označenie (názvy indexov a stĺpcov).
  • Meniteľné: Umožňuje manipuláciu a úpravu údajov.
  • Výkonné operácie: Poskytuje rôzne funkcie a metódy na analýzu, manipuláciu a prieskum údajov.
  • Rozšíriteľné: Dá sa prispôsobiť a rozšíriť o ďalšie funkcie prostredníctvom knižníc a užívateľsky definovaných funkcií.

Existuje niekoľko spôsobov, ako pridať nový stĺpec do existujúceho dátového rámca v Pandas Python :

  • Vytvorenie vzorového dátového rámca
  • Používaním Dataframe.insert() metóda
  • Používaním Dataframe.assign() metóda
  • Používanie slovníka
  • Pomocou zoznamu
  • Použitím .miesto()
  • Pridanie viac ako jedného stĺpca do existujúceho dátového rámca

Vytvorenie vzorového dátového rámca

Tu vytvárame vzorový dátový rámec:



Python3






import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> df>=> pd.DataFrame(data)> print>(df)>

>

>

Výkon:

   Name Height Qualification     0    Jai 5.1 Msc   1    Princi 6.2 MA   2   Gaurav 5.1 Msc   3   Anuj 5.2 Msc>

Upozorňujeme, že dĺžka vášho zoznamu by sa mala zhodovať s dĺžkou stĺpca indexu, inak sa zobrazí chyba.

Pridajte nový stĺpec do existujúceho dátového rámca pomocou DataFrame.insert()

Poskytuje slobodu pridať stĺpec na ľubovoľnú pozíciu, ktorá sa nám páči, nielen na konci. Poskytuje tiež rôzne možnosti vkladania hodnôt stĺpcov.

Python3




import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Using DataFrame.insert() to add a column> df.insert(>2>,>'Age'>, [>21>,>23>,>24>,>21>],>True>)> # Observe the result> print>(df)>

>

>

Výkon:

  Name Height Age Qualification     0   Jai 5.1 21 Msc   1   Princi 6.2 23 MA   2   Gaurav 5.1 24 Msc   3    Anuj 5.2 21 Msc>

Pridanie stĺpcov do Pandas DataFrame pomocou Dataframe.assign()

Táto metóda vytvorí nový dátový rámec s novým stĺpcom pridaným do starého dátového rámca.

Python3




import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Using 'Address' as the column name and equating it to the list> df2>=> df.assign(address>=>[>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>])> print>(df2)>

>

>

Výkon:

   Name Height Qualification address     0    Jai 5.1 Msc Delhi   1    Princi 6.2 MA Bangalore   2    Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna>

Pandy Pridať stĺpec do DataFrame pomocou slovníka

Môžeme použiť a Pythonský slovník na pridanie nového stĺpca do pandas DataFrame. Použite existujúci stĺpec ako kľúčové hodnoty a ich príslušné hodnoty budú hodnotami pre nový stĺpec.

Python3

monitor s katódovou trubicou




java plátok

# Import pandas package> import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Define a dictionary with key values of> # an existing column and their respective> # value pairs as the # values for our new column.> address>=> {>'Delhi'>:>'Jai'>,>'Bangalore'>:>'Princi'>,> >'Patna'>:>'Gaurav'>,>'Chennai'>:>'Anuj'>}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Provide 'Address' as the column name> df[>'Address'>]>=> address> # Observe the output> print>(df)>

>

>

Výkon:

  Name Height Qualification Address     0   Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna>

Pridanie nového stĺpca do dátového rámca Pandas pomocou zoznamu

V tomto príklade Pandy pridávajú nové stĺpce zo zoznamu Adresa do existujúceho Pandas DataFrame pomocou slovníka a zoznamu.

Python3




# Declare a list that is to be converted into a column> address>=> [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]> # Using 'Address' as the column name> # and equating it to the list> df[>'Address'>]>=> address> print>(df)>

>

>

Výkon:

  Name Height Qualification Address     0   Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna>

Pridajte nový stĺpec do existujúceho dátového rámca Pandas pomocou Dataframe.loc()

V tomto príklade vytvorí Pandas DataFrame s názvomdf>so stĺpcami Názov, Výška a Kvalifikácia a pridá nový stĺpec Adresa pomocouloc>atribút.

Python3




import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> df>=> pd.DataFrame(data)> # Create the list of new column values> address>=> [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]> # Add the new column using loc> df.loc[:,>'Address'>]>=> address> print>(df)>

>

>

Výkon:

  Name Height Qualification Address     0    Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3   Anuj 5.2 Msc Patna>

Pridanie viac ako jedného stĺpca do existujúceho dátového rámca

V tomto príklade rozširuje existujúci DataFrame Pandasdf>s dvoma novými stĺpcami, Vek a Stav, pomocou príslušných zoznamov údajov.

Python3




import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>],> >'Address'>: [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]}> df>=> pd.DataFrame(data)> # Define new data for additional columns> age>=> [>22>,>25>,>23>,>24>]> state>=> [>'NCT'>,>'Karnataka'>,>'Tamil Nadu'>,>'Bihar'>]> # Add multiple columns using dictionary assignment> new_data>=> {>'Age'>: age,>'State'>: state }> df>=> df.assign(>*>*>new_data)> print>(df)>

>

>

Výkon:

   Name Height Qualification Address Age State     0    Jai 5.1 Msc Delhi 22 NCT   1   Princi 6.2 MA Bangalore 25 Karnataka   2    Gaurav 5.1 Msc Chennai 23 Tamil Nadu   3   Anuj 5.2 Msc Patna 24 Bihar>

Záver

Pochopenie toho, ako pridať nové stĺpce do DataFrames, je nevyhnutné pre prieskum údajov a manipuláciu s nimi v Pandas. Výber vhodnej metódy závisí od konkrétneho kontextu a požadovaného výsledku. Osvojením si týchto techník môžete efektívne manipulovať, analyzovať a získavať cenné poznatky z vašich údajov.