logo

funkcia pandas.concat() v Pythone

Funkcia pandas.concat() robí všetku ťažkú ​​prácu pri vykonávaní operácií zreťazenia spolu s osou Predmety pandy pri vykonávaní voliteľnej logiky množiny (zjednotenie alebo priesečník) indexov (ak existujú) na iných osiach.

Syntax funkcie Pandas concat().

Syntax: concat(objs, axis, join, ignore_index, keys, levels, names, over_integrity, sort, copy)

Parametre:



niečo rýchle
  • obs: Séria alebo objekty DataFrame
  • os: os zreťaziť pozdĺž; predvolená hodnota = 0
  • pripojiť sa: spôsobom zvládnuť indexy na inej osi; predvolené = „vonkajšie“
  • ignore_index: ak je pravda, nepoužívajte hodnoty indexu pozdĺž osi zreťazenia; predvolená hodnota = False
  • kľúče: sekvencia na pridanie identifikátora k indexom výsledkov; predvolená hodnota = Žiadne
  • úrovne: špecifické úrovne (jedinečné hodnoty), ktoré sa majú použiť na zostavenie MultiIndexu; predvolená hodnota = Žiadne
  • mená: názvy úrovní vo výslednom hierarchickom indexe; predvolená hodnota = Žiadne
  • over_integrity: skontrolujte, či nová zreťazená os obsahuje duplikáty; predvolená hodnota = False
  • zoradiť: zoradiť nezreťazenú os, ak už nie je zarovnaná, keď je spojenie „vonkajšie“; predvolená hodnota = False
  • kopírovať: ak je False, nekopírujte údaje zbytočne; predvolená hodnota = Pravda

Vrátenie: typ objs (Series of DataFrame)

Reťazenie pomocou Pandy s príkladmi

Príklad 1: Spojte dátové rámce v Pythone

V tomto príklade spájame dve série s predvolenými parametrami pandy .

Python3




# importing the module> import> pandas as pd> # creating the Series> series1>=> pd.Series([>1>,>2>,>3>])> display(>'series1:'>, series1)> series2>=> pd.Series([>'A'>,>'B'>,>'C'>])> display(>'series2:'>, series2)> # concatenating> display(>'After concatenating:'>)> display(pd.concat([series1, series2]))>

>

>

Výkon

Príklad 2: Pandy spájajúce dva dátové rámce horizontálne s indexom = 1

V tomto príklade vytvoríme dve série Pandy (series1>aseries2>) a potom ich zreťazí pozdĺž stĺpcov (os=1) pomocoupd.concat()>. Výsledný DataFrame obsahuje oba Series ako stĺpce, čím vytvára nový DataFrame s dvoma stĺpcami.

Python3




# importing the module> import> pandas as pd> # creating the Series> series1>=> pd.Series([>1>,>2>,>3>])> display(>'series1:'>, series1)> series2>=> pd.Series([>'A'>,>'B'>,>'C'>])> display(>'series2:'>, series2)> # concatenating> display(>'After concatenating:'>)> display(pd.concat([series1, series2],> >axis>=> 1>))>

>

>

Výkon

Príklad 3: Reťazenie 2 dátových rámcov a priradenie kľúčov

vytvorí dva dátové rámce (df1>adf2>) a zreťazí ich spolu s kľúčmi priradenými ku každému použitému DataFramepd.concat()>. Výsledný DataFrame má hierarchický index s kľúčmi „key1“ a „key2“, ktorý rozlišuje pôvod každého súboru údajov.

Python3




# importing the module> import> pandas as pd> # creating the DataFrames> df1>=> pd.DataFrame({>'A'>: [>'A0'>,>'A1'>,>'A2'>,>'A3'>],> >'B'>: [>'B0'>,>'B1'>,>'B2'>,>'B3'>]})> display(>'df1:'>, df1)> df2>=> pd.DataFrame({>'A'>: [>'A4'>,>'A5'>,>'A6'>,>'A7'>],> >'B'>: [>'B4'>,>'B5'>,>'B6'>,>'B7'>]})> display(>'df2:'>, df2)> # concatenating> display(>'After concatenating:'>)> display(pd.concat([df1, df2],> >keys>=>[>'key1'>,>'key2'>]))>

>

>

Výkon

Príklad 4: Horizontálne zreťazenie dátových rámov v Pandách s osou = 1

vytvorí dva dátové rámce (df1>adf2>) a zreťazí ich pozdĺž stĺpcov (os=1) pomocoupd.concat()>. Výsledný DataFrame kombinuje stĺpce z obochdf1>adf2>, pričom ich zarovnáte vedľa seba .

Python3




# importing the module> import> pandas as pd> # creating the DataFrames> df1>=> pd.DataFrame({>'A'>: [>'A0'>,>'A1'>,>'A2'>,>'A3'>],> >'B'>: [>'B0'>,>'B1'>,>'B2'>,>'B3'>]})> display(>'df1:'>, df1)> df2>=> pd.DataFrame({>'C'>: [>'C0'>,>'C1'>,>'C2'>,>'C3'>],> >'D'>: [>'D0'>,>'D1'>,>'D2'>,>'D3'>]})> display(>'df2:'>, df2)> # concatenating> display(>'After concatenating:'>)> display(pd.concat([df1, df2],> >axis>=> 1>))>

>

>

Výkon

Príklad 5: Spojenie 2 dátových rámcov s ignore_index = True

vytvorí dva dátové rámce (df1>adf2>) s identickými stĺpcami a vertikálne ich zreťazí pomocoupd.concat()>signore_index=True>. Výsledný DataFrame má súvislý index, ignorujúci pôvodné indexydf1>adf2>.

Python3




# importing the module> import> pandas as pd> # creating the DataFrames> df1>=> pd.DataFrame({>'A'>: [>'A0'>,>'A1'>,>'A2'>,>'A3'>],> >'B'>: [>'B0'>,>'B1'>,>'B2'>,>'B3'>]})> display(>'df1:'>, df1)> df2>=> pd.DataFrame({>'A'>: [>'A4'>,>'A5'>,>'A6'>,>'A7'>],> >'B'>: [>'B4'>,>'B5'>,>'B6'>,>'B7'>]})> display(>'df2:'>, df2)> # concatenating> display(>'After concatenating:'>)> display(pd.concat([df1, df2],> >ignore_index>=> True>))>

java reťazec indexof

>

>

Výkon

Príklad 6: Reťazenie dátového rámca so sériou

vytvorí DataFrame (df>) a séria (series>), potom ich zreťazí pozdĺž stĺpcov (os = 1) pomocoupd.concat()>. Výsledný DataFrame kombinuje stĺpce zdf>a Séria, pričom ich zarovnajte vedľa seba. Poznámka: Vo vyhlásení o zobrazení je preklep (df1>namiestodf>).

Python3




# importing the module> import> pandas as pd> # creating the DataFrame> df>=> pd.DataFrame({>'A'>: [>'A0'>,>'A1'>,>'A2'>,>'A3'>],> >'B'>: [>'B0'>,>'B1'>,>'B2'>,>'B3'>]})> display(>'df:'>, df1)> # creating the Series> series>=> pd.Series([>1>,>2>,>3>,>4>])> display(>'series:'>, series)> # concatenating> display(>'After concatenating:'>)> display(pd.concat([df, series],> >axis>=> 1>))>

>

>

Výkon