Funkcia pandas.concat() robí všetku ťažkú prácu pri vykonávaní operácií zreťazenia spolu s osou Predmety pandy pri vykonávaní voliteľnej logiky množiny (zjednotenie alebo priesečník) indexov (ak existujú) na iných osiach.
Syntax funkcie Pandas concat().
Syntax: concat(objs, axis, join, ignore_index, keys, levels, names, over_integrity, sort, copy)
Parametre:
niečo rýchle
- obs: Séria alebo objekty DataFrame
- os: os zreťaziť pozdĺž; predvolená hodnota = 0
- pripojiť sa: spôsobom zvládnuť indexy na inej osi; predvolené = „vonkajšie“
- ignore_index: ak je pravda, nepoužívajte hodnoty indexu pozdĺž osi zreťazenia; predvolená hodnota = False
- kľúče: sekvencia na pridanie identifikátora k indexom výsledkov; predvolená hodnota = Žiadne
- úrovne: špecifické úrovne (jedinečné hodnoty), ktoré sa majú použiť na zostavenie MultiIndexu; predvolená hodnota = Žiadne
- mená: názvy úrovní vo výslednom hierarchickom indexe; predvolená hodnota = Žiadne
- over_integrity: skontrolujte, či nová zreťazená os obsahuje duplikáty; predvolená hodnota = False
- zoradiť: zoradiť nezreťazenú os, ak už nie je zarovnaná, keď je spojenie „vonkajšie“; predvolená hodnota = False
- kopírovať: ak je False, nekopírujte údaje zbytočne; predvolená hodnota = Pravda
Vrátenie: typ objs (Series of DataFrame)
Reťazenie pomocou Pandy s príkladmi
Príklad 1: Spojte dátové rámce v Pythone
V tomto príklade spájame dve série s predvolenými parametrami pandy .
Python3
# importing the module> import> pandas as pd> # creating the Series> series1>=> pd.Series([>1>,>2>,>3>])> display(>'series1:'>, series1)> series2>=> pd.Series([>'A'>,>'B'>,>'C'>])> display(>'series2:'>, series2)> # concatenating> display(>'After concatenating:'>)> display(pd.concat([series1, series2]))> |
>
>
Výkon
Príklad 2: Pandy spájajúce dva dátové rámce horizontálne s indexom = 1
V tomto príklade vytvoríme dve série Pandy (series1>aseries2>) a potom ich zreťazí pozdĺž stĺpcov (os=1) pomocoupd.concat()>. Výsledný DataFrame obsahuje oba Series ako stĺpce, čím vytvára nový DataFrame s dvoma stĺpcami.
Python3
# importing the module> import> pandas as pd> # creating the Series> series1>=> pd.Series([>1>,>2>,>3>])> display(>'series1:'>, series1)> series2>=> pd.Series([>'A'>,>'B'>,>'C'>])> display(>'series2:'>, series2)> # concatenating> display(>'After concatenating:'>)> display(pd.concat([series1, series2],> >axis>=> 1>))> |
>
>
Výkon
Príklad 3: Reťazenie 2 dátových rámcov a priradenie kľúčov
vytvorí dva dátové rámce (df1>adf2>) a zreťazí ich spolu s kľúčmi priradenými ku každému použitému DataFramepd.concat()>. Výsledný DataFrame má hierarchický index s kľúčmi „key1“ a „key2“, ktorý rozlišuje pôvod každého súboru údajov.
Python3
# importing the module> import> pandas as pd> # creating the DataFrames> df1>=> pd.DataFrame({>'A'>: [>'A0'>,>'A1'>,>'A2'>,>'A3'>],> >'B'>: [>'B0'>,>'B1'>,>'B2'>,>'B3'>]})> display(>'df1:'>, df1)> df2>=> pd.DataFrame({>'A'>: [>'A4'>,>'A5'>,>'A6'>,>'A7'>],> >'B'>: [>'B4'>,>'B5'>,>'B6'>,>'B7'>]})> display(>'df2:'>, df2)> # concatenating> display(>'After concatenating:'>)> display(pd.concat([df1, df2],> >keys>=>[>'key1'>,>'key2'>]))> |
>
>
Výkon
Príklad 4: Horizontálne zreťazenie dátových rámov v Pandách s osou = 1
vytvorí dva dátové rámce (df1>adf2>) a zreťazí ich pozdĺž stĺpcov (os=1) pomocoupd.concat()>. Výsledný DataFrame kombinuje stĺpce z obochdf1>adf2>, pričom ich zarovnáte vedľa seba .
Python3
# importing the module> import> pandas as pd> # creating the DataFrames> df1>=> pd.DataFrame({>'A'>: [>'A0'>,>'A1'>,>'A2'>,>'A3'>],> >'B'>: [>'B0'>,>'B1'>,>'B2'>,>'B3'>]})> display(>'df1:'>, df1)> df2>=> pd.DataFrame({>'C'>: [>'C0'>,>'C1'>,>'C2'>,>'C3'>],> >'D'>: [>'D0'>,>'D1'>,>'D2'>,>'D3'>]})> display(>'df2:'>, df2)> # concatenating> display(>'After concatenating:'>)> display(pd.concat([df1, df2],> >axis>=> 1>))> |
>
>
Výkon
Príklad 5: Spojenie 2 dátových rámcov s ignore_index = True
vytvorí dva dátové rámce (df1>adf2>) s identickými stĺpcami a vertikálne ich zreťazí pomocoupd.concat()>signore_index=True>. Výsledný DataFrame má súvislý index, ignorujúci pôvodné indexydf1>adf2>.
Python3
# importing the module> import> pandas as pd> # creating the DataFrames> df1>=> pd.DataFrame({>'A'>: [>'A0'>,>'A1'>,>'A2'>,>'A3'>],> >'B'>: [>'B0'>,>'B1'>,>'B2'>,>'B3'>]})> display(>'df1:'>, df1)> df2>=> pd.DataFrame({>'A'>: [>'A4'>,>'A5'>,>'A6'>,>'A7'>],> >'B'>: [>'B4'>,>'B5'>,>'B6'>,>'B7'>]})> display(>'df2:'>, df2)> # concatenating> display(>'After concatenating:'>)> display(pd.concat([df1, df2],> >ignore_index>=> True>))> |
java reťazec indexof
>
>
Výkon
Príklad 6: Reťazenie dátového rámca so sériou
vytvorí DataFrame (df>) a séria (series>), potom ich zreťazí pozdĺž stĺpcov (os = 1) pomocoupd.concat()>. Výsledný DataFrame kombinuje stĺpce zdf>a Séria, pričom ich zarovnajte vedľa seba. Poznámka: Vo vyhlásení o zobrazení je preklep (df1>namiestodf>).
Python3
# importing the module> import> pandas as pd> # creating the DataFrame> df>=> pd.DataFrame({>'A'>: [>'A0'>,>'A1'>,>'A2'>,>'A3'>],> >'B'>: [>'B0'>,>'B1'>,>'B2'>,>'B3'>]})> display(>'df:'>, df1)> # creating the Series> series>=> pd.Series([>1>,>2>,>3>,>4>])> display(>'series:'>, series)> # concatenating> display(>'After concatenating:'>)> display(pd.concat([df, series],> >axis>=> 1>))> |
>
>
Výkon