ZLÚČENIE PANDY - NÁVOD NA PANDY

pandy zlúčiť() je definovaný ako proces spojenia dvoch množín údajov do jednej a zarovnanie riadkov na základe spoločných atribútov alebo stĺpcov. Je to vstupný bod pre všetky štandardné operácie spájania databáz medzi objektmi DataFrame:

Syntax:

 pd.merge(left, right, how=&apos;inner&apos;, on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True)

Parametre:

DataFrame alebo pomenovaná séria

{'left', 'right', 'outter', 'inner'}, default 'inner'

vľavo:Používa iba klávesy z ľavého rámca, podobne ako ľavé vonkajšie spojenie SQL; zachovať poradie kľúčov.správny:Používa iba kľúče z pravého rámca, podobne ako pravé vonkajšie spojenie SQL; zachovať poradie kľúčov.vonkajšie:Použilo spojenie kľúčov z oboch rámcov, podobne ako úplné vonkajšie spojenie SQL; triediť kľúče lexikograficky.vnútorné:Používa priesečník kľúčov z oboch rámcov, podobne ako vnútorné spojenie SQL; zachovať poradie ľavých kláves.

štítok alebo zoznam

left_on:

štítok alebo zoznam alebo ako pole

bool, predvolená hodnota False

tuple of the (str, str), default ('_x', '_y')

bool, predvolená hodnota True

bool alebo str, predvolená hodnota False

_zlúčiť

'left_only'pre pozorovania, ktorých kľúč zlúčenia sa zobrazuje iba „vľavo“ v dátovom rámci, zatiaľ čo,'right_only'je definovaný pre pozorovania, v ktorých sa zlučovací kľúč objavuje iba „napravo“ od DataFrame,'oboje'ak sa zlučovací kľúč pozorovania nachádza v oboch.

str, voliteľné

'one_to_one' alebo '1:1': Kontroluje, či sú zlučovacie kľúče jedinečné v ľavom aj pravom súbore údajov.
'one_to_many' alebo '1:m': Kontroluje, či sú zlučovacie kľúče jedinečné iba v ľavej množine údajov.
'many_to_one' alebo 'm:1': Kontroluje, či sú zlučovacie kľúče jedinečné iba v správnom súbore údajov.
'many_to_many' alebo 'm:m': Je to povolené, ale nevedie to k kontrolám.

Príklad 1: Zlúčte dva dátové rámce na kľúči

 # import the pandas library import pandas as pd left = pd.DataFrame({ &apos;id&apos;:[1,2,3,4], &apos;Name&apos;: [&apos;John&apos;, &apos;Parker&apos;, &apos;Smith&apos;, &apos;Parker&apos;], &apos;subject_id&apos;:[&apos;sub1&apos;,&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub6&apos;]}) right = pd.DataFrame({ &apos;id&apos;:[1,2,3,4], &apos;Name&apos;: [&apos;William&apos;, &apos;Albert&apos;, &apos;Tony&apos;, &apos;Allen&apos;], &apos;subject_id&apos;:[&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub3&apos;,&apos;sub6&apos;]}) print (left) print (right)

Výkon

 id Name subject_id 0 1 John sub1 1 2 Parker sub2 2 3 Smith sub4 3 4 Parker sub6 id Name subject_id 0 1 William sub2 1 2 Albert sub4 2 3 Tony sub3 3 4 Allen sub6

Príklad 2: Zlúčte dva dátové rámce na viacerých kľúčoch:

 import pandas as pd left = pd.DataFrame({ &apos;id&apos;:[1,2,3,4,5], &apos;Name&apos;: [&apos;Alex&apos;, &apos;Amy&apos;, &apos;Allen&apos;, &apos;Alice&apos;, &apos;Ayoung&apos;], &apos;subject_id&apos;:[&apos;sub1&apos;,&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub6&apos;,&apos;sub5&apos;]}) right = pd.DataFrame({ &apos;id&apos;:[1,2,3,4,5], &apos;Name&apos;: [&apos;Billy&apos;, &apos;Brian&apos;, &apos;Bran&apos;, &apos;Bryce&apos;, &apos;Betty&apos;], &apos;subject_id&apos;:[&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub3&apos;,&apos;sub6&apos;,&apos;sub5&apos;]}) print pd.merge(left,right,on=&apos;id&apos;)

Výkon

 id Name_x subject_id_x Name_y subject_id_y 0 1 John sub1 William sub2 1 2 Parker sub2 Albert sub4 2 3 Smith sub4 Tony sub3 3 4 Parker sub6 Allen sub6

TechCodeview

Pandas DataFrame.merge()

Syntax:

Parametre:

Príklad 1: Zlúčte dva dátové rámce na kľúči

Príklad 2: Zlúčte dva dátové rámce na viacerých kľúčoch: