logo

Ako triediť Pandas DataFrame?

Môžeme vykonávať triedenie v Pandas Dataframe. Tento článok bude diskutovať o tom, ako triediť Pandas DataFrame pomocou rôznych metód v Python .

Triedenie dátových rámcov v Pandas

Vytvorenie a Dátový rámec Pandas pre demonštráciu, tu sme vytvorili dátový rámec, v ktorom budeme vykonávať rôzne funkcie triedenia.

Python3






mapa vs

# importing pandas library> import> pandas as pd> # creating and initializing a nested list> age_list>=> [[>'Afghanistan'>,>1952>,>8425333>,>'Asia'>],> >[>'Australia'>,>1957>,>9712569>,>'Oceania'>],> >[>'Brazil'>,>1962>,>76039390>,>'Americas'>],> >[>'China'>,>1957>,>637408000>,>'Asia'>],> >[>'France'>,>1957>,>44310863>,>'Europe'>],> >[>'India'>,>1952>,>3.72e>+>08>,>'Asia'>],> >[>'United States'>,>1957>,>171984000>,>'Americas'>]]> # creating a pandas dataframe> df>=> pd.DataFrame(age_list, columns>=>[>'Country'>,>'Year'>,> >'Population'>,>'Continent'>])> df>

>

>

Výkon

Zoradiť Pandas DataFrame

Zoradiť Pandas DataFrame

Triedenie dátového rámca Pandas

Aby bolo možné zoradiť dátový rámec v pandách, funkcia sort_values() sa používa. pandy sort_values() dokáže zoradiť dátový rámec vo vzostupnom alebo zostupnom poradí.

Pandas DataFrame Triedenie vo vzostupnom poradí

Útržok kódu triedi DataFrame df vo vzostupnom poradí na základe stĺpca „Krajina“. Neukladá však ani nezobrazuje zoradený dátový rámec.

Python3




# Sorting by column 'Country'> df.sort_values(by>=>[>'Country'>])>

>

>

Výkon:

Zoradiť Pandas DataFrame

Zoradiť Pandas DataFrame

Triedenie dátového rámca Pandas v zostupnom poradí

DataFrame df bude zoradený v zostupnom poradí na základe stĺpca Populácia, pričom krajina s najvyšším počtom obyvateľov sa zobrazí v hornej časti DataFrame.

Python3




# Sorting by column 'Population'> df.sort_values(by>=>[>'Population'>], ascending>=>False>)>

globálna premenná javascript

>

>

Výkon:

Zoradiť Pandas DataFrame

Zoradiť Pandas DataFrame

Zoradiť Pandas DataFrame na základe vzorkovania

Tu triedime DataFrame (df>) na základe stĺpca „Populácia“ usporiadaním riadkov s chýbajúcimi hodnotami v „Populácia“ tak, aby sa zobrazovali ako prvé. Thesort_values()>metóda sna_position='first'>argument to dosahuje uprednostňovaním riadkov s chýbajúcimi hodnotami na začiatku zoradeného DataFrame.

Python3




# Sorting by column 'Population'> # by putting missing values first> df.sort_values(by>=>[>'Population'>], na_position>=>'first'>)>

>

>

Výkon:

Zoradiť Pandas DataFrame

Zoradiť Pandas DataFrame

Triedenie dátových rámcov podľa viacerých stĺpcov

V tomto príklade triedime DataFrame (df>) predovšetkým podľa stĺpca „Krajina“ vo vzostupnom poradí a v rámci každej skupiny krajín podľa stĺpca „Kontinent“. Výsledný DataFrame sa zoradí na základe zadaného poradia stĺpcov, čím sa vytvorí zoradená množina údajov.

Python3




java dátum na reťazec
# Sorting by columns 'Country' and then 'Continent'> df.sort_values(by>=>[>'Country'>,>'Continent'>])>

>

>

Výkon:

Zoradiť Pandas DataFrame

Zoradiť Pandas DataFrame

Triedenie dátových rámcov podľa stĺpcov, ale v inom poradí

V tomto príklade triedime DataFrame (df>) najprv podľa stĺpca „Krajina“ v zostupnom poradí a v rámci každej skupiny krajín podľa stĺpca „Kontinent“ vo vzostupnom poradí. Výsledný DataFrame je organizovaný na základe špecifikovaných kritérií triedenia stĺpcov.

Python3




# Sorting by columns 'Country' in descending> # order and then 'Continent' in ascending order> df.sort_values(by>=>[>'Country'>,>'Continent'>],> >ascending>=>[>False>,>True>])>

>

>

Výkon:

Zoradiť Pandas DataFrame

Zoradiť Pandas DataFrame