logo

Spôsoby filtrovania Pandas DataFrame podľa hodnôt stĺpcov

Filtrovanie Pandas DataFrame prostredníctvom hodnôt stĺpcov je bežná operácia pri spustení s informáciami v Pythone. Na dosiahnutie tohto cieľa môžete použiť rôzne metódy a techniky. Tu je mnoho spôsobov, ako odfiltrovať Pandas DataFrame prostredníctvom hodnôt stĺpcov.

V tomto príspevku uvidíme rôzne spôsoby filtrovania dátového rámca Pandas podľa hodnôt stĺpcov. Najprv si vytvoríme dátový rámec:



Python3








# importing pandas> import> pandas as pd> > # declare a dictionary> record>=> {> >'Name'> : [>'Ankit'>,>'Swapnil'>,>'Aishwarya'>,> >'Priyanka'>,>'Shivangi'>,>'Shaurya'> ],> > >'Age'> : [>22>,>20>,>21>,>19>,>18>,>22>],> > >'Stream'> : [>'Math'>,>'Commerce'>,>'Science'>,> >'Math'>,>'Math'>,>'Science'>],> > >'Percentage'> : [>90>,>90>,>96>,>75>,>70>,>80>] }> > # create a dataframe> dataframe>=> pd.DataFrame(record,> >columns>=> [>'Name'>,>'Age'>,> >'Stream'>,>'Percentage'>])> # show the Dataframe> print>(>'Given Dataframe : '>, dataframe)>

>

>

Výkon:

Dataframe

Výber riadkov dátového rámca Pandas na základe konkrétnej hodnoty stĺpca pomocou operátorov „>“, „=“, „=“, „<=“, „!=“.

Príklad 1: Výber všetkých riadkov z daného dátového rámca, v ktorých je „percento“ väčšie ako 75 pomocou [ ] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Percentage'>]>>70>]> > print>(>' Result dataframe : '>, rslt_df)>

>

>

Výkon:

výstupný dátový rámec

Príklad 2: Výber všetkých riadkov z daného dátového rámca, v ktorých je „percento“ väčšie ako 70 pomocou miesto [ ] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Percentage'>]>>70>]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Výkon:

výstupný dátový rámec-1

Výber tých riadkov dátového rámca Pandas, ktorých hodnota stĺpca je prítomná v zozname pomocou ty() metóda dátového rámca.

Príklad 1: Výber všetkých riadkov z daného dátového rámca, v ktorom sa nachádza „Stream“ v zozname možností pomocou [ ] .

Python3




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Výkon:

výstupný dátový rámec-2

Príklad 2: Výber všetkých riadkov z daného dátového rámca, v ktorom sa nachádza „Stream“ v zozname možností pomocou miesto [ ] .

Python




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Výkon:

výstupný dátový rámec-3

Výber riadkov dátového rámca Pandas na základe podmienok viacerých stĺpcov pomocou operátora „&“.

Príklad1: Výber všetkých riadkov z daného dátového rámca, v ktorom sa „Vek“ rovná 22 a „Stream“ je prítomný v zozname možností pomocou [ ] .

Python3




options>=> [>'Commerce'> ,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Výkon:

výstupný dátový rámec-4

Príklad 2: Výber všetkých riadkov z daného dátového rámca, v ktorom sa „Vek“ rovná 22 a „Stream“ je prítomný v zozname možností pomocou miesto [ ] .

Python3




skúste catch block java

options>=> [>'Commerce'>,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Výkon:

výstupný dátový rámec-5