logo

Rozdiel medzi loc() a iloc() v Pandas DataFrame

Knižnica Pandas v Pythone je veľmi užitočná na manipuláciu s matematickými údajmi a je široko používaná v oblasti strojového učenia. Zahŕňa mnoho metód pre jeho správne fungovanie. miesto() a iloc() sú jednou z týchto metód. Tieto sa používajú pri delení údajov z DataFrame Pandas . Pomáhajú pri pohodlnom výbere údajov z DataFrame v Python . Používajú sa pri filtrovaní údajov podľa určitých podmienok.

Rozdiel medzi loc() a iloc() v Pandas DataFrame

Tu uvidíme rozdiel medzi funkciami loc() a iloc() v Pandas DataFrame. Aby sme videli a porovnali rozdiel medzi týmito dvoma, vytvoríme vzorový Dataframe, ktorý použijeme v celom odseku. Fungovanie oboch týchto metód je vysvetlené na vzorovom súbore údajov o autách.



python3




stredový obrázok v css





# importing the module> import> pandas as pd> > # creating a sample dataframe> data>=> pd.DataFrame({>'Brand'>: [>'Maruti'>,>'Hyundai'>,>'Tata'>,> >'Mahindra'>,>'Maruti'>,>'Hyundai'>,> >'Renault'>,>'Tata'>,>'Maruti'>],> >'Year'>: [>2012>,>2014>,>2011>,>2015>,>2012>,> >2016>,>2014>,>2018>,>2019>],> >'Kms Driven'>: [>50000>,>30000>,>60000>,> >25000>,>10000>,>46000>,> >31000>,>15000>,>12000>],> >'City'>: [>'Gurgaon'>,>'Delhi'>,>'Mumbai'>,> >'Delhi'>,>'Mumbai'>,>'Delhi'>,> >'Mumbai'>,>'Chennai'>,>'Ghaziabad'>],> >'Mileage'>: [>28>,>27>,>25>,>26>,>28>,> >29>,>24>,>21>,>24>]})> > # displaying the DataFrame> display(data)>

>

>

Výkon

 Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 1 Hyundai 2014 30000 Delhi 27 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 24 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>

Funkcia Python loc().

The funkcia loc(). je metóda výberu údajov na základe štítkov, čo znamená, že musíme odovzdať názov riadka alebo stĺpca, ktorý chceme vybrať. Táto metóda na rozdiel od iloc() obsahuje posledný prvok rozsahu, ktorý je v nej odovzdaný. loc() môže akceptovať boolovské údaje na rozdiel od iloc(). Mnoho operácií je možné vykonať pomocou metódy loc(), napr

Príklad 1: Výber údajov podľa určitých podmienok

V tomto príklade kód používaloc>funkcia na výber a zobrazenie riadkov z DataFrame, kde je značka „Maruti“ a počet najazdených kilometrov je vyšší ako 25, pričom sa zobrazujú relevantné informácie o autách Maruti s vysokým počtom najazdených kilometrov.

python3




# selecting cars with brand 'Maruti' and Mileage>25> display(data.loc[(data.Brand>=>=> 'Maruti'>) & (data.Mileage>>25>)])>

>

>

Výkon

 Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 4 Maruti 2012 10000 Mumbai 28>

Príklad 2: Výber rozsahu riadkov z dátového rámca

V tomto príklade kód využívaloc>funkcia na extrahovanie a zobrazenie riadkov s indexmi v rozsahu od 2 do 5 (vrátane) z dátového rámca, ktoré poskytujú informácie o konkrétnom rade automobilov v súbore údajov.

python3

slnečný deol vek




# selecting range of rows from 2 to 5> display(data.loc[>2>:>5>])>

>

>

Výkon

nastavenia webového prehliadača
 Brand Year Kms Driven City Mileage 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29>

Príklad 3: Aktualizácia hodnoty ľubovoľného stĺpca

V tomto príklade kód používaloc>funkcia na aktualizáciu hodnôt „Najazdených kilometrov“ na 22 pre autá v DataFrame, kde je rok výroby pred rokom 2015. Potom sa zobrazí upravený DataFrame, ktorý odráža zmeny vykonané v stĺpci Najazdené kilometre.

python3




# updating values of Mileage if Year <2015> data.loc[(data.Year <>2015>), [>'Mileage'>]]>=> 22> display(data)>

>

>

latexová veľkosť textu

Výkon

 Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 22 1 Hyundai 2014 30000 Delhi 22 2 Tata 2011 60000 Mumbai 22 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 22 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 22 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>

Funkcia Python iloc().

The funkcia iloc(). je metóda výberu založená na indexe, čo znamená, že na výber konkrétneho riadka/stĺpca musíme v metóde odovzdať celočíselný index. Táto metóda nezahŕňa posledný prvok rozsahu, ktorý je v nej odovzdaný na rozdiel od loc(). iloc() neakceptuje boolovské údaje na rozdiel od loc(). Operácie vykonávané pomocou iloc() sú:

Príklad 1: Výber riadkov pomocou celočíselných indexov

V tomto príklade kód používailoc>funkcia na extrahovanie a zobrazenie konkrétnych riadkov s indexmi 0, 2, 4 a 7 z DataFrame, ktoré zobrazujú informácie o vybraných autách v súbore údajov.

python3




# selecting 0th, 2nd, 4th, and 7th index rows> display(data.iloc[[>0>,>2>,>4>,>7>]])>

>

>

škrupinové triedenie

Výkon

 Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 2 Tata 2011 60000 Mumbai 25 4 Maruti 2012 10000 Mumbai 28 7 Tata 2018 15000 Chennai 21>

Príklad 2: Výber rozsahu stĺpcov a riadkov súčasne

V tomto príklade kód využívailoc>funkcia na extrahovanie a zobrazenie podmnožiny dátového rámca vrátane riadkov 1 až 4 a stĺpcov 2 až 4. Poskytuje informácie o špecifickom rade automobilov a ich relevantných atribútoch v súbore údajov.

python3




# selecting rows from 1 to 4 and columns from 2 to 4> display(data.iloc[>1>:>5>,>2>:>5>])>

>

>

Výkon

 Kms Driven City Mileage 1 30000 Delhi 27 2 60000 Mumbai 25 3 25000 Delhi 26 4 10000 Mumbai 28>