Pandas DataFrame je dvojrozmerná, veľkosťou meniteľná, potenciálne heterogénna tabuľková dátová štruktúra s označenými osami (riadky a stĺpce). Aritmetické operácie sa zarovnávajú na štítkoch riadkov aj stĺpcov. Možno si to predstaviť ako kontajner podobný diktátu pre objekty série. Toto je primárna dátová štruktúra pandy .
Pandas DataFrame loc[] Syntax
pandy DataFrame.loc Atribút pristupuje k skupine riadkov a stĺpcov podľa štítkov alebo booleovských polí v danom poli DataFrame Pandas .
Syntax: DataFrame.loc
Parameter: žiadne
Návraty: Skalárne, séria, dátový rámec
Pandas DataFrame loc Property
Nižšie je uvedených niekoľko príkladov, pomocou ktorých môžeme použiť Pandas DataFrame loc[]:
Príklad 1: Vyberte jeden riadok a stĺpec podľa štítka pomocou loc[]
Na prístup ku konkrétnej bunke v danej bunke použite atribút DataFrame.loc Dátový rámec Pandas pomocou indexových a stĺpcových označení. Potom vyberieme jeden riadok a stĺpec podľa označenia pomocou loc[].
Python3
konverzia java reťazca na int
# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'Weight'>: [>45>,>88>,>56>,>15>,>71>],> >'Name'>: [>'Sam'>,>'Andrea'>,>'Alex'>,>'Robin'>,>'Kia'>],> >'Age'>: [>14>,>25>,>55>,>8>,>21>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Corrected selection using loc for a specific cell> result>=> df.loc[>'Row_2'>,>'Name'>]> # Print the result> print>(>'
Selected Value at Row_2, Column 'Name':'>)> print>(result)> |
>
>
Výkon
java localdate
Original DataFrame: Weight Name Age Row_1 45 Sam 14 Row_2 88 Andrea 25 Row_3 56 Alex 55 Row_4 15 Robin 8 Row_5 71 Kia 21 Selected Value at Row_2, Column 'Name': Andrea>
Príklad 2: Vyberte možnosť Viac riadkov a stĺpcov
Pomocou atribútu DataFrame.loc vrátite dva stĺpce v danom dátovom rámci a potom vyberiete viacero riadkov a stĺpcov, ako je uvedené v príklade nižšie.
Python3
# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'A'>:[>12>,>4>,>5>,>None>,>1>],> >'B'>:[>7>,>2>,>54>,>3>,>None>],> >'C'>:[>20>,>16>,>11>,>3>,>8>],> >'D'>:[>14>,>3>,>None>,>2>,>6>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Corrected column names ('A' and 'D') in the result> result>=> df.loc[:, [>'A'>,>'D'>]]> # Print the result> print>(>'
Selected Columns 'A' and 'D':'>)> print>(result)> |
>
>
zlúčiť triedenie v jave
Výkon
Original DataFrame: A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Selected Columns 'A' and 'D': A D Row_1 12.0 14.0 Row_2 4.0 3.0 Row_3 5.0 NaN Row_4 NaN 2.0 Row_5 1.0 6.0>
Príklad 3: Vyberte medzi dvoma riadkami alebo stĺpcami
V tomto príklade vytvoríme dátový rámec pandas s názvom „df“, nastavíme vlastné indexy riadkov a potom použijemeloc>prístupový prvok na výber riadkov medzi riadkami „Row_2“ a „Row_4“ vrátane a stĺpcami „B“ až „D“. Vybrané riadky a stĺpce sa vytlačia, čo demonštruje použitie indexovania na základe štítkovloc>.
Python3
# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'A'>: [>12>,>4>,>5>,>None>,>1>],> >'B'>: [>7>,>2>,>54>,>3>,>None>],> >'C'>: [>20>,>16>,>11>,>3>,>8>],> >'D'>: [>14>,>3>,>None>,>2>,>6>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Select Rows Between 'Row_2' and 'Row_4'> selected_rows>=> df.loc[>'Row_2'>:>'Row_4'>]> print>(>'
Selected Rows:'>)> print>(selected_rows)> # Select Columns 'B' through 'D'> selected_columns>=> df.loc[:,>'B'>:>'D'>]> print>(>'
Selected Columns:'>)> print>(selected_columns)> |
>
>
kedy bol vynájdený prvý počítač
Výkon
Original DataFrame: A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Selected Rows: A B C D Row_2 4 2 16 3.0 Row_3 5 54 11 NaN Row_4 NaN 3 3 2.0 Selected Columns: B C D Row_1 7 20 14.0 Row_2 2 16 3.0 Row_3 54 11 NaN Row_4 3 3 2.0 Row_5 NaN 8 6.0>
Príklad 4: Vyberte Alternatívne riadky alebo stĺpce
V tomto príklade vytvoríme dátový rámec pandas s názvom „df“, nastavíme vlastné indexy riadkov a potom použijemeiloc>prístupový prvok na výber alternatívnych riadkov (každý druhý riadok) a alternatívnych stĺpcov (každý druhý stĺpec). Výsledné výbery sa vytlačia a ukážu použitie celočíselného indexovania siloc>.
Python3
# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'A'>: [>12>,>4>,>5>,>None>,>1>],> >'B'>: [>7>,>2>,>54>,>3>,>None>],> >'C'>: [>20>,>16>,>11>,>3>,>8>],> >'D'>: [>14>,>3>,>None>,>2>,>6>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Select Alternate Rows> alternate_rows>=> df.iloc[::>2>]> print>(>'
Alternate Rows:'>)> print>(alternate_rows)> # Select Alternate Columns> alternate_columns>=> df.iloc[:, ::>2>]> print>(>'
Alternate Columns:'>)> print>(alternate_columns)> |
>
>
mysql zoznam všetkých používateľov
Výkon
Original DataFrame: A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Alternate Rows: A B C D Row_1 12.0 7 20 14.0 Row_3 5.0 54 11 NaN Row_5 1.0 NaN 8 6.0 Alternate Columns: A C Row_1 12.0 20 Row_2 4.0 16 Row_3 5.0 11 Row_4 NaN 3 Row_5 1.0 8>
Príklad 5: Použitie podmienok s Pandas loc
V tomto príklade vytvárame dátový rámec pandas s názvom „df“, nastavujeme vlastné indexy riadkov a využívameloc>prístupový prvok na výber riadkov na základe podmienok. Ukazuje výber riadkov, v ktorých má stĺpec „A“ hodnoty väčšie ako 5, a výber riadkov, v ktorých stĺpec „B“ nie je nulový. Výsledné výbery sa potom vytlačia s ukážkou použitia podmieneného filtrovanialoc>.
Python3
# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'A'>: [>12>,>4>,>5>,>None>,>1>],> >'B'>: [>7>,>2>,>54>,>3>,>None>],> >'C'>: [>20>,>16>,>11>,>3>,>8>],> >'D'>: [>14>,>3>,>None>,>2>,>6>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Using Conditions with loc> # Example: Select rows where column 'A' is greater than 5> selected_rows>=> df.loc[df[>'A'>]>>5>]> print>(>'
Rows where column 'A' is greater than 5:'>)> print>(selected_rows)> # Example: Select rows where column 'B' is not null> non_null_rows>=> df.loc[df[>'B'>].notnull()]> print>(>'
Rows where column 'B' is not null:'>)> print>(non_null_rows)> |
>
>
Výkon
Original DataFrame: A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Rows where column 'A' is greater than 5: A B C D Row_1 12.0 7 20 14.0 Row_3 5.0 54 11 NaN Rows where column 'B' is not null: A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0>