logo

Séria Python Pandas

Séria Pandas môže byť definovaná ako jednorozmerné pole, ktoré je schopné ukladať rôzne typy údajov. Zoznam, n-ticu a slovník môžeme jednoducho previesť na série pomocou ' séria ' metóda. Označenia riadkov sérií sa nazývajú index. Séria nemôže obsahovať viacero stĺpcov. Má nasledujúci parameter:

    údaje:Môže to byť ľubovoľný zoznam, slovník alebo skalárna hodnota.index:Hodnota indexu by mala byť jedinečná a hašovateľná. Musí mať rovnakú dĺžku ako údaje. Ak neodovzdáme žiadny index, predvolená hodnota np.arrange(n) bude použitý.dtype:Vzťahuje sa na typ údajov série.kopírovať:Používa sa na kopírovanie údajov.

Vytvorenie série:

Sériu môžeme vytvoriť dvoma spôsobmi:

  1. Vytvorte prázdnu sériu
  2. Vytvorte sériu pomocou vstupov.

Vytvorte prázdnu sériu:

V Pandas môžeme ľahko vytvoriť prázdnu sériu, čo znamená, že nebude mať žiadnu hodnotu.

Syntax, ktorá sa používa na vytvorenie prázdnej série:

 = pandas.Series() 

Nižšie uvedený príklad vytvorí objekt typu Empty Series, ktorý nemá žiadne hodnoty a má predvolený typ údajov, t.j. plavák64 .

Príklad

 import pandas as pd x = pd.Series() print (x) 

Výkon

 Series([], dtype: float64) 

Vytvorenie série pomocou vstupov:

Séria môžeme vytvoriť pomocou rôznych vstupov:

  • Pole
  • Dikt
  • Skalárna hodnota

Vytváranie série z poľa:

Pred vytvorením série musíme najprv importovať súbor numpy modul a potom v programe použite funkciu array(). Ak sú údaje ndarray, odovzdaný index musí mať rovnakú dĺžku.

Ak neodovzdáme index, potom štandardne index rozsah (n) sa odovzdáva kde n definuje dĺžku poľa, t.j. [0,1,2,.... rozsah(len(pole))-1 ].

Príklad

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

Výkon

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

Vytvorte sériu z dict

Môžeme tiež vytvoriť sériu z dict. Ak sa objekt slovníka odovzdáva ako vstup a index nie je zadaný, kľúče slovníka sa zoradia v zoradenom poradí na vytvorenie indexu. .

Ak je index odovzdaný, hodnoty zodpovedajúce konkrétnemu označeniu v indexe budú extrahované z slovník .

 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

Výkon

 x 0.0 y 1.0 z 2.0 dtype: float64 

Vytvorte sériu pomocou skaláru:

Ak vezmeme skalárne hodnoty, potom musí byť poskytnutý index. Skalárna hodnota sa zopakuje, aby sa zhodovala dĺžka indexu.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

Výkon

 0 4 1 4 2 4 3 4 dtype: int64 

Prístup k údajom zo série s pozíciou:

Po vytvorení objektu typu Series môžete pristupovať k jeho indexom, údajom a dokonca aj k jednotlivým prvkom.

K údajom v sérii je možné pristupovať podobne ako v ndarray.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

Výkon

 1 

Atribúty objektu série

Atribút Series je definovaný ako akákoľvek informácia súvisiaca s objektom Series, ako je veľkosť, typ údajov. atď. Nižšie sú uvedené niektoré atribúty, ktoré môžete použiť na získanie informácií o objekte série:

Atribúty Popis
Séria.index Definuje index série.
Séria.tvar Vracia n-ticu tvaru údajov.
Séria.dtype Vráti dátový typ dát.
Séria.veľkosť Vráti veľkosť údajov.
Séria.prázdna Ak je objekt Series prázdny, vráti hodnotu True, inak vráti hodnotu false.
Séria.hasnans Ak existujú nejaké hodnoty NaN, vráti hodnotu True, inak vráti hodnotu false.
Séria.nbajtov Vráti počet bajtov v údajoch.
séria ja som Vráti počet dimenzií v údajoch.
Séria.veľkosť položky Vráti veľkosť údajového typu položky.

Načítanie indexového poľa a dátového poľa objektu série

Pole indexov a údajové pole existujúceho objektu Series môžeme získať pomocou atribútov index a hodnoty.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

Výkon

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

Načítavanie typov (dtype) a veľkosti typu (itemsize)

Atribút dtype s objektom Series môžete použiť ako dtype na získanie typu údajov jednotlivého prvku objektu série, môžete použiť itemize atribút zobrazuje počet bajtov pridelených každej dátovej položke.

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

Výkon

 int64 8 float64 8 

Načítavanie tvaru

Tvar objektu Series definuje celkový počet prvkov vrátane chýbajúcich alebo prázdnych hodnôt (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

Výkon

 (4,) (3,) 

Získava sa rozmer, veľkosť a počet bajtov:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

Výkon

pre loop bash
 1 1 4 3 32 24 

Kontrola prázdnoty a prítomnosti NaN

Ak chcete skontrolovať, či je objekt Series prázdny, môžete použiť prázdny atribút . Podobne, ak chcete skontrolovať, či objekt série obsahuje nejaké hodnoty NaN alebo nie, môžete použiť hassan atribút.

Príklad

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

Výkon

 False False True True False False 4 3 3 3 

Funkcie série

V sérii sa používajú tieto funkcie:

Funkcie Popis
Séria Pandas.map() Namapujte hodnoty z dvoch radov, ktoré majú spoločný stĺpec.
Pandas Series.std() Vypočítajte štandardnú odchýlku danej množiny čísel, dátového rámca, stĺpca a riadkov.
Pandas Series.to_frame() Skonvertujte objekt série na dátový rámec.
Pandas Series.value_counts() Vráti sériu, ktorá obsahuje počty jedinečných hodnôt.