Séria Pandas môže byť definovaná ako jednorozmerné pole, ktoré je schopné ukladať rôzne typy údajov. Zoznam, n-ticu a slovník môžeme jednoducho previesť na série pomocou ' séria ' metóda. Označenia riadkov sérií sa nazývajú index. Séria nemôže obsahovať viacero stĺpcov. Má nasledujúci parameter:
Vytvorenie série:
Sériu môžeme vytvoriť dvoma spôsobmi:
- Vytvorte prázdnu sériu
- Vytvorte sériu pomocou vstupov.
Vytvorte prázdnu sériu:
V Pandas môžeme ľahko vytvoriť prázdnu sériu, čo znamená, že nebude mať žiadnu hodnotu.
Syntax, ktorá sa používa na vytvorenie prázdnej série:
= pandas.Series()
Nižšie uvedený príklad vytvorí objekt typu Empty Series, ktorý nemá žiadne hodnoty a má predvolený typ údajov, t.j. plavák64 .
Príklad
import pandas as pd x = pd.Series() print (x)
Výkon
Series([], dtype: float64)
Vytvorenie série pomocou vstupov:
Séria môžeme vytvoriť pomocou rôznych vstupov:
- Pole
- Dikt
- Skalárna hodnota
Vytváranie série z poľa:
Pred vytvorením série musíme najprv importovať súbor numpy modul a potom v programe použite funkciu array(). Ak sú údaje ndarray, odovzdaný index musí mať rovnakú dĺžku.
Ak neodovzdáme index, potom štandardne index rozsah (n) sa odovzdáva kde n definuje dĺžku poľa, t.j. [0,1,2,.... rozsah(len(pole))-1 ].
Príklad
import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a)
Výkon
0 P 1 a 2 n 3 d 4 a 5 s dtype: object
Vytvorte sériu z dict
Môžeme tiež vytvoriť sériu z dict. Ak sa objekt slovníka odovzdáva ako vstup a index nie je zadaný, kľúče slovníka sa zoradia v zoradenom poradí na vytvorenie indexu. .
Ak je index odovzdaný, hodnoty zodpovedajúce konkrétnemu označeniu v indexe budú extrahované z slovník .
#import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a)
Výkon
x 0.0 y 1.0 z 2.0 dtype: float64
Vytvorte sériu pomocou skaláru:
Ak vezmeme skalárne hodnoty, potom musí byť poskytnutý index. Skalárna hodnota sa zopakuje, aby sa zhodovala dĺžka indexu.
#import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x)
Výkon
0 4 1 4 2 4 3 4 dtype: int64
Prístup k údajom zo série s pozíciou:
Po vytvorení objektu typu Series môžete pristupovať k jeho indexom, údajom a dokonca aj k jednotlivým prvkom.
K údajom v sérii je možné pristupovať podobne ako v ndarray.
import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0])
Výkon
1
Atribúty objektu série
Atribút Series je definovaný ako akákoľvek informácia súvisiaca s objektom Series, ako je veľkosť, typ údajov. atď. Nižšie sú uvedené niektoré atribúty, ktoré môžete použiť na získanie informácií o objekte série:
Atribúty | Popis |
---|---|
Séria.index | Definuje index série. |
Séria.tvar | Vracia n-ticu tvaru údajov. |
Séria.dtype | Vráti dátový typ dát. |
Séria.veľkosť | Vráti veľkosť údajov. |
Séria.prázdna | Ak je objekt Series prázdny, vráti hodnotu True, inak vráti hodnotu false. |
Séria.hasnans | Ak existujú nejaké hodnoty NaN, vráti hodnotu True, inak vráti hodnotu false. |
Séria.nbajtov | Vráti počet bajtov v údajoch. |
séria ja som | Vráti počet dimenzií v údajoch. |
Séria.veľkosť položky | Vráti veľkosť údajového typu položky. |
Načítanie indexového poľa a dátového poľa objektu série
Pole indexov a údajové pole existujúceho objektu Series môžeme získať pomocou atribútov index a hodnoty.
import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values)
Výkon
RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5]
Načítavanie typov (dtype) a veľkosti typu (itemsize)
Atribút dtype s objektom Series môžete použiť ako dtype na získanie typu údajov jednotlivého prvku objektu série, môžete použiť itemize atribút zobrazuje počet bajtov pridelených každej dátovej položke.
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize)
Výkon
int64 8 float64 8
Načítavanie tvaru
Tvar objektu Series definuje celkový počet prvkov vrátane chýbajúcich alebo prázdnych hodnôt (NaN).
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape)
Výkon
(4,) (3,)
Získava sa rozmer, veľkosť a počet bajtov:
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes)
Výkon
pre loop bash
1 1 4 3 32 24
Kontrola prázdnoty a prítomnosti NaN
Ak chcete skontrolovať, či je objekt Series prázdny, môžete použiť prázdny atribút . Podobne, ak chcete skontrolovať, či objekt série obsahuje nejaké hodnoty NaN alebo nie, môžete použiť hassan atribút.
Príklad
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( ))
Výkon
False False True True False False 4 3 3 3
Funkcie série
V sérii sa používajú tieto funkcie:
Funkcie | Popis |
---|---|
Séria Pandas.map() | Namapujte hodnoty z dvoch radov, ktoré majú spoločný stĺpec. |
Pandas Series.std() | Vypočítajte štandardnú odchýlku danej množiny čísel, dátového rámca, stĺpca a riadkov. |
Pandas Series.to_frame() | Skonvertujte objekt série na dátový rámec. |
Pandas Series.value_counts() | Vráti sériu, ktorá obsahuje počty jedinečných hodnôt. |