A Pandas sorozat egydimenziós tömbként definiálható, amely különféle adattípusok tárolására képes. A listát, sorszámot és szótárt egyszerűen sorozatokká alakíthatjuk a ' sorozat ' módszerrel. A sorozatok sorcímkéit indexnek nevezzük. Egy sorozat nem tartalmazhat több oszlopot. A következő paraméterrel rendelkezik:
Sorozat létrehozása:
Kétféleképpen hozhatunk létre sorozatot:
- Hozzon létre egy üres sorozatot
- Hozzon létre egy sorozatot a bemenetek segítségével.
Hozzon létre egy üres sorozatot:
Könnyen létrehozhatunk egy üres sorozatot a Pandasban, ami azt jelenti, hogy nem lesz értéke.
Az üres sorozat létrehozásához használt szintaxis:
= pandas.Series()
Az alábbi példa egy üres sorozat típusú objektumot hoz létre, amelynek nincsenek értékei, és alapértelmezett adattípusa van, pl. úszó64 .
Példa
import pandas as pd x = pd.Series() print (x)
Kimenet
xvideoservicethief ubuntu 14.04 letöltés
Series([], dtype: float64)
Sorozat létrehozása bemenetekkel:
Sorozatokat hozhatunk létre különféle bemenetek használatával:
- Sor
- Dict
- Skaláris érték
Sorozat létrehozása tömbből:
Sorozat létrehozása előtt először is importálnunk kell a zsibbadt modult, majd használja az array() függvényt a programban. Ha az adat ndarray, akkor az átadott indexnek azonos hosszúságúnak kell lennie.
Ha nem adunk át indexet, akkor alapértelmezés szerint az indexet tartomány(n) átadásra kerül, ahol n egy tömb hosszát határozza meg, azaz [0,1,2,.... range(len(tömb))-1 ].
Példa
import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a)
Kimenet
0 P 1 a 2 n 3 d 4 a 5 s dtype: object
Hozzon létre egy sorozatot a diktatúrából
pandák és numpy
Létrehozhatunk sorozatot is a diktatúrából. Ha a szótár objektumot bemenetként adjuk át, és az index nincs megadva, akkor a szótár kulcsait rendezett sorrendben veszi az index létrehozásához .
Ha átadja az indexet, akkor az indexben szereplő adott címkének megfelelő értékek ki lesznek kinyerve az indexből szótár .
#import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a)
Kimenet
x 0.0 y 1.0 z 2.0 dtype: float64
Hozzon létre egy sorozatot skalárral:
Ha a skaláris értékeket vesszük, akkor az indexet meg kell adni. A skaláris érték megismétlődik, hogy megfeleljen az index hosszának.
#import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x)
Kimenet
0 4 1 4 2 4 3 4 dtype: int64
Adatok elérése a Pozícióval rendelkező sorozatokból:
Miután létrehozta a Series típusú objektumot, hozzáférhet annak indexeihez, adataihoz és még az egyes elemeihez is.
A sorozat adatai az ndarrayhoz hasonlóan érhetők el.
import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0])
Kimenet
1
Sorozatobjektum attribútumok
A Series attribútum a Series objektumhoz kapcsolódó bármely információ, például méret, adattípus. stb. Az alábbiakban felsorolunk néhány attribútumot, amelyek segítségével információkat szerezhet a Series objektumról:
Attribútumok | Leírás |
---|---|
Series.index | Meghatározza a sorozat indexét. |
Sorozat.alak | Az adatok egy sor alakját adja vissza. |
Series.dtype | Visszaadja az adatok adattípusát. |
Series.size | Visszaadja az adatok méretét. |
Sorozat.üres | Igaz értéket ad vissza, ha a Series objektum üres, ellenkező esetben hamis értéket ad vissza. |
Sorozat.hasnans | Igazat ad vissza, ha vannak NaN értékek, ellenkező esetben hamis értéket ad vissza. |
Series.nbytes | Az adatokban lévő bájtok számát adja vissza. |
sorozat vagyok | Az adatokban lévő dimenziók számát adja vissza. |
Series.itemsize | Az elem adattípusának méretét adja vissza. |
Sorozatobjektum indextömbjének és adattömbjének lekérése
Egy meglévő sorozat objektum indextömbjét és adattömbjét az index és értékek attribútumok használatával kérhetjük le.
import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values)
Kimenet
RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5]
Típusok (dtype) és típusméret (elemsize) lekérése
Használhatja a dtype attribútumot a Series objektummal dtypeként egy sorozat objektum egyedi elemének adattípusának lekéréséhez, használhatja a tételes attribútum az egyes adatelemekhez lefoglalt bájtok számának megjelenítéséhez.
összefűzés java karakterlánc
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize)
Kimenet
int64 8 float64 8
Alakzat visszakeresése
A Series objektum alakja határozza meg az elemek teljes számát, beleértve a hiányzó vagy üres értékeket (NaN).
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape)
Kimenet
(4,) (3,)
Méret, méret és bájtok számának lekérése:
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes)
Kimenet
1 1 4 3 32 24
A NaN-ek ürességének és jelenlétének ellenőrzése
A Series objektum ürességének ellenőrzéséhez használja a üres attribútum . Hasonlóképpen annak ellenőrzésére, hogy egy sorozatobjektum tartalmaz-e néhány NaN értéket, használhatja a hassan tulajdonság.
Példa
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( ))
Kimenet
False False True True False False 4 3 3 3
Sorozatfüggvények
A sorozatban néhány funkciót használnak, amelyek a következők:
Funkciók | Leírás |
---|---|
Pandas Series.map() | Térképezze le az értékeket két olyan sorozatból, amelyeknek közös oszlopa van. |
Pandas Series.std() | Számítsa ki az adott számkészlet, DataFrame, oszlop és sor szórását. |
Pandas Series.to_frame() | Konvertálja a sorozat objektumot adatkeretté. |
Pandas Series.value_counts() | Olyan sorozatot ad vissza, amely egyedi értékek számát tartalmazza. |