logo

Python Pandas sorozat

A Pandas sorozat egydimenziós tömbként definiálható, amely különféle adattípusok tárolására képes. A listát, sorszámot és szótárt egyszerűen sorozatokká alakíthatjuk a ' sorozat ' módszerrel. A sorozatok sorcímkéit indexnek nevezzük. Egy sorozat nem tartalmazhat több oszlopot. A következő paraméterrel rendelkezik:

    adat:Bármilyen lista, szótár vagy skalár érték lehet.index:Az index értékének egyedinek és hashálhatónak kell lennie. Az adatokkal azonos hosszúságúnak kell lennie. Ha nem adunk át egyetlen indexet sem, akkor alapértelmezett np.arrange(n) használva lesz.dtype:A sorozat adattípusára vonatkozik.másolat:Az adatok másolására szolgál.

Sorozat létrehozása:

Kétféleképpen hozhatunk létre sorozatot:

  1. Hozzon létre egy üres sorozatot
  2. Hozzon létre egy sorozatot a bemenetek segítségével.

Hozzon létre egy üres sorozatot:

Könnyen létrehozhatunk egy üres sorozatot a Pandasban, ami azt jelenti, hogy nem lesz értéke.

Az üres sorozat létrehozásához használt szintaxis:

 = pandas.Series() 

Az alábbi példa egy üres sorozat típusú objektumot hoz létre, amelynek nincsenek értékei, és alapértelmezett adattípusa van, pl. úszó64 .

Példa

 import pandas as pd x = pd.Series() print (x) 

Kimenet

xvideoservicethief ubuntu 14.04 letöltés
 Series([], dtype: float64) 

Sorozat létrehozása bemenetekkel:

Sorozatokat hozhatunk létre különféle bemenetek használatával:

  • Sor
  • Dict
  • Skaláris érték

Sorozat létrehozása tömbből:

Sorozat létrehozása előtt először is importálnunk kell a zsibbadt modult, majd használja az array() függvényt a programban. Ha az adat ndarray, akkor az átadott indexnek azonos hosszúságúnak kell lennie.

Ha nem adunk át indexet, akkor alapértelmezés szerint az indexet tartomány(n) átadásra kerül, ahol n egy tömb hosszát határozza meg, azaz [0,1,2,.... range(len(tömb))-1 ].

Példa

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

Kimenet

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

Hozzon létre egy sorozatot a diktatúrából

pandák és numpy

Létrehozhatunk sorozatot is a diktatúrából. Ha a szótár objektumot bemenetként adjuk át, és az index nincs megadva, akkor a szótár kulcsait rendezett sorrendben veszi az index létrehozásához .

Ha átadja az indexet, akkor az indexben szereplő adott címkének megfelelő értékek ki lesznek kinyerve az indexből szótár .

 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

Kimenet

 x 0.0 y 1.0 z 2.0 dtype: float64 

Hozzon létre egy sorozatot skalárral:

Ha a skaláris értékeket vesszük, akkor az indexet meg kell adni. A skaláris érték megismétlődik, hogy megfeleljen az index hosszának.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

Kimenet

 0 4 1 4 2 4 3 4 dtype: int64 

Adatok elérése a Pozícióval rendelkező sorozatokból:

Miután létrehozta a Series típusú objektumot, hozzáférhet annak indexeihez, adataihoz és még az egyes elemeihez is.

A sorozat adatai az ndarrayhoz hasonlóan érhetők el.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

Kimenet

 1 

Sorozatobjektum attribútumok

A Series attribútum a Series objektumhoz kapcsolódó bármely információ, például méret, adattípus. stb. Az alábbiakban felsorolunk néhány attribútumot, amelyek segítségével információkat szerezhet a Series objektumról:

Attribútumok Leírás
Series.index Meghatározza a sorozat indexét.
Sorozat.alak Az adatok egy sor alakját adja vissza.
Series.dtype Visszaadja az adatok adattípusát.
Series.size Visszaadja az adatok méretét.
Sorozat.üres Igaz értéket ad vissza, ha a Series objektum üres, ellenkező esetben hamis értéket ad vissza.
Sorozat.hasnans Igazat ad vissza, ha vannak NaN értékek, ellenkező esetben hamis értéket ad vissza.
Series.nbytes Az adatokban lévő bájtok számát adja vissza.
sorozat vagyok Az adatokban lévő dimenziók számát adja vissza.
Series.itemsize Az elem adattípusának méretét adja vissza.

Sorozatobjektum indextömbjének és adattömbjének lekérése

Egy meglévő sorozat objektum indextömbjét és adattömbjét az index és értékek attribútumok használatával kérhetjük le.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

Kimenet

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

Típusok (dtype) és típusméret (elemsize) lekérése

Használhatja a dtype attribútumot a Series objektummal dtypeként egy sorozat objektum egyedi elemének adattípusának lekéréséhez, használhatja a tételes attribútum az egyes adatelemekhez lefoglalt bájtok számának megjelenítéséhez.

összefűzés java karakterlánc
 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

Kimenet

 int64 8 float64 8 

Alakzat visszakeresése

A Series objektum alakja határozza meg az elemek teljes számát, beleértve a hiányzó vagy üres értékeket (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

Kimenet

 (4,) (3,) 

Méret, méret és bájtok számának lekérése:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

Kimenet

 1 1 4 3 32 24 

A NaN-ek ürességének és jelenlétének ellenőrzése

A Series objektum ürességének ellenőrzéséhez használja a üres attribútum . Hasonlóképpen annak ellenőrzésére, hogy egy sorozatobjektum tartalmaz-e néhány NaN értéket, használhatja a hassan tulajdonság.

Példa

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

Kimenet

 False False True True False False 4 3 3 3 

Sorozatfüggvények

A sorozatban néhány funkciót használnak, amelyek a következők:

Funkciók Leírás
Pandas Series.map() Térképezze le az értékeket két olyan sorozatból, amelyeknek közös oszlopa van.
Pandas Series.std() Számítsa ki az adott számkészlet, DataFrame, oszlop és sor szórását.
Pandas Series.to_frame() Konvertálja a sorozat objektumot adatkeretté.
Pandas Series.value_counts() Olyan sorozatot ad vissza, amely egyedi értékek számát tartalmazza.