PANDÁK EGYESÍTÉSE - PANDÁK BEMUTATÓJA

Pandák összeolvad() úgy definiálható, mint a két adatkészlet egyesítésének folyamata, és a sorok igazítása a közös attribútumok vagy oszlopok alapján. Ez egy belépési pont az összes szabványos adatbázis-csatlakozási művelethez a DataFrame objektumok között:

Szintaxis:

 pd.merge(left, right, how=&apos;inner&apos;, on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True)

Paraméterek:

DataFrame vagy Series nevű

{'left', 'right', 'outer', 'inner'}, default 'inner'

bal:Csak a bal oldali keret kulcsait használja, hasonlóan az SQL bal külső összekapcsolásához; megőrizni a kulcsrendet.jobb:Csak a jobb oldali keret kulcsait használja, hasonlóan az SQL jobb külső összekapcsolásához; őrizze meg a kulcsok sorrendjét.külső:Mindkét keret kulcsainak egyesítését használta, hasonlóan az SQL teljes külső összekapcsolásához; a kulcsokat lexikográfiailag rendezni.belső:Mindkét keret kulcsainak metszéspontját használja, hasonlóan az SQL belső összekapcsolásához; őrizze meg a bal billentyűk sorrendjét.

címke vagy lista

rajta hagyott:

címke vagy lista, vagy tömbszerű

bool, alapértelmezett False

az (str, str), alapértelmezett ('_x', '_y') sora

bool, alapértelmezett True

bool vagy str, alapértelmezett False

_összeolvad

'left_only'azoknál a megfigyeléseknél, amelyek összevonási kulcsa csak a DataFrame bal oldalán jelenik meg, míg'csak_jobbra'azokhoz a megfigyelésekhez van megadva, amelyekben az egyesítő kulcs csak a DataFrame jobb oldalán jelenik meg,'mindkét'ha a megfigyelés egyesítő kulcsa mindkettőben megtalálható.

str, opcionális

'one_to_one' vagy '1:1': Ellenőrzi, hogy az egyesítő kulcsok egyediek-e mind a bal, mind a jobb oldali adatkészletben.
'one_to_many' vagy '1:m': Ellenőrzi, hogy az egyesítő kulcsok csak a bal oldali adatkészletben egyediek-e.
'many_to_one' vagy 'm:1': Ellenőrzi, hogy az egyesítő kulcsok csak a megfelelő adatkészletben egyediek-e.
'many_to_many' vagy 'm:m': megengedett, de nem eredményez ellenőrzést.

1. példa: Két DataFrame egyesítése egy kulcson

 # import the pandas library import pandas as pd left = pd.DataFrame({ &apos;id&apos;:[1,2,3,4], &apos;Name&apos;: [&apos;John&apos;, &apos;Parker&apos;, &apos;Smith&apos;, &apos;Parker&apos;], &apos;subject_id&apos;:[&apos;sub1&apos;,&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub6&apos;]}) right = pd.DataFrame({ &apos;id&apos;:[1,2,3,4], &apos;Name&apos;: [&apos;William&apos;, &apos;Albert&apos;, &apos;Tony&apos;, &apos;Allen&apos;], &apos;subject_id&apos;:[&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub3&apos;,&apos;sub6&apos;]}) print (left) print (right)

Kimenet

 id Name subject_id 0 1 John sub1 1 2 Parker sub2 2 3 Smith sub4 3 4 Parker sub6 id Name subject_id 0 1 William sub2 1 2 Albert sub4 2 3 Tony sub3 3 4 Allen sub6

2. példa: Két DataFrame egyesítése több kulcson:

 import pandas as pd left = pd.DataFrame({ &apos;id&apos;:[1,2,3,4,5], &apos;Name&apos;: [&apos;Alex&apos;, &apos;Amy&apos;, &apos;Allen&apos;, &apos;Alice&apos;, &apos;Ayoung&apos;], &apos;subject_id&apos;:[&apos;sub1&apos;,&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub6&apos;,&apos;sub5&apos;]}) right = pd.DataFrame({ &apos;id&apos;:[1,2,3,4,5], &apos;Name&apos;: [&apos;Billy&apos;, &apos;Brian&apos;, &apos;Bran&apos;, &apos;Bryce&apos;, &apos;Betty&apos;], &apos;subject_id&apos;:[&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub3&apos;,&apos;sub6&apos;,&apos;sub5&apos;]}) print pd.merge(left,right,on=&apos;id&apos;)

Kimenet

 id Name_x subject_id_x Name_y subject_id_y 0 1 John sub1 William sub2 1 2 Parker sub2 Albert sub4 2 3 Smith sub4 Tony sub3 3 4 Parker sub6 Allen sub6

TechCodeview

Pandas DataFrame.merge()

Szintaxis:

Paraméterek:

1. példa: Két DataFrame egyesítése egy kulcson

2. példa: Két DataFrame egyesítése több kulcson: