MI AZ A HIVE

A Hive egy adattárház-rendszer, amelyet strukturált adatok elemzésére használnak. A Hadoop tetejére épül. A Facebook fejlesztette ki.

A Hive az elosztott tárolóban található nagy adatkészletek olvasásának, írásának és kezelésének funkcióját biztosítja. SQL-szerűen futtatja a HQL (Hive query language) nevű lekérdezéseket, amelyeket belsőleg MapReduce-feladatokká alakítanak.

java vs c++

A Hive használatával kihagyhatjuk a hagyományos megközelítés követelményét, az összetett MapReduce programok írását. A Hive támogatja az adatdefiníciós nyelvet (DDL), az adatmanipulációs nyelvet (DML) és a felhasználói függvényeket (UDF).

kivétel dobja a javát

A Hive jellemzői

Ezek a Hive következő funkciói:

A Hive gyors és méretezhető.
SQL-szerű lekérdezéseket (azaz HQL-t) biztosít, amelyek implicit módon MapReduce- vagy Spark-feladatokká alakulnak.
Képes a HDFS-ben tárolt nagy adatkészletek elemzésére.
Különféle tárolási típusokat tesz lehetővé, például egyszerű szöveget, RCFile-t és HBase-t.
Indexelést használ a lekérdezések felgyorsítására.
Működhet a Hadoop ökoszisztémában tárolt tömörített adatokon.
Támogatja a felhasználó által definiált funkciókat (UDF), ahol a felhasználó biztosíthatja a funkcióit.

A Hive korlátai

A Hive nem képes valós idejű adatok kezelésére.
Nem online tranzakciófeldolgozásra tervezték.
A Hive-lekérdezések magas késleltetést tartalmaznak.

A Hive és a Pig közötti különbségek

Kaptár	malac
A Hive-t általában az adatelemzők használják.	A malacot általában a programozók használják.
SQL-szerű lekérdezéseket követ.	Az adatfolyam nyelvét követi.
Strukturált adatokat képes kezelni.	Képes félig strukturált adatok kezelésére.
A HDFS-fürt szerveroldalán működik.	A HDFS-fürt kliens oldalán működik.
A kaptár lassabb, mint a Pig.	A malac viszonylag gyorsabb, mint Hive.

TechCodeview

A Hive jellemzői

A Hive korlátai

A Hive és a Pig közötti különbségek