logo

Mi az a HIVE

A Hive egy adattárház-rendszer, amelyet strukturált adatok elemzésére használnak. A Hadoop tetejére épül. A Facebook fejlesztette ki.

A Hive az elosztott tárolóban található nagy adatkészletek olvasásának, írásának és kezelésének funkcióját biztosítja. SQL-szerűen futtatja a HQL (Hive query language) nevű lekérdezéseket, amelyeket belsőleg MapReduce-feladatokká alakítanak.

java vs c++

A Hive használatával kihagyhatjuk a hagyományos megközelítés követelményét, az összetett MapReduce programok írását. A Hive támogatja az adatdefiníciós nyelvet (DDL), az adatmanipulációs nyelvet (DML) és a felhasználói függvényeket (UDF).

kivétel dobja a javát

A Hive jellemzői

Ezek a Hive következő funkciói:

  • A Hive gyors és méretezhető.
  • SQL-szerű lekérdezéseket (azaz HQL-t) biztosít, amelyek implicit módon MapReduce- vagy Spark-feladatokká alakulnak.
  • Képes a HDFS-ben tárolt nagy adatkészletek elemzésére.
  • Különféle tárolási típusokat tesz lehetővé, például egyszerű szöveget, RCFile-t és HBase-t.
  • Indexelést használ a lekérdezések felgyorsítására.
  • Működhet a Hadoop ökoszisztémában tárolt tömörített adatokon.
  • Támogatja a felhasználó által definiált funkciókat (UDF), ahol a felhasználó biztosíthatja a funkcióit.

A Hive korlátai

  • A Hive nem képes valós idejű adatok kezelésére.
  • Nem online tranzakciófeldolgozásra tervezték.
  • A Hive-lekérdezések magas késleltetést tartalmaznak.

A Hive és a Pig közötti különbségek

Kaptár malac
A Hive-t általában az adatelemzők használják. A malacot általában a programozók használják.
SQL-szerű lekérdezéseket követ. Az adatfolyam nyelvét követi.
Strukturált adatokat képes kezelni. Képes félig strukturált adatok kezelésére.
A HDFS-fürt szerveroldalán működik. A HDFS-fürt kliens oldalán működik.
A kaptár lassabb, mint a Pig. A malac viszonylag gyorsabb, mint Hive.