A Hive egy adattárház-rendszer, amelyet strukturált adatok elemzésére használnak. A Hadoop tetejére épül. A Facebook fejlesztette ki.
A Hive az elosztott tárolóban található nagy adatkészletek olvasásának, írásának és kezelésének funkcióját biztosítja. SQL-szerűen futtatja a HQL (Hive query language) nevű lekérdezéseket, amelyeket belsőleg MapReduce-feladatokká alakítanak.
java vs c++
A Hive használatával kihagyhatjuk a hagyományos megközelítés követelményét, az összetett MapReduce programok írását. A Hive támogatja az adatdefiníciós nyelvet (DDL), az adatmanipulációs nyelvet (DML) és a felhasználói függvényeket (UDF).
kivétel dobja a javát
A Hive jellemzői
Ezek a Hive következő funkciói:
- A Hive gyors és méretezhető.
- SQL-szerű lekérdezéseket (azaz HQL-t) biztosít, amelyek implicit módon MapReduce- vagy Spark-feladatokká alakulnak.
- Képes a HDFS-ben tárolt nagy adatkészletek elemzésére.
- Különféle tárolási típusokat tesz lehetővé, például egyszerű szöveget, RCFile-t és HBase-t.
- Indexelést használ a lekérdezések felgyorsítására.
- Működhet a Hadoop ökoszisztémában tárolt tömörített adatokon.
- Támogatja a felhasználó által definiált funkciókat (UDF), ahol a felhasználó biztosíthatja a funkcióit.
A Hive korlátai
- A Hive nem képes valós idejű adatok kezelésére.
- Nem online tranzakciófeldolgozásra tervezték.
- A Hive-lekérdezések magas késleltetést tartalmaznak.
A Hive és a Pig közötti különbségek
Kaptár | malac |
---|---|
A Hive-t általában az adatelemzők használják. | A malacot általában a programozók használják. |
SQL-szerű lekérdezéseket követ. | Az adatfolyam nyelvét követi. |
Strukturált adatokat képes kezelni. | Képes félig strukturált adatok kezelésére. |
A HDFS-fürt szerveroldalán működik. | A HDFS-fürt kliens oldalán működik. |
A kaptár lassabb, mint a Pig. | A malac viszonylag gyorsabb, mint Hive. |