Különbség a kaptár és a hada között
A Big Data egyszerűen kifejezve a strukturált és nem strukturált üzleti adatok kombinációja. A Big Data az üzleti vállalkozás aktuális napi tranzakciós adataival foglalkozik, amelyek jellegzetessége nagyon összetett. A Big Data a kezdetektől kezdve a világ egyik legszebb mesterséges intelligencia eszköze. A Big Data azonban saját korlátozásokkal rendelkezik az adatok tárolása, mérete, elemzése, keresése, megosztása és az üzleti felhasználók számára történő bemutatása szempontjából.
A végfelhasználók elindították egy tradicionális vállalati megközelítést, amely egy szervert, adatbázist és felhasználót tartalmaz. De az adatbázis-kiszolgálónak szűk keresztmetszete volt egy hatalmas adatdarab feldolgozása egyetlen processzor alatt. Ennek a korlátozásnak a leküzdése érdekében a Google bevezette a Map Reduce Algorithm alkalmazást, amely az adatokat egy elosztott rendszerek között képes feldolgozni. Ezt az algoritmust és a Big Data-t később Doug Cutting és csapata átalakította egy Hadoop nevű nyílt forrású Java keretrendszerré. A Hadoop-ot több szállító forgalmazza szerte a világon, üzleti igényeik függvényében. Ez a cikk szándékában áll rávilágítani a Big Data technológiákra, nevezetesen a Hive és Hue technológiákra.
A Hadoop ökoszisztéma legtöbb műveletét a parancssori felületen keresztül hajtják végre, de a Hadoop kezdeti kiadása során nem volt semmilyen felhasználói felület. A Hue egy olyan webes felhasználói felület, amely elvégzi a Hadoop ökoszisztéma vagy a Hadoop alapú keretekkel kapcsolatos általános tevékenységek egy részét. A Hue-t egy nyílt forráskódú Hadoop keretrendszer indította el és fejlesztette ki Cloudera néven.
A Hive-t a Facebook indította el a fejlesztés kezdeti szakaszában, majd később az Apache Software Foundation átvette. Ez a Hive Apache-projekt beágyazta a Hadoop ökoszisztémába. A Hive-t úgy tervezték, hogy kölcsönhatásba lépjen a HDFS-ben (Hadoop Distribution File System) tárolt adatokkal. A kaptár hasonló az SQL-hez, mint a lekérdező nyelv. A kaptár alapvetően arra szolgál, hogy lekérdezzék és beolvassák az adatokat a HDFS-ből. Az ilyen típusú lekérdezési nyelv a Hive használatával HiveQL vagy HQL néven ismert.
Összehasonlítás a kaptár és a színárnyalat között (Infographics)
Az alábbiakban a Hive és a HUE közötti 6 legjobb összehasonlítás található
Fő különbségek a kaptár és a színárnyalat között
- A Hue egy olyan webes felhasználói felület, amely számos szolgáltatást nyújt a Cloudera alapú Hadoop keretrendszeren keresztül. A főbb funkciók közé tartozik a HDFS fájlböngésző, a Pig szerkesztő, a Hive szerkesztő, a Job böngésző, a Hadoop shell, a felhasználói adminisztrátori engedélyek, az Impala szerkesztő, az Ozzie webes felület és a Hadoop API Access. A Hive azonban egy analitikus SQL lekérdező nyelv, amely lekérdezheti vagy manipulálhatja az adatbázisban tárolt adatokat. A Hive néhány fő jellemzője a Map-Reduce algoritmus, az OLAP (online analitikus feldolgozás), a sémák létrehozása az adatbázisokban, a DML és DDL műveletek végrehajtása, mint például a CREATE, ALTER, INSERT, SELECT, UPDATE, DELETE, DROP utasítások a HDFS-en.
- A Hue webes felhasználói felületet és a fájl elérési útját nyújtja a HDFS böngészéséhez. Ez a webes felhasználói felület elrendezés elősegíti a felhasználókat a fájlok böngészésében, hasonlóan az átlagos Windows-felhasználóknak, akik fájljaikat a számítógépen találják meg. Ez a Hue kiegészítő szolgáltatás segít a felhasználóknak a fájlok manuális feltöltésében vagy áthelyezésében is a különféle könyvtárakba a webes felhasználói felületen keresztül. A HDFS-en tárolt fájlok a Hue fájlböngésző opcióival érhetők el. A Hue praktikus eszköz lehet azoknak a felhasználóknak, akik nem szeretik a UNIX parancssori felületet. A Hive-t azonban sémák és adatbázisok létrehozására használják az adatbázis lekérdezéséhez. A kaptárban lévő DML és DDL utasítások (CREATE, ALTER, INSERT, SELECT, UPDATE, DELETE, DROP) segít a felhasználóknak a HDFS-en tárolt adatok üzleti követelmények szerinti elemzésében. A kaptár manuálisan képes feldolgozni és feltölteni az adatokat a szöveges fájlokból a táblákba. De nem mozgathatja a fájlokat a különböző könyvtárak között.
- A Hue felhasználói felületet biztosít a térkép feladatának állapotának nyomon követéséhez, így csökkentve a feladatokat. Ezeket a feladatokat az internetes felhasználói felületen a jobböngésző opcióval böngészheti. A színárnyalatos állást színkódolás formájában (piros, zöld, sárga és fekete) ábrázolják. Zöld-Sikeres befejezett munkák, Sárga - Jelenleg futó munkák, Piros - sikertelen jobok és Fekete - A felhasználó által manuálisan elhagyott munkák. De Hive viszont a Map-Reduce algoritmust használja fel a HDFS-en tárolt adatok feldolgozására. A kaptár parancssori felülettel vagy webes szerkesztőkkel, például a Hue segítségével működtethető. A kaptárt általában összetett, nem strukturált adatok elemzésére használják. A Hive alkalmazásával végrehajtott ilyen típusú analitikai műveletek a Térkép csökkentése feladatokként vannak ütemezve a Hadoop ökoszisztémájában.
- A Hue webes felhasználói felületet biztosít a programozási nyelvekhez, mint például a Hive, amely praktikus eszköz lehet a felhasználók számára a szintaxis hibák elkerülése érdekében a lekérdezések végrehajtásakor. A Hue visszaadja az eredménykészletet és naplózza a sikeres lekérdezés végrehajtását. A Hue lehetővé teszi a felhasználók számára az adatok elemzését diagramok (kördiagramok és oszlopdiagramok) formájában. A kaptár szerkesztője a Hue lekérdezés szerkesztőinek opcióival érhető el. De a Hive árnyalat nélküli nem érhető el webszerkesztőn keresztül. Vizualizációk nem hozhatók létre a Hive segítségével. A Hive csak a parancssori szinten beállított eredményt jeleníti meg.
- Az árnyalat lehetővé teszi a felhasználók számára, hogy a HDFS fájlkezelői engedélyeket hozzanak létre és konfigurálhassanak. A fájljogosultságok és a felhasználói szerepkörök a böngészőben felsorolt biztonsági opciókkal érhetők el. A Hue lehetővé teszi a felhasználók számára az Ozzie munkafolyamatok nyomon követését a munkaböngészőn ütemezett feladatok feldolgozása érdekében. A Hue lehetővé teszi a felhasználók számára a táblázatok és adatbázisok böngészését és elérését a metastore manager és az adatbázis szerkesztőkön keresztül. A Hive azonban a Kerberos 2.0 hitelesítéssel és a Hadoop Clusterrel is biztonságot kapott. Az Ozzie használatával ütemezett munkafolyamatokat nem lehet a Hive segítségével nyomon követni. A sémák és adatbázisok formájában tárolt összes adat a HiveQL vagy a Hive segítségével is megnézhető.
Kaptár és árnyalat összehasonlító táblázat
Az alábbiakban bemutatjuk a Hive és a Hue összehasonlító táblázatot
Az összehasonlítás alapja |
KAPTÁR |
SZÍNÁRNYALAT |
Feltaláló / találmány | A Hive-t az Apache Software Foundation indította el. | A Hue-ot Cloudera indította el. |
Hatály / Jelentés | A Hive vagy a HiveQL egy analitikus lekérdezési nyelv, amelyet az adatok tárolására szolgáló adatok feldolgozására és lekérésére használnak. | A Hue egy webes felhasználói felület, amely megkönnyíti a felhasználókat a Hadoop ökoszisztémával való interakcióban. |
Telepítés / konfigurálás | A kaptár telepíthető vagy konfigurálható a Hadoop ökoszisztéma parancssori felületével. | Az árnyalatot csak webböngészővel lehet telepíteni vagy konfigurálni. |
funkcionalitás | A Hive térkép-csökkentő algoritmust használ az adatok feldolgozására és elemzésére. | A Hue webes felhasználói felület szerkesztővel rendelkezik a Hive és más programozási nyelvek eléréséhez. |
Végrehajtás | A kaptár végrehajtása és elérése parancssori felülettel vagy webes felhasználói felülettel történik. | A színárnyalatot egy webböngészőben valósítják meg, amellyel elérhetik a Cloudera-ra telepített több programot. |
Függőség | A kaptár beágyazható több Hadoop keretrendszerbe. | A Hue csak a Cloudera Based Hadoop Framework verzión érhető el. |
Következtetés - Hive vs Hue
Összegezve, a Hive & Hue nagy adattechnológiák bevezetését, a legfontosabb különbségeket és néhány összehasonlítást lefedtük. Láttuk néhány hasonlóságot a Hive-ben is, amelyek az SQL lekérdező nyelven is megtalálhatók. A Hue egyablakos webes felhasználói felület, amely az összes szolgáltatást a Hadoop nagy adatökoszisztémáján keresztül nyújtja. A Hive és a Hue felhasználhatók és konfigurálhatók a Hadoop alapú keretekben, a végfelhasználó igényeitől függően. Sok információ áll rendelkezésre az interneten az előre konfigurált Hadoop virtuális gépekkel együtt, hogy röviden áttekinthessék a Hive & Hue megvalósítását. A Hive és a Hue kulcsszerepet játszik a mai Big Data elemzésben.
Ajánlott cikk
Ez egy útmutató a Hive vs Hue, azok jelentésének, a fej-fej összehasonlításnak, a legfontosabb különbségeknek, az összehasonlító táblázatnak és a következtetésnek. A következő cikkeket is megnézheti további információkért -
- Apache Pig vs Apache Hive - A 12 legfontosabb különbség
- Hadoop vs Hive - derítse ki a legjobb különbségeket
- Az Apache Hive és az Apache HBase 12 legfontosabb összehasonlítása (Infographics)