HDFS parancs - Alapvető és haladó szintű parancs, tippekkel és trükkökkel

Tartalomjegyzék:

Anonim

Bevezetés a HDFS parancsokba

A nagy adatok olyan nagy adatkészletekre vonatkoznak, amelyek annyira hatalmasak vagy összetettek, hogy a hagyományos adatfeldolgozó alkalmazás-szoftverek nem elegendőek a velük való együttműködéshez. A Hadoop egy nyílt forráskódú, Java-alapú programozási keret, amely elosztja az óriási terjedelmű adatkészletek feldolgozási és tárolóterületét egy elterjedt számítási környezetben. Az Apache szoftver alapja a kulcs a Hadoop telepítéséhez

A HDFS tulajdonságai:

  • A HDFS Master / slave architektúrán fut
  • A fájlokat a HDFS használja a felhasználóval kapcsolatos adatok tárolására
  • hatalmas könyvtárakat és fájlokat tartalmaz, amelyeket hierarchikus formátumban tárolnak.
  • Belül egy fájlt kisebb blokkokba másolnak, és ezeket a blokkokat Datanodes sorozatban tárolják.
  • A Namenode és a Datanode annak a szoftvernek a része, amelyet a GNU / Linux operációs rendszeren klasszikusan futó gépeken futtatni szántak.

Namenode:

  • Itt a fájlrendszert névcsomópont tartja fenn
  • A Namenode felelős az összes fájlrendszer-változás naplózásáról, ráadásul a teljes fájlrendszer-névtér és a Blockmap képét a memóriában tárolja.
  • Az ellenőrzési pontokat rendszeres időközönként végzik. ennélfogva könnyedén visszatérhet a színpadra, mielőtt itt elérhető az ütközési pont.

Datanode:

  • A Datanode adatokat tárol a fájlok között a helyi fájlrendszerben
  • Annak érdekében, hogy megfigyelje létezését, az adatcsomó továbbítja a pulzusszámot a namenódhoz
  • Minden tizedik pulzusról blokk jelentést kell készíteni
  • A replikációt az ezekben az adatcsomópontokban tárolt adatok jelentik

Adat replikáció:

  • A blokkok sorozata 128 MB alapértelmezett blokkméretű fájlt képez
  • A fájlban lévő összes blokk, a végső kivételével, hasonló méretű.
  • A fürt minden egyes adatcsomópontjától a namenode elem szívverést kap
  • A BlockReport tartalmazza a Datanode összes blokkját.
  • hatalmas könyvtárakat és fájlokat tartalmaz, amelyeket hierarchikus formátumban tárolnak.
  • Belül egy fájlt kisebb blokkokba másolnak, és ezeket a blokkokat Datanodes sorozatban tárolják.
  • A Namenode és a Datanode annak a szoftvernek a része, amelyet a GNU / Linux operációs rendszeren klasszikusan futó gépeken futtatni szántak.

Job tracker: A JobTracker vita a NameNode-val az adatok helyzetének megállapítása céljából. Ezenkívül keresse meg a legfinomabb TaskTracker csomópontokat az adatok helyétől függő feladatok elvégzéséhez

Feladatkövető: A TaskTracker egy olyan csomópont a fürtben, amely feladatokat fogad el - Térkép, Kicsinyítés és Keverés műveleteket - a JobTrackerből.

Másodlagos név csomópont (vagy) ellenőrzőpont csomópont: Rendszeres időközönként lekérdezi a szerkesztési naplót a név csomópontról, és érvényes az FS képére. És a kész FS képet másolja vissza a névcsomópontba az újraindítás során. A Másodlagos Név csomópont teljes célja, hogy ellenőrző pont legyen a HDFS-ben.

Fonal:

  • A YARN központi erőforrás-kezelő összetevővel rendelkezik, amely kezeli az erőforrásokat és az erőforrásokat hozzárendelheti minden egyes alkalmazáshoz.
  • Itt az erőforrás-kezelő a mester, amely dönt a fürthez társított erőforrásokról, az erőforrás-kezelő két összetevőből áll: az alkalmazáskezelőből és az ütemezőből. Ezek a két összetevő együttesen kezeli a fürtrendszerek feladatait. egy másik összetevő hívja a Node Manager (NM) alkalmazást, amely felelős a felhasználói jobok és munkafolyamatok kezeléséért egy adott csomóponton.
  • Az adatok pontos replikációját az aktív namenódban a Standby NameNode tartja. Szolgaként működik, elegendő állapotot fenntart, hogy biztosítson egy gyors feladatátvételt, ha ez nélkülözhetetlen.

Alapvető HDFS parancsok:

Alapvető HDFS parancsok

Sr.NoHDFS parancs tulajdonságHDFS parancs
1Nyomtatás hadoop verzió$ hadoop verzió
2Sorolja fel a gyökérkönyvtár tartalmát a HDFS-ben$ hadoop fs -ls
3Jelentse a jelenleg csatlakoztatott fájlrendszeren felhasznált és rendelkezésre álló hely mennyiségét$ hadoop fs -df hdfs: /
4A HDFS kiegyensúlyozó kiegyensúlyozza az adatokat a DataNodes között, mozogva a blokkokat a túlhasználatból az alulhasznált csomópontokba.$ hadoop kiegyensúlyozó
5Súgó parancs$ hadoop fs -help

Köztes HDFS parancsok:

Köztes HDFS parancsok

Sr.NoHDFS parancs tulajdonságHDFS parancs
6létrehoz egy könyvtárat a megadott HDFS helyen$ hadoop fs -mkdir / felhasználó / cloudera /
7Adatokat másol az egyik helyről a másikra$ hadoop fs -beviteli adatok / minta.txt / felhasználó / képzés / hadoop
8Lásd az adott könyvtár által elfoglalt helyet a HDFS-ben$ hadoop fs -du -s -h / felhasználó / cloudera /
9Távolítson el egy könyvtárat a Hadoopból$ hadoop fs -rm -r / felhasználó / cloudera / pigjobs /
10Eltávolítja az összes fájlt az adott könyvtárból$ hadoop fs -rm -skipTrash hadoop / kiskereskedelem / *
11A szemetet ürítse ki$ hadoop fs -expunge
12másolja az adatokat a HDFS-be és a helyi hálózatba$ hadoop fs -copyFromLocal / home / cloudera / minta / / user / cloudera / flume /

$ hadoop fs -copyToLocal / felhasználó / cloudera / pigjobs / * / home / cloudera / oozie /

Speciális HDFS parancsok:

Köztes HDFS parancsok

Sr.NoHDFS parancs tulajdonságHDFS parancs
13fájl engedélyek módosítása$ sudo -u hdfs hadoop fs -chmod 777 / felhasználó / cloudera / flume /
14állítsa be a fájl replikációs tényezőjét$ hadoop fs -setrep -w 5 / felhasználó / cloudera / pigjobs /
15Számolja meg a könyvtárak, fájlok és byte-ok számát a hdfs alatt$ hadoop fs -count hdfs: /
16hogy a namenode létezzen biztonságos módban$ sudo -u hdfs hdfs dfsadmin -safemode távozik
17Hadoop formáz egy namenódot$ hadoop namenode -format

HDFS tippek és trükkök:

1) Gyorsabb helyreállítást érhetünk el, ha a fürtcsomópontok száma magasabb.

2) A tárolási időnkénti növekedés növeli a helyreállítási időt.

3) A Namenode hardverének nagyon megbízhatónak kell lennie.

4) Az ambari segítségével kifinomult monitorozás érhető el.

5) A rendszer éhezése csökkenthető a reduktorszám növelésével.

Ajánlott cikkek

Ez egy útmutató a HDFS parancsokhoz. Itt megbeszéljük a HDFS parancsokat, szolgáltatásokat, azok alapvető, köztes és fejlett parancsát, képi ábrázolással, tippeket és trükköket a parancsokkal kapcsolatban. A további javasolt cikkeken keresztül további információkat is megtudhat -

  1. Csomópont parancsok
  2. Matlab parancsok
  3. A DBMS előnyei
  4. Hadoop ökoszisztéma
  5. Hadoop fs parancsok