Az Apache telepítése

Mielőtt belépnénk az Apache rész telepítésének módjáról, először átfogó áttekintést kapnánk az Apache-ról és annak felhasználásáról az adattudományban.

Mi az Apache?

Az Apache Web Server egy HTTP szerver, amely webhelyeket mutat be a kiszolgálóra érkező látogatók számára. Tehát ha webhelyet szeretne telepíteni egy vállalkozás vagy szervezet számára, akkor valószínűleg az Apache-ot használja ehhez.

Vannak más HTTP-kiszolgálók is, például az IIS, de az Apache a legtöbb ember által használt szabvány, függetlenül attól, hogy Linuxon, Windowson vagy Mac-en vannak-e. Az Apache az az alapértelmezés, amelybe a legtöbb ember megy, mert közismert, nagyon megbízható és ingyenes.

Az Apache esetében azonban észre kell venni, hogy mivel ez egy HTTP szerver, tehát ha ezt Linuxra, Windowsra vagy Macre telepíti, akkor csak annyit tesz lehetővé, hogy statikus webhelyeket jelenítsen meg a kiszolgálóra érkező látogatók számára. Ezért, ha egy HTML webhelyet kódol, amelyen kívül a JavaScripten kívül további programozási nyelvek vannak, akkor ezt csak Apache szerverrel használhatja. Az összes címkét csatlakoztathatja az Apache szerverhez, és bemutathatja a látogatóknak.

Hogyan használta az Apache az adattudományban?

Az adattudomány a legkeresettebb tanulmányi terület a modern világban. Az Data Scientist a 21. század legszexisebb munkájaként kezelik, a különféle tudományágak szakemberei meg akarnak tanulni és adattudósnak akarnak válni. Az Apache döntő szerepet játszik minden adattudományi rajongóban, mivel kellő ismeretekre van szükségük az Apache Hadoop ökoszisztémáról.

Apache Hadoop ökoszisztéma

A legelső dolog az, hogy a Hadoop ökoszisztéma nem egy eszköz. Ez nem programozási nyelv vagy egyetlen keret. Ez egy olyan eszközcsoport, amelyet a különböző vállalatok különböző területeken használnak együtt több feladat elvégzésére. Az alábbiakban egyenként vizsgáljuk meg az egyes eszközöket: -

  • Az Apache HDFS (Hadoop Distributed File System) a Hadoop tárolóegysége, amely strukturált, félig strukturált és nem strukturált adatokat képes tárolni. A HDFS metaadatokkal rendelkezik, amelyek fenntartják a tárolt adatok naplófájlját. Két elemből áll - NameNode és DataNode.
  • Az Apache Yarn az erőforrás-egyeztető, amely minden feldolgozási tevékenységet végrehajt, például a feladatok ütemezését, az erőforrások elosztását stb. Két szolgáltatással rendelkezik: Az első az erőforrás-kezelő, aki ütemezi a fonalon futó alkalmazásokat. A második a Node Manager, aki figyeli az erőforrások felhasználását .
  • Az Apache Map Reduce a Hadoop adatfeldolgozó összetevője, amely nagy adatkészleteket dolgoz fel elosztott és párhuzamos számítások segítségével a Map, Sort és Shuffle, valamint Reduce függvények alapján. A Térkép funkció kiszűri az adatokat, majd szétválogatást és megoszlást hajt végre, és a végén a Funkció csökkentése összesíti és összegzi az eredményt.
  • Az Apache Pig főleg az ETL-ben használt. Két részből áll - Pig Latin és a Pig runtime. A Pig Latin a lekérdezés felhasználásával történő adatfeldolgozáshoz használt nyelv, míg a Pig runtime a végrehajtási környezet. A Pig Latin egyik sorja szinte egyenlő a 100 sor Map Reduce kóddal. A folyamat során először be kell tölteni az adatokat, majd csoportosítani, rendezni, szűrni és HDFS-ben tárolni.
  • Az Apache Hive SQL-szerű lekérdezést használ az adatok elemzésére elosztott környezetben. Két részből áll - a Hive parancssorból és a JDBC / ODBC szerverből, és a használt nyelvet HiveQL-nek hívják.
  • Az Apache Mahout a Java nyelven írt Machine Learning könyvtár, amely gépi tanulási alkalmazások, például fürtözés, osztályozás vagy regresszió készítésére szolgál. Különböző algoritmusokkal rendelkezik, amelyek különböző felhasználási esetekre vannak beépítve.
  • Az Apache HBase egy Java nyelven írt NoSQL adatbázis, amely a Hadoop felett fut. A Google BigTable alapján épül fel, és képes minden típusú adat kezelésére.
  • Az Apache Sqoop az Adatok befogadására szolgáló eszköz, amelyet tömegesen strukturált adatátvitelre használnak az RDBMS és a Hadoop között.
  • Az Apache Flume egy másik adatgyűjtő eszköz, amelyet félig strukturált és strukturálatlan adatátvitelre használnak a Hadoop és más adatforrások között.
  • A ZooKeeper a koordinátor, amely biztosítja a Hadoop ökoszisztéma különféle eszközeinek összehangolását.
  • Az Apache Ambari egy klasztermenedzser, aki gondoskodik a Hadoop klaszterek kezeléséről, kezeléséről, valamint állapotuk és állapotuk ellenőrzéséről.
  • Az Apache Tez egy új eszköz a Hadoop ökoszisztémájában, amely felgyorsítja a Hadoop lekérdezés feldolgozását.
  • Az Apache Presto egy nyílt forráskódú elosztott SQL lekérdező motor, amely lehetővé teszi a platformok közötti lekérdezés képességét.
  • Az Apache HCatalog egy metaadat és táblakezelő rendszer a Hadoop számára, amely lehetővé teszi az adatfeldolgozó eszközök közötti interoperabilitást. Segít a felhasználóknak a környezetükhöz legmegfelelőbb eszközök kiválasztásában is.
  • Az Apache Spark a legelterjedtebb és legnépszerűbb keret az adattudós körében. Ez egy nagy sebességű fürtszámítási rendszer, amely sok iteratív feladat esetén optimalizálja az erőforrások felhasználását. Rugalmasságot biztosít mind a kötegelt feldolgozás, mind a valós idejű adatok elemzése szempontjából.

Az alábbiakban bemutatjuk az Apache telepítésének lépéseit

Eddig megismertük az Apache-t és azt, hogy mennyire hasznos mindazok számára, akik adattudományt vagy Big Data Analytics-t akarnak megtanulni. Most lemerülünk és telepítjük az apache-t a Windows-ra az alábbi lépések alapján.

  • Lépjen a https://httpd.apache.org/ webhelyre, és kattintson a Letöltés linkre az Apache httpd 2.4.38 Megjelent szakasz alatt.

  • A következő oldalra jut, majd kattintson a Microsoft Windows fájlok elemére.

  • Kattintson az Apache Lounge elemre.

  • A Windows operációs rendszer alapján 32 vagy 64 bites fájlt tölthet le. Itt töltjük le a 64 bites verziót. Kattintson a letöltéshez a megfelelő .zip linkre.

  • Most C ++ Újraterjeszthető Visual Studio 2017 szükséges. Tehát letöltjük a megfelelő 32 bites vagy 64 bites hivatkozásról.

  • Miután mindkét fájl letöltésre került, átkerülünk a letöltött helyre, és először telepítjük a C ++ Újraterjeszthető Visual Studio 2017 szoftvert. Kattintson duplán az .exe fájlra.

  • Jelölje be az „Egyetértek” elemet, majd kattintson a Telepítés elemre.

  • Az Apache telepítése folyamatban van.

  • Ha elkészült, kapsz egy ilyen üzenetet. A telepítés befejezéséhez kattintson a Bezárás gombra.

  • Most ugorjon arra a mappára, ahonnan letöltötte az Apache zip fájlt. Kattintson a jobb gombbal és válassza ki a kivonatot itt.

  • Most létrehozunk egy Apache24 mappát. Másolja ezt a mappát a C meghajtóra, majd hozzáad egy utat a rendszer környezeti változókhoz.

Lépjen a Rendszer tulajdonságai -> Speciális fülre -> Kattintson az alábbi Környezetváltozók gombra.

  • A Változók részben keresse meg az elérési utat, majd kattintson a Szerkesztés gombra.

  • Kattintson a Tallózás -> Ugrás a C meghajtó Apache24 mappájára -> A tálca kiválasztása -> Kattintson az OK gombra.

  • Telepítjük az Apache-t Windows szolgáltatásként. Futtassa a parancssort rendszergazdaként. Írja be a httpd –k install parancsot és nyomja meg az enter billentyűt.

  • Ellenőrizzük a telepített Apache szolgáltatást. Kattintson a Windows ikonra, és írja be a szolgáltatásokat. Kattintson a Szolgáltatások alkalmazásra, és keresse meg az Apache24 nevű szolgáltatást.

  • Az Apache szerver elindításához kattintson a jobb egérgombbal rá, és kattintson a Start gombra. Az állapot 'Futás' -ra változik.

  • Tesztelhetünk egy böngészővel. Nyisson meg egy böngészőt, keresse meg a http: // localhost oldalt, és nyomja meg az enter billentyűt. Egy üzenet, amely kimondja: 'Működik!' megjelenik az Apache sikeres telepítésének megerősítésére.

Ajánlott cikkek

Ez egy útmutató az Apache telepítéséhez. Itt megvitattuk az utasításokat és az Apache telepítésének különféle lépéseit. A következő cikkben további információkat is megnézhet -

  1. Apache interjúkérdések
  2. Apache Spark vs Apache Flink
  3. Apache Hadoop vs Apache Spark
  4. Apache Kafka vs Flume
  5. Kafka vs Kinesis Legfontosabb különbségek

Kategória: