Hogyan telepítsük az NLTK-t?

A következő cikk az NLTK telepítése ismerteti az NLTK telepítésének vázlatát. Az NLTK könyvtárak halmaza a természetes nyelv feldolgozásához. Ez egy olyan platform, amellyel Python-programokat építhetünk a természetes nyelv feldolgozására. Az NLTK Python programozási nyelven van írva. Steven Bird és Edward Loper fejlesztették ki. Támogatja a kutatást és az oktatást az NLP-ben vagy a szorosan kapcsolódó területeken, ideértve a kognitív tudományt, az empirikus nyelvtudást, az információkeresést, a mesterséges intelligenciát és a gépi tanulást. Az NLTK könnyen kezelhető felületet biztosít.

NLTK (természetes nyelvű eszközkészlet)

  • A természetes nyelvfeldolgozás (NLP) a mesterséges intelligencia része, amely feldolgozza az emberek által beszélt nyelvet. Ezáltal segíti az embereket a számítógépekkel való interakcióban, még akkor sem, ha nincsenek tudásuk a használatáról. Az NLP használatával az embereknek csak azt kell diktálniuk a parancsot a számítógépek számára. A gépi tanulás erejével a természetes nyelvfeldolgozás népszerűvé és könnyebben megvalósíthatóvá válik. Alapvetően ez a módszer az emberekkel való interakcióra és a hangutasítások végrehajtására.
  • Ez lehetővé teszi az eszközök használatát még azoknak a kezdőknek is, akiknek nincs ismerete a technológiáról. A természetes nyelvfeldolgozás végrehajtása azonban nem könnyű, mivel az emberek által beszélt nyelvnek nincs határozott felépítése. Nem egyértelmű, és attól függ, hogy milyen kontextusszavaknak lehet más jelentése.
  • Az NLTK-nek több mint 50 corpora és lexikai forrása van, mint például a WordNet, a Problem Report Corpus, a Penn Treebank Corpus stb. Tartalmaz egy útmutató, amely elmagyarázza a nyelvfeldolgozás fogalmait az eszközkészlettel és a Python programozási alapjaival, ami megkönnyíti az emberek számára akiknek nincs mély ismerete a programozásban. Széles csomagválasztékkal rendelkezik, ami az NLP egyik nagy eszközkészletévé teszi. Tokenizálás, lemmatizálás, törmelés, elemzés, karakterek száma, központozás, szavak száma néhány ezek közül a csomagok közül.

Telepítse az NLTK for Windows rendszert

Az alábbiakban bemutatjuk az NLTK telepítését a Windows rendszerben. Ezek azon a feltételezésen alapulnak, hogy a Python nincs telepítve a rendszerbe. Az NLTK Python 2.7, 3.5 és újabb verziókat igényel.

1. lépés: Töltse le a legfrissebb Python for Windows verziót az alábbiakból

https://www.python.org/downloads/

2. lépés: Kattintson a letöltött .exe fájlra annak futtatásához.

3. lépés: Válassza a telepítés testreszabását.

4. lépés: Ellenőrizze az összes szolgáltatást, különösen a „pip” funkciót, mivel ez segíti az NLTK telepítését, majd kattintson a Tovább gombra.

5. lépés: A következő képernyőn válassza a speciális beállításokat, válassza ki az elérési utat és kattintson a telepítésre.

6. lépés: Miután a telepítés sikeres volt az ablak közelében.

7. lépés: Másolja a Scripts mappa elérési útját az NLTK telepítéséhez ugyanabba a mappába.

Az NLTK könnyen telepíthető egy „pip” telepítő segítségével. Ezenkívül telepítenünk kell a „zümmögőt” is.

8. lépés: Az NLTK telepítéséhez nyissa meg a parancssort, és írja be az alábbi parancsot.

Ellenőrizze, hogy a telepítés sikeres-e.

A sikeres telepítés után itt az ideje, hogy az NLTK-t használja a természetes nyelv feldolgozásához.

9. lépés: Nyissa meg a Python Shell-t, és írja be az alábbi parancsot.

Ha hiba nélkül importálja, az azt jelenti, hogy az NLTK megfelelően van telepítve.

Telepítse az NLTK for Mac / Linux rendszert

A Windows-szal ellentétben a Linux rendszereknél a Python van telepítve. Az NLTK telepítéséhez Linux / Mac rendszeren a Python Pip csomag telepítőjét használja. A pip telepítéséhez vagy annak frissítéséhez írja be az alábbi parancsokat a parancssorba.

A python telepítéséhez Linux alatt használja az alábbi parancsokat.

1. lépés: A csomag index frissítéséhez használja az alábbi parancsot.

2. lépés: A Python telepítéséhez Linux rendszerben használja az alábbiakat.

3. lépés: Írja be az alábbi parancsot a „pip” telepítéséhez a Python 3-hoz.

4. lépés: A „Pip” sikeres telepítése után használja a következő parancsokat az NLTK telepítéséhez.

NLTK adatkészlet

Az NLTK-ben számos adatkészlet elérhető a természetes nyelv feldolgozásához, például WordNet, WikiCorpus, Gutenberg, Opinion Lexicon, Tweebank stb. Ezeknek az adatkészleteknek a neve corpora. Alapvetően az NLTK adatkészlet fájlok vagy dokumentumok halmazát tartalmazza. Minden fájl / dokumentum szót, betűt vagy szöveget tartalmaz egyetlen nyelven. Így a korpusz elsősorban egy nyelv megértésének / megtanulásának könyvtára. Szabályai vannak a nyelvtant és a nyelv felépítését illetően.

Az NLTK sikeres telepítése után importálhatja és letöltheti annak corpora-ját is a következő paranccsal.

Az NLTK letöltő ablak megnyitja az adatkészletek letöltését. Az adatkészlet mérete nagy, ezért időbe telik. Az adatkészletek megfelelő telepítésének ellenőrzéséhez próbálja meg importálni az adatkészletet, és használja azt.

Az NLTK feldolgozása

A természetes nyelv feldolgozásának 5 fő folyamata van. Ezek a lépések bármely szöveg feldolgozásához kapcsolódnak.

  1. EOS-észlelés : A beszéddetektálás vége a szöveget értelmes mondatok gyűjteményévé bontja. A hosszú szöveget olyan részekre osztja, amelyeknek van valamilyen értelme.
  2. Tokenizálás : Ez a lépés a mondatokat tokenekre osztja. A tokenek nemcsak szavakat tartalmaznak, hanem szóközöket és mondattöréseket is tartalmaznak.
  3. POS-címkézés : A POS beszéd pat-t jelent. Itt az információ hozzá van rendelve a tokenhez. Ez az információ azt sugallja, hogy milyen típusú beszéd feszült, ige, melléknév, főnév stb.
  4. Chunking : A chunking azt jelenti, hogy címkék alapján szöveget gyűjtenek.
  5. Kibontás: A kivonás folyamatos folyamat, amelyen keresztül darabonként részt vesznek, és megnevezett entitásokként címkézik őket, például emberek, helyek, szervezetek stb.

Következtetés:

Az NLTK-t szöveges osztályozáshoz, képaláírásokhoz, beszédfelismeréshez, kérdések megválaszolásához, nyelv modellezéséhez, dokumentum-összefoglaláshoz és sok egyéb művelethez használják. Számos egyéb eszköz létezik a természetes nyelvfeldolgozáshoz. De az NLTK könyvtárak széles skálájával rendelkezik, és ez az egyik hatékony természetes nyelvfeldolgozó eszköz. Pontosabb, mint bármely más eszköz, de sok könyvtár miatt kissé lassú. Tehát minden a felhasználó igényeitől függ. Ha a felhasználó gyorsaságot akar, akkor más eszközöket is előnyben részesíthet, de akkor kompromisszumot kell vállalnia a tartalom pontosságával. De ha a pontosság prioritás, akkor mindenképpen az NLTK-re kell fordulniuk.

Ajánlott cikkek:

Ez egy útmutató az NLTK telepítéséhez. Itt tárgyaljuk az NLTK Windows és Linux \ Mac rendszerre történő telepítésének alapvető koncepcióját és lépéseit. A következő cikkeket is megnézheti további információkért -

  1. Telepítse a Kubernetes irányítópultot
  2. A JDK telepítése
  3. Telepítse a Docker programot
  4. Hogyan telepíthetem a Magento-t?
  5. Magento verziók | A Magento verziók jellemzői

Kategória: