Ismétlődő neurális hálózatok (RNN) Az RNN működése és lépései

Ismétlődő neurális hálózatok (RNN) bemutatása

A visszatérő ideghálózat az egyik mesterséges neurális hálózat (ANN), és a természetes nyelvfeldolgozás (NLP) és a beszédfelismerés alkalmazási területein használják. Az RNN modell célja az adatok szekvenciális jellemzőinek felismerése, majd a minták felhasználása a következő forgatókönyv előrejelzésére.

Ismétlődő neurális hálózatok működése

Ha a hagyományos idegi hálózatokról beszélünk, akkor az összes kimenet és bemenet független egymástól, amint az az alábbi ábrán látható:

Viszont ismétlődő ideghálózatok esetén az előző lépésekből származó kimenetet az aktuális állapot bemenetéhez kell betáplálni. Például bármely szó következő betűjének megjósításához vagy a mondat következő szót megjósolni kell, hogy emlékezzen az előző betűkre vagy a szavakra, és azokat valamilyen memória formájában tárolja.

A rejtett réteg emlékezik bizonyos információkkal a szekvenciáról. Egy egyszerű valós példa, amellyel összekapcsolhatjuk az RNN-t, amikor filmet nézünk, és sok esetben képesek vagyunk megjósolni, hogy mi fog történni, de mi lenne, ha valaki éppen csatlakozott a filmhez, és felkérik, hogy ez lesz a következő? Mi lesz a válasz? Semmi értelme nincs róla, mert nincsenek tisztában a film korábbi eseményeivel, és nincsenek emlékeik erre.

Az alábbiakban bemutatjuk a tipikus RNN modellt:

Az RNN modelleknek van egy olyan memóriájuk, amely mindig emlékszik arra, amit az előző lépésekben elvégeztek és amit kiszámítottak. Az összes bemeneten ugyanazt a feladatot hajtják végre, és az RNN ugyanazt a paramétert használja minden bemenethez. Mivel a hagyományos ideghálózatnak független bemeneti és kimeneti halmazai vannak, összetettebbek, mint az RNN.

Most próbáljuk megérteni a visszatérő neurális hálózatot egy példa segítségével.

Tegyük fel, hogy van egy neurális hálózatunk 1 bemeneti réteggel, 3 rejtett réteggel és 1 kimeneti réteggel.

Ha más vagy a hagyományos ideghálózatról beszélünk, akkor a rejtett rétegeikben saját elmozdulásokkal és súlyokkal rendelkeznek, például (w1, b1) az 1. rejtett réteghez, (w2, b2) a 2. rejtett réteghez és (w3, b3). ) a harmadik rejtett réteghez, ahol: w1, w2 és w3 a súlyok, és b1, b2 és b3 az elfogultság.

Ezt figyelembe véve azt mondhatjuk, hogy az egyes rétegek nem függenek egymástól, és nem tudnak semmit sem emlékezni az előző bemenetre:

RNN a következőket fogja tenni:

A független rétegeket átalakítják a függő rétegekké. Ez úgy történik, hogy az összes rétegre ugyanazokat a torzításokat és súlyokat adjuk meg. Ez csökkenti a visszatérő ideghálózat paramétereinek és rétegeinek számát, és segít az RNN-nek az előző kimenet memorizálásában azáltal, hogy a korábbi kimenetet a közelgő rejtett réteg bemeneteként adja ki.
Összegezve: az összes rejtett réteg összekapcsolható egyetlen ismétlődő rétegbe, úgy, hogy a súlyok és az eltérések az összes rejtett rétegnél azonosak legyenek.
Tehát a visszatérő ideghálózat az alábbiak szerint néz ki:

Itt az ideje, hogy foglalkozzunk az RNN modell néhány egyenletével.

Az aktuális állapot kiszámításához,

h _t= f (h _t-1, x _t ),

Hol:

x _t a bemeneti állapot
h _t-1 az előző állapot,
h _t az aktuális állapot.

Az aktiválási függvény kiszámításához

h _t= tanh (W _hh h _t-1 +W _xh x _t ),

Hol:
W _xh a bemenő neuron tömege,

_Whh a visszatérő ideg súlya.

A teljesítmény kiszámításához:

Y _t =W _hy h _t.

Hol,
Y _t a output és
W _hy a kimeneti réteg tömege.

Ismétlődő neurális hálózat képzésének lépései

A bemeneti rétegekben a kezdeti bemenet akkor kerül elküldésre, ha mindegyik azonos súlyú és aktiváló funkcióval rendelkezik.
Az aktuális bemenet és az előző állapot kimenet alapján kiszámítja az aktuális állapotot.
A h _t jelenlegi állapota második alkalommal h _t-1 lesz.
Ez folytatja az összes lépés megismétlését, és minden egyes probléma megoldása érdekében annyiszor folytathatja az összes előző lépés információinak összekapcsolását.
Az utolsó lépést ezután kiszámítja a végállapot aktuális állapota és az összes többi korábbi lépés.
Most hibát generálunk, ha kiszámoljuk a tényleges és az RNN modellünk által generált kimenet közötti különbséget.
Az utolsó lépés az, amikor megtörténik a visszapótlás folyamata, ahol a hibát visszaszorítják a súlyok frissítése céljából.

A visszatérő ideghálózatok előnyei

Az RNN bármilyen hosszú bemenetet képes feldolgozni.
Az RNN modell úgy van kialakítva, hogy emlékezzen minden információra az idő során, ami minden idősor-előrejelzőnél nagyon hasznos.
Még ha a bemeneti méret nagyobb is, a modell mérete nem növekszik.
A súlyokat meg lehet osztani az időpontokban.
Az RNN belső memóriáját felhasználhatja a bemenetek tetszőleges sorozatának feldolgozására, ami nem igaz a visszatérő neurális hálózatokra.

A visszatérő neurális hálózatok hátrányai

Ismétlődő jellege miatt a számítás lassú.
Az RNN modellek képzése nehéz lehet.
Ha relu vagy tanh-t használunk aktiválási funkcióként, akkor nagyon nehéz lesz feldolgozni a nagyon hosszú szekvenciákat.
Hajlamosak olyan problémákra, mint a robbanás és a gradiens eltűnése.

Következtetés

Ebben a cikkben megismertük a Mesterséges Neurális Hálózat egy másik típusát, az úgynevezett Ismétlődő Neurális Hálózatot, és arra a fő különbségre összpontosítottunk, amely az RNN-t különbözteti meg az egyéb ideghálózatoktól, azokon a területeken, ahol széles körben alkalmazható, például a beszédfelismerésben. és NLP (természetes nyelvfeldolgozás). Továbbá elmentünk az RNN modellek és funkciók mögött, amelyeket egy robusztus RNN modell felépítéséhez használunk.

Ajánlott cikkek

Ez egy útmutató a visszatérő neurális hálózatokhoz. Itt tárgyaljuk az RNN bevezetését, működését, lépéseit, előnyeit és hátrányait, stb. További információkért áttekintheti a többi javasolt cikket is -

Mi az idegháló?
Gépi tanulási keretek
Bevezetés a mesterséges intelligenciába
Bevezetés a Big Data Analytics szolgáltatásba
Neurális hálózatok megvalósítása

Ismétlődő neurális hálózatok (RNN) Az RNN működése és lépései

Tartalomjegyzék:

Ismétlődő neurális hálózatok (RNN) bemutatása

Ismétlődő neurális hálózatok működése

Ismétlődő neurális hálózat képzésének lépései

A visszatérő ideghálózatok előnyei

A visszatérő neurális hálózatok hátrányai

Következtetés

Ajánlott cikkek

Photoshop kefék - az ecsetdinamika beállításai

Photoshop alakzatok és alakú rétegek alapvető elemei

Intelligens szűrők alkalmazása a szerkeszthető típushoz a Photoshopban

Készítse el saját Photoshop egyedi alakját

Photoshop kefék - szórási lehetőségek

Példák az elsüllyedt költségekre A 3. legfontosabb példa az elsüllyedt költségekre, részletes magyarázattal

Szuper kulcsszó a Java-ban Hogyan működik a szuper kulcsszó a Java-ban például?

SUMIF Excelben (képlet, példák) Hogyan kell használni a SUMIF programot az Excel programban?

SUMIF képlet Excelben - Hogyan kell használni a SUMIF képletet?

Felügyelt tanulás vs mély tanulás 5 egyszerű módszer a tanuláshoz

Míg a hurok a JavaScript-ben - Hogyan működik, míg a Loop működik a Javascriptben?

Fehér kalap SEO A White Hat SEO technikái és problémái

Fehér doboz tesztelése Különböző eszközök és technikák a White Box teszteléshez

Fehér doboz tesztelés vs fekete doboz tesztelés Szoftvertesztelési technikák

Míg a hurok az R - A hurokhoz, az Infinte hurok - Hurok ellenőrzési nyilatkozat