Bevezetés a gépi tanulási architektúrába

A gépi tanulás architektúrája mint tantárgy az utóbbi időszakokban a fantázia fogalmától a valóság igazolásáig terjedt.
A mintázatfelismerés alapvető megközelítéséből az alakult ki, hogy megteremtse az alapot a fő mesterséges intelligencia platform fejlesztésére. Az alapgondolat annak meghatározása volt, hogy a gépek képesek-e megtanulni a nekik szolgáltatott adatokból, és képesek-e megismételhető műveleteket elvégezni nagyobb megbízhatósággal és hatékony döntéshozatallal. Így a gépi tanulást úgy definiálhatjuk, mint a mesterséges intelligencia ágát, amely a gépeket hogyan kell tanulni. A gépi tanulás képessége lehetővé teszi a rendszer számára a döntéshozatal elvégzését a felhasználók kifejezett bemenete nélkül. Ezt a képességet az edzési adatoknak nevezett adatmintákon alapuló rendszerré alakítják ki. A gépi tanulás alkalmazása manapság minden technológiai fejlődésben látható, mivel a mobil rendszerek képesek az alkalmazásokban választásokat javasolni a felhasználó korábbi keresései alapján, az éttermi helyszínek eseményalapú menüjéhez, az életkor szerinti vonat-kikötőhely-elosztáshoz, stb. Nagyobb összefüggésben a gépi tanulás prediktív elemzés alkalmazásának tekinthető.

A gépi tanulást formálisan úgy lehet meghatározni, mint a rendszer által kibontandó ismeretek adatelemzési technológiáját anélkül, hogy kifejezetten meghatározták volna, hogy ugyanaz a megfigyelés sorozatán alapul-e.

Gépi tanulási architektúra típusai

A gépi tanulási architektúrát az oktatáshoz használt algoritmus alapján lehet kategorizálni.

1. Felügyelt tanulás

A felügyelt tanulás során a képzési adatok matematikai modellként szolgálnak, amely mind a bemenetet, mind a kívánt outputot tartalmazza. Minden megfelelő bemenethez hozzá van rendelve egy kimenet, amelyet felügyeleti jelként is ismertek. A rendelkezésre álló képzési mátrixon keresztül a rendszer képes meghatározni a bemenet és a kimenet közötti kapcsolatot, és ugyanezt alkalmazhatja a későbbi bemenetekben az edzés utáni időszakban a megfelelő kimenet meghatározásához. A felügyelt tanulás kibővíthető a kimeneti kritériumok alapján osztályozással és regressziós elemzéssel. A besorolási elemzés akkor kerül bemutatásra, ha a outputok természetére korlátozódnak, és csak egy meghatározott értékre korlátozódnak. A regressziós elemzés azonban meghatározza a kimeneti értékek numerikus tartományát. A felügyelt tanulásra példa az arcfelismerés, a hangszóró-ellenőrző rendszerek.

2. Nem felügyelt tanulás

A felügyelt tanulással ellentétben a felügyelet nélküli tanulás olyan képzési adatokat használ, amelyek nem tartalmaznak outputot. A nem felügyelt tanulás a relációs bemenetet a trendek, a hasonlóságok alapján azonosítja, és a kimenetet a felhasználói bemeneten való ilyen tendenciák jelenléte / hiánya alapján határozzák meg.

3. Erősítő edzés

Ezt arra használják, hogy a rendszert elrendeljék egy adott relevancia kontextus meghatározására, különféle algoritmusok segítségével, hogy meghatározzák a helyes megközelítést a jelenlegi helyzetben. Ezeket széles körben használják a játékportálok képzésében, hogy ennek megfelelően dolgozzanak a felhasználói adatokkal.

A gépi tanulási folyamat felépítése

Ábra: A gépi tanulási rendszerek döntésáram-architektúrájának tömbvázlata,

Most próbáljuk megérteni a fenti képen bemutatott rétegeket.

1. Adatgyűjtés

Mivel a gépi tanulás a rendszer számára rendelkezésre álló adatokon alapszik a döntés meghozatala érdekében, ezért az építészetben az első lépés az adatgyűjtés. Ez magában foglalja az adatgyűjtést, az eset forgatókönyveinek elkészítését és szétválasztását a döntéshozatali ciklushoz kapcsolódó bizonyos jellemzők alapján, és az adatok továbbítását a feldolgozó egységhez a további kategorizálás elvégzéséhez. Ezt a fázist néha adat előfeldolgozási szakasznak hívják. Az adatmodell megbízható, gyors és rugalmas adatokat vár, amelyek diszkrét vagy folyamatos jellegűek lehetnek. Az adatokat ezután továbbítják adatfolyam-feldolgozó rendszerekhez (folyamatos adatokhoz), és kötegelt adatraktárakban tárolják (diszkrét adatokhoz), mielőtt továbbadnák az adatok modellezési vagy feldolgozási szakaszaiba.

2. Adatfeldolgozás

Az adatgyűjtő rétegben kapott adatokat ezután továbbítják az adatfeldolgozó réteghez, ahol fejlett integrációnak és feldolgozásnak vetik alá őket, és magában foglalja az adatok normalizálását, az adatok tisztítását, átalakítását és a kódolást. Az adatfeldolgozás az alkalmazott tanulás típusától is függ. Például, ha felügyelt tanulást használnak, akkor az adatokat a rendszer kiképzéséhez szükséges mintaadatok több lépcsőjére kell szétválasztani, és az így létrehozott adatokat képzési mintaadatoknak vagy egyszerűen edzési adatoknak nevezik. Ezenkívül az adatfeldolgozás a szükséges feldolgozás típusától függ, és magában foglalhatja a folyamatos adatoktól kezdve a műveletektől kezdve a választást, amely magában foglalja egy speciális funkcióalapú architektúra használatát, például a lambda architektúrát; memóriakötött feldolgozást igényelnek. Az adatfeldolgozási réteg meghatározza, hogy a memória feldolgozását tranzit vagy pihenő adatokra kell-e végezni.

3. Adatmodellezés

Az architektúra e rétege különféle algoritmusok kiválasztását foglalja magában, amelyek adaptálhatják a rendszert annak a problémának a kezeléséhez, amelyre a tanulást fejlesztették ki. Ezeket az algoritmusokat fejlesztik, vagy öröklik egy könyvtárakból. Az algoritmusok az adatok ennek megfelelő modellezésére szolgálnak, ez készen áll a rendszer végrehajtására.

4. Végrehajtás

A gépi tanulásnak ebben a szakaszában a kísérlet elvégzése, a tesztelés és a hangolás elvégzése. Az általános cél az algoritmus optimalizálása annak érdekében, hogy a kívánt eredményt kivonják és a rendszer teljesítményét maximalizálják. A lépés eredménye egy kifinomult megoldás, amely képes biztosítani a gép számára a szükséges információkat a döntések meghozatalához.

5. Telepítés

Mint minden más szoftver kimenetet, az ML kimeneteket működésbe kell hozni, vagy tovább kell továbbítani a további feltáró feldolgozáshoz. Az output nem determinisztikus lekérdezésnek tekinthető, amelyet tovább kell telepíteni a döntéshozatali rendszerbe.

Javasoljuk, hogy az ML kimenetet zökkenőmentesen mozgassa közvetlenül a termelésbe, ahol ez lehetővé teszi a gép számára, hogy a kimenet alapján közvetlenül döntéseket hozzon, és csökkentse a további feltárási lépések függőségét.

Következtetések

A gépi tanulás architektúrája most az iparág legnagyobb érdeklődését képviseli, mivel minden folyamat a rendelkezésre álló erőforrások és outputok optimalizálására törekszik a rendelkezésre álló történeti adatok alapján, emellett a gépi tanulás az adat-előrejelzés és a prediktív analitika jelentős előnyeit is magában foglalja, amikor az adattudományi technológiával párosul. A gépi tanulási architektúra meghatározza a gépi tanulási ciklusban részt vevő különféle rétegeket, és magában foglalja a fő lépéseket a nyers adatok képzési adatkészletekké történő átalakításában, amelyek lehetővé teszik a rendszer döntéshozatalát.

Ajánlott cikkek

Ez egy útmutató a gépi tanulási architektúrához. Itt megvitattuk a gépi tanulás architektúrájának koncepcióját, folyamatát és típusait. A további javasolt cikkeken keresztül további információkat is megtudhat -

  1. Felügyelt tanulás vs mély tanulás
  2. Mi az API a Java-ban?
  3. Mi az a HBase Architecture?
  4. Mi az a puffer túlcsordulás?

Kategória: