Bevezetés a felügyelt tanulásba

A felügyelt tanulás a gépi tanulás olyan területe, ahol az értékek előrejelzésével dolgozunk felcímkézett adatkészletek felhasználásával. A címkézett bemeneti adatkészleteket független változónak nevezzük, míg a becsült eredményeket függő változónak nevezzük, mivel az eredmények független változójától függenek. Például mindannyiunknak van spam mappája az e-mail (pl. Gmail) fiókunkban, amely automatikusan észleli az Ön számára a spam / csalás e-maileket 95% -nál nagyobb pontossággal. A felügyelt tanulási modell alapján működik, ahol van egy felcímkézett adatkészlet, amely ebben az esetben a felhasználók által megjelölt spam e-mail cím. Ezeket a képzési készleteket a tanuláshoz használják, amelyeket később felhasználnak az új e-mailek spamként való besorolására, ha az megfelel a kategóriának.

A felügyelt gépi tanuláson dolgozik

Példa segítségével megértsük a felügyelt gépi tanulást. Tegyük fel, hogy van gyümölcskosár, amely különféle gyümölcsfajtákkal van tele. Feladatunk az, hogy a gyümölcsöket kategóriájuk alapján osztályozzuk.

Esetünkben négyféle gyümölcsöt vettünk figyelembe, ezek az alma, a banán, a szőlő és a narancs.

Most megpróbáljuk megemlíteni ezeknek a gyümölcsöknek a sajátos tulajdonságait, amelyek egyedivé teszik őket.

S Nem

Méret Szín Alak

Keresztnév

1

Kicsi Zöld Kerek vagy ovális, csomó alakú, hengeres

Szőlő

2

Nagy Piros Lekerekített alak, tetején mélyedés

alma

3

Nagy Sárga Hosszú íves henger

Banán

4 Nagy narancssárga Lekerekített alakú

narancssárga

Tegyük fel például, hogy egy gyümölcsöt felvette a gyümölcskosárból, megvizsgálta annak jellemzőit, például alakját, méretét és színét, majd azt a következtetést vonja le, hogy ennek a gyümölcsnek a színe piros, a méret, ha nagy, az alak lekerekített alakú, tetején depressziós, tehát alma.

  • Hasonlóképpen, ugyanazt teheti meg az összes többi fennmaradó gyümölcs esetében is.
  • A jobb szélső oszlopot („Gyümölcs neve”) válaszváltozónak nevezzük.
  • Így fogalmazzuk meg a felügyelt tanulási modellt, most mindenkinek, aki új (mondjuk egy robot vagy egy idegen), megadott tulajdonságokkal, meglehetősen könnyű az azonos típusú gyümölcsök könnyű csoportosítása.

A felügyelt gépi tanulási algoritmus típusai

Lássuk különféle típusú gépi tanulási algoritmusokat:

Regresszió:

A regresszió az egyértékű kimenet előrejelzésére szolgál az edzési adatkészlet felhasználásával. A kimeneti értéket mindig függõ változónak, míg a bemeneteket független változónak nevezzük. Különböző típusú regresszió van a felügyelt tanulásban, például:

  • Lineáris regresszió - Itt csak egy független változó van, amelyet a kimenet előrejelzésére használunk, azaz függő változó.
  • Többszörös regresszió - itt egynél több független változónk van, amelyeket a kimenet előrejelzésére használunk, azaz a függő változót.
  • Polinomiális regresszió - Itt a függő és független változók közötti grafikon egy polinom függvényt követi. Például először a memória növekszik az életkorral, akkor egy bizonyos korban eléri a küszöböt, majd az öregedéskor kezd csökkenni.

Osztályozás:

A felügyelt tanulási algoritmusok osztályozását használják a hasonló objektumok egyedi osztályokba csoportosítására.

  • Bináris osztályozás - Ha az algoritmus 2 különálló osztálycsoportot próbál csoportosítani, akkor azt bináris osztályozásnak nevezzük.
  • Többosztályú osztályozás - Ha az algoritmus több mint 2 csoportra próbál csoportosítani az objektumokat, akkor azt többosztályú besorolásnak nevezzük.
  • Erő - A besorolási algoritmusok általában nagyon jól teljesítenek.
  • Hátrányok - hajlamosak a túlépítésre, és esetleg korlátozottak is lehetnek. Példa - e-mail spam osztályozó
  • Logisztikus regresszió / osztályozás - Ha az Y változó bináris kategorikus (azaz 0 vagy 1), akkor a becsléshez logisztikus regressziót használunk. Példa - Annak előrejelzése, hogy egy adott hitelkártya-tranzakció csalás-e vagy sem.
  • Naiv Bayes-osztályozók - A Naiv Bayes-osztályozó a Bayes-tétel alapján épül fel. Ez az algoritmus általában akkor a legmegfelelőbb, ha a bemenetek mérete nagy. Aciklikus grafikonokból áll, amelyeknek egyik szülője és sok gyermek csomópontja van. A gyermekcsomópontok függetlenek egymástól.
  • Döntési fák - A döntési fa egy fa diagramszerű struktúra, amely egy belső csomópontból (tulajdonságteszt), ágból, amely a teszt eredményét jelöli, és a levélcsomókból, amely az osztályok eloszlását képviseli. A gyökér csomópont a legfelső csomópont. Ez egy nagyon széles körben alkalmazott módszer, amelyet a besoroláshoz használnak.
  • Támogató vektorgép - A támogató vektorgép az SVM, vagy egy SVM végzi a besorolást azáltal, hogy megtalálja a hiper síkot, amelynek maximalizálnia kell a két osztály közötti mozgástért. Ezek az SVM gépek csatlakoztatva vannak a kernel funkciókhoz. Az SVM-eket széles körben alkalmazzák a biometria, a mintafelismerés stb.

Előnyök

Az alábbiakban bemutatjuk a felügyelt gépi tanulási modellek néhány előnyeit:

  1. A modellek teljesítményét a felhasználói élmények optimalizálhatják.
  2. A felügyelt tanulás eredményeket hoz létre a korábbi tapasztalatok felhasználásával, és lehetővé teszi az adatok gyűjtését is.
  3. A felügyelt gépi tanulási algoritmusok számos valós probléma megvalósításához felhasználhatók.

hátrányok

A felügyelt tanulás hátrányai a következők:

  • A felügyelt gépi tanulási modellek kiképzése sok időt vehet igénybe, ha az adatkészlet nagyobb.
  • A nagy adatok osztályozása néha nagyobb kihívást jelent.
  • Lehet, hogy foglalkozni kell a túlfűtés problémáival.
  • Sok jó példára van szükségünk, ha azt szeretnénk, hogy a modell jól működjön, amíg az osztályozót képzzük.

Jó gyakorlatok a tanulási modellek felépítése során

Ez egy jó gyakorlat egy felügyelt tanulási gépmodellek felépítésekor: -

  1. Bármely jó gépi tanulási modell felépítése előtt meg kell hajtani az adatok előfeldolgozásának folyamatát.
  2. El kell dönteni az algoritmust, amely az adott problémához legjobban megfelel.
  3. El kell döntenünk, hogy milyen típusú adatokat fogunk használni az edzéskészlethez.
  4. Döntenie kell az algoritmus és a funkció felépítéséről.

Következtetés

Cikkünkben megtanultuk, mi a felügyelt tanulás, és láttuk, hogy itt a modellt jelölt adatok felhasználásával képzzük. Aztán megvizsgáltuk a modellek és azok különféle típusainak működését. Végül megláttuk ezen felügyelt gépi tanulási algoritmusok előnyeit és hátrányait.

Ajánlott cikkek

Ez egy útmutató arra, hogy mi a felügyelt tanulás ?. Itt tárgyaljuk a felügyelt tanulás fogalmait, működését, típusait, előnyeit és hátrányait. A további javasolt cikkeken keresztül további információkat is megtudhat -

  1. Mi az a mély tanulás?
  2. Felügyelt tanulás vs mély tanulás
  3. Mi a szinkronizálás a Java-ban?
  4. Mi az a webtárhely?
  5. Előnyökkel járó döntési fa létrehozásának módjai
  6. Polinomiális regresszió | Felhasználások és szolgáltatások

Kategória: