Bevezetés a gépi tanulási módszerekbe

A következő, A gépi tanulás módszerei című cikk felvázolja a gépi tanulásban leggyakrabban használt módszereket. A gépi tanulás olyan technika, amely lehetővé teszi a számítógép számára, hogy önmagában „megtanuljon” dolgokat. Az algoritmusok adaptív módon javítják teljesítményüket, mivel növekszik a tanulásra rendelkezésre álló adatok száma. Ez több adat, annál pontosabb lenne a modellünk.

Hogyan tanulnak a gépek?

Különféle módszerek vannak erre. Az, hogy melyik módszert kell teljes mértékben betartani, a probléma megállapításától függ. Az adatkészlettől és a problémánktól függően kétféleképpen lehet mélyebbre jutni. Az egyik a felügyelt tanulás, a másik a felügyelet nélküli tanulás. Az alábbi táblázat ismerteti a gépi tanulási módszerek további osztályozását. Egyrészt megbeszéljük őket.

Vessen egy pillantást a következő táblázatra!

Megértjük, mit jelent a felügyelt tanulás.

Felügyelt tanulás

Ahogy a neve is sugallja, képzeljen el egy tanárt vagy egy felügyelõt, aki segít a tanulásban. Ugyanez vonatkozik a gépekre. A gépet kiképezzük vagy oktatjuk a címkézett adatok felhasználásával.

A legmenőbb felügyelt tanulási alkalmazások közül néhány:

  • Érzelmi elemzés (Twitter, Facebook, Netflix, YouTube stb.)
  • Természetes nyelvfeldolgozás
  • Kép osztályozás
  • Prediktív elemzés
  • Mintafelismerés
  • Spam észlelése
  • Beszéd / szekvencia feldolgozás

A felügyelt tanulást tovább osztják osztályozással és regresszióval. Megértjük ezt.

Osztályozás

A besorolás egy olyan modell megtalálásának folyamata, amely segít az adatok különféle kategorikus osztályokra bontására. Ebben a folyamatban az adatokat kategóriákba sorolják különböző bemeneti paraméterek alapján, majd a címkék megjósolódnak az adatokhoz. Kategória: a kimeneti változó egy kategória, azaz vörös vagy fekete, spam vagy nem spam, cukorbetegség vagy nem cukorbetegség stb.

Az osztályozási modellek magukban foglalják a támogató vektorgépet (SVM), a K-legközelebbi szomszédot (KNN), a Naive Bayes-t stb.

a) Támogató vektorgép-osztályozó (SVM)

Az SVM egy felügyelt tanulási módszer, amely az adatokat vizsgálja és két kategóriába sorolja. Hiper sík segítségével osztályozzam az adatokat. Egy lineáris megkülönböztető osztályozó megkísérel egy egyenes vonalt húzni, amely elválasztja a két adatkészletet, és így létrehozza a besorolási modellt. Egyszerűen megpróbálja megtalálni egy vonalat vagy görbét (két dimenzióban) vagy egy elosztót (több dimenzióban), amely elválasztja az osztályokat egymástól.

Megjegyzés: A többosztályú osztályozáshoz az SVM az „egy vs nyugalom” -t használja, azaz az egyes osztályokhoz különféle SVM-et kell kiszámítani.

b) K-legközelebbi szomszéd osztályozó (KNN)

  • Ha figyelmesen olvassa el, akkor a név maga is sugallja, mit csinál az algoritmus. A KNN úgy véli, hogy a közelebb lévő adatpontok jellemzői szempontjából sokkal hasonlítanak, és ezért valószínűleg ugyanabba az osztályba tartoznak, mint a szomszéd. Minden új adatpont esetében kiszámolják az összes többi adatpont távolságát, és az osztályt a K legközelebbi szomszédok alapján határozzák meg. Igen, sántának tűnhet, de a besorolás egy része szerint bármi működik.
  • Az adatpontot a szomszédok maximális száma alapján osztályozzák, majd az adatpontot a k-szomszédok közül legközelebb eső osztályhoz rendelik.
  • A KNN-ben nincs szükség a modell megtanulására, és az összes munka az előrejelzés kérésének időpontjában történik. Ezért hívják a KNN-t gyakran lusta tanulási algoritmusnak.

c) Naiv Bayes osztályozó

  • A Naiv Bayes egy gépi tanulási algoritmus, amelyet erősen ajánlunk a szöveges osztályozási problémák esetén. Bayes valószínűségi tételén alapszik. Ezeket az osztályozókat naivnak nevezzük, mert feltételezik, hogy a tulajdonságok változói függetlenek egymástól. Ez azt jelenti, hogy például van egy teljes mondatunk a bevitelhez, akkor a Naiv Bayes azt feltételezi, hogy a mondatban minden szó független a többitől. És osztályozzuk őket ennek megfelelően. Tudom, hogy elég naivnak tűnik, de remek választás a szöveges osztályozási problémákhoz, és népszerű a spam e-mail osztályozáshoz.
  • Különböző típusú Naiv Bayes algoritmusokat nyújt, mint például a BernoulliNB, GaussianNB, MultinomialNB.
  • Az összes tulajdonságot függetlennek tartja, tehát nem tudja megismerni a funkciók közötti kapcsolatot. Például, tegyük fel, hogy Varun szereti hamburgereket enni, ő is szereti sült krumplival együtt kokszolni. De nem szeret egy hamburgert és hasábburgonyával együtt kokszmal együtt fogyasztani. A Naiv Bayes itt nem tanulhatja meg a két elem közötti kapcsolatot, hanem csak az egyéni jellemzők fontosságát.

Most menjünk tovább a felügyelt tanulási módszerünk másik oldalára, amely regresszió.

Regresszió

A regresszió olyan modell megtalálásának folyamata, amely elősegíti az adatok megkülönböztetését folyamatos értékek felhasználásával. Ebben rendezik az előrejelzett adatok jellegét. A legszélesebb körben alkalmazott regressziós modellek közé tartozik a Lineáris regresszió, a Véletlenszerű Erdő (Döntési fák), Neurális hálózatok.

Lineáris regresszió

  • A felügyelt tanulás egyik legegyszerűbb megközelítése, amely hasznos a kvantitatív válasz előrejelzésében.
  • A lineáris regresszió magában foglalja a legmegfelelőbb egyenes megtalálását a pontokon. A legjobban illeszkedő vonalat regressziós vonalnak nevezzük. A legmegfelelőbb vonal nem pontosan halad át az összes adatponton, hanem megpróbálja a legjobb, ha közel állsz hozzájuk.
  • Ez a folyamatos adatok széles körben alkalmazott algoritmusa. Ugyanakkor csak a függõ változó átlagára összpontosít, és egy lineáris kapcsolatra korlátozódik.
  • A lineáris regresszió felhasználható idősorok, trend-előrejelzések készítéséhez. Az előző adatok alapján előrejelzi a jövőbeli eladásokat.

Nem felügyelt tanulás

  • A felügyelet nélküli tanulás azon a megközelítésen alapul, amelyet tanár távollétének, és ezért abszolút hibamérésnek tekinthetünk. Ez akkor hasznos, ha meg kell tanulni az elemek csoportosítását vagy csoportosítását. Az elemeket hasonlóságuk szerint csoportosíthatjuk (csoportosíthatjuk).
  • Felügyelet nélküli tanulás során az adatokat nem címkézik, nem kategorizálják, és a rendszer algoritmusai előzetes képzés nélkül hatnak az adatokra. A felügyelet nélküli tanulási algoritmusok összetettebb feladatokat tudnak végrehajtani, mint a felügyelt tanulási algoritmusok.
  • A felügyelet nélküli tanulás magában foglalja a klaszterezést, amelyet K eszközök klaszterezés, hierarchikus, Gauss-keverék, rejtett Markov-modell felhasználásával lehet elvégezni.

Nem felügyelt tanulási alkalmazások:

  1. A hasonlóság észlelése
  2. Automatikus címkézés
  3. Objektumok szegmentálása (például Személy, Állatok, Filmek)

Klaszterek

  • A klaszterezés egy nem felügyelt tanulási technika, amelyet számos elem adatelemzésére használnak. A klaszterezési algoritmus akkor hasznos, amikor részletesebb betekintést akarunk szerezni az adatainkkal.
  • A klaszterezés valós példája a Netflix műfaji klasztere, amely különféle célcsoportok számára van felosztva, beleértve érdeklődési köröket, demográfiai adatokat, életmódot stb. ügyfelek.

a) K jelentése klaszter

  • K azt jelenti, hogy a klaszterezési algoritmus megpróbálja megosztani az adott ismeretlen adatokat klaszterekre. Véletlenszerűen választja ki a „k” klaszterek középpontját, kiszámítja az adatpontok és a klaszterek középpontját közötti távolságot, majd végül hozzárendeli az adatpontot a klaszter középpontjához, amelynek távolsága az összes klaszter középpontjának minimális.
  • K-középértékben a csoportokat minden csoporthoz a legközelebbi centrid határozza meg. Ez a centrid az algoritmus „agyaként” működik, megszerzik a hozzájuk legközelebbi adatpontokat, majd hozzáadják őket a klaszterekhez.

b) Hierarchikus csoportosítás

A hierarchikus klaszterezés szinte hasonló a normál fürtözéshez, hacsak nem szeretne fürthierarchiát felépíteni. Ez hasznos lehet, ha el akarjuk dönteni a klaszterek számát. Tegyük fel például, hogy különféle árucikkeket hoz létre az online élelmiszerboltban. A kezdőlapon néhány széles elemet szeretne, és ha egyszer rákattint az egyik elemre, meghatározott kategóriákra, azaz konkrétabb klaszterekra, megnyílik.

A dimenzió csökkentése

A dimenzió csökkentése a fájl tömörítésének tekinthető. Ez azt jelenti, hogy eltávolítják a nem releváns információkat. Csökkenti az adatok bonyolultságát, és megpróbálja megőrizni az értelmes adatokat. Például a képek tömörítésével csökkentjük annak a térnek a dimenzióját, amelyben a kép olyan marad, anélkül, hogy a kép értelmes tartalmát túl sokra rombolnánk.

PCA az adatok megjelenítéséhez

A főkomponens-elemzés (PCA) egy dimenziócsökkentési módszer, amely hasznos lehet az adatok megjelenítéséhez. A PCA-t arra használják, hogy a magasabb dimenziós adatokat az alacsonyabb dimenziós adatokra tömörítsék, vagyis használhatjuk a PCA-t a négydimenziós adatok három vagy két dimenzióra redukálására, hogy megvizsgáljuk és jobban megértsük az adatokat.

Ajánlott cikkek

Ez egy útmutató a gépi tanulási módszerekhez. Itt tárgyalunk egy bevezetést: Hogyan tanulnak a gépek? a gépi tanulás osztályozása és folyamatábra, részletes magyarázattal együtt. A további javasolt cikkeken keresztül további információkat is megtudhat -

  1. Gépi tanulási architektúra
  2. Gépi tanulási keretek
  3. Gépi tanulási eszközök
  4. Gépi tanulási technikák
  5. Hiperparaméter gépi tanulás
  6. Hierarchikus klaszterezési algoritmus
  7. Hierarchikus csoportosítás | Agglomerációs és megosztó csoportosulás

Kategória: