Bevezetés a felügyelet nélküli gépi tanulásba

Gondolkozott már azon, hogy a gyermek hogyan képes megkülönböztetni az almát és a narancsot, ha nem tudja, mi azok valójában, hogyan ízlik, ízük és színük alapján azonban 2 csoportra oszthatja őket, előzetes információk nélkül? Várhatunk-e ugyanazt a szegmentálást, mint egy gyermek, a gépektől, ha megadjuk a színre és a méretre vonatkozó információkat? Lássuk, hogyan tehetjük ezt! Ebben a témában megismerjük a felügyelet nélküli gépi tanulást.

A „gépi tanulás” kifejezés azt sugallja, hogy gépeket oktatunk emberi jellegű feladatok elvégzésére és arra, hogy az emberek hogyan tanulnak valakitől vagy megfigyelés alapján. Ugyanaz, mint az emberek, a gép megtanulja.

A gépi tanulás 3 részre osztható: -

  1. Felügyelt tanulás
  2. Nem felügyelt tanulás
  3. Erősítő tanulás

Gépi tanulás típusai

A megerősítő tanulás ügynök alapú tanulás, amely jutalmazást és büntetést foglal magában az ügynök cselekedetei alapján. A végső cél az, hogy maximalizáljuk az általános jutalmat a környezettől való tanulás folyamatában.

Ha bemeneti-kimeneti adatok vannak, röviden, címkézett adatokkal, például az adott testmagasság és súly alapján annak meghatározása érdekében, hogy egy férfi férfi vagy nő - felügyelet alatt álló tanulási feladatnak tekinthető (emberek esetében valakitől).

De sok valós életben ezek a címkézett vagy kommentált adatok nem mindig állnak rendelkezésre. Sokszor olyan problémákkal nézünk szembe az objektumok szétválasztása alapján, amelyek tulajdonságaik alapján nem szerepelnek kifejezetten. Hogyan lehet megoldani ezt a problémát? Nos, a felügyelet nélküli tanulás a megoldás.

A Wikipedia szerint a nem felügyelt tanulás egy önszervezett hebbiai tanulás, amely előzetesen ismeretlen címkék nélkül segít megtalálni az adatkészletben korábban ismeretlen mintákat. Felügyelet nélküli tanulás során nincs címkével kapcsolatos információnk, de mégis betekintést akarunk szerezni az adatokból, azok különböző tulajdonságai alapján.

A nem felügyelt gépi tanulás típusai

A nem felügyelt tanulási feladatok nagyjából három kategóriába sorolhatók:

  1. Társulási szabály bányászat
  2. Klaszterek
  3. Ajánlási rendszer

1. Egyesítési szabályok bányászat

Ha valami tranzakciós adattal rendelkezünk, akkor lehet az eladott termékekre, vagy bármilyen tranzakciós adatokra számíthatunk, tudni akarom, van-e rejtett kapcsolat a vevő és a termékek vagy a termékek között, olyan módon, hogy valamilyen módon tudom felhasználni ezt az információt az eladásaim növelése érdekében. Ezeknek a kapcsolatoknak a kibontása képezi az Association Rule Mining alapját. Használhatjuk az AIS, SETM, Apriori, FP növekedési algoritmusokat a kapcsolatok kibontásához.

2. Fürtözés

A klaszterezés bármilyen adat elvégezhető, ha nincsenek osztályunk vagy címkéink. Az adatokat úgy akarjuk csoportosítani, hogy a hasonló tulajdonságokkal rendelkező megfigyelések ugyanabba a klaszterbe / csoportba tartozjanak, és a klaszterek közötti távolság legyen maximális. Míg a klaszteren belüli távolságnak minimálisnak kell lennie. A szavazó adatait csoportosíthatjuk, hogy megtudjuk a kormányról vagy a klasztertermékekről kialakított véleményt jellemzőik és felhasználásuk alapján. A lakosság szegmentálása a jövedelem jellemzői alapján, vagy a klaszterezés használata az értékesítés és a marketing területén.

Használhatjuk a K-eszközöket, a K-eszközöket ++, a K-medoidokat, a fuzzy C-eszközöket (FCM),

Várakozás-maximalizálás (EM), agglomerációs klaszterezés, DBSCAN, a hierarchikus klaszterezés típusai egyszeres kapcsolatként, teljes kapcsolat, medián kapcsolat, Ward módszer algoritmusai a klaszterezéshez.

3. Ajánlási rendszer

Az Ajánlási rendszer alapvetően az asszociációs szabályok kiterjesztésének kiterjesztése abban az értelemben, hogy az ARM-ben kapcsolatokat vonunk ki, és az Ajánlási rendszerben ezeket a kapcsolatokat olyan dolgok ajánlására használjuk, amelyek nagyobb valószínűséggel bírnak a végfelhasználó számára. Az ajánlásrendszerek egyre népszerűbbek voltak, miután a Netflix 2009-ben 1 000 000 dolláros nagydíjat hirdett ki.

Az Ajánlási rendszerek tranzakciós adatokon dolgoznak, legyen az pénzügyi tranzakció, e-kereskedelem vagy élelmiszerüzlet. Manapság az e-kereskedelem óriási szereplői rávegyék az ügyfelekre, hogy testreszabott ajánlást tesznek minden felhasználó számára, a múltbeli vásárlási előzmények és a hasonló felhasználói viselkedés adatai alapján.

Az ajánlási rendszerek fejlesztésének módszerei nagyjából feloszthatók együttműködési szűrésre és tartalom alapú szűrésre. Az együttműködő szűrésnél ismét felhasználói-felhasználói szűrés és elem-elem szűrés működik, amelyek memória alapú megközelítések, a mátrix faktorizálás és az Singular Value Decomposition (SVD) modell alapú megközelítések.

A felügyelet nélküli tanulás alkalmazásai

Mivel a világ adatai hihetetlenül növekednek minden nap, a felügyelet nélküli tanulásnak számos alkalmazásra van szüksége. Az adatokat mindig a közösségi média platformjainak vagy a YouTube-on található videotartalmaknak köszönhetően állítjuk elő, és sokszor nem is szándékosan. Mindezeket az adatokat nem szerkesztették, és a felügyelt tanulási feladatokhoz való címkézésük fárasztó és költséges lesz.

Az alábbiakban bemutatjuk a felügyelet nélküli gépi tanulás néhány kiváló alkalmazását.

  1. Élelmiszerbolt vagy e-kereskedelem / bolt: Kivonat-egyesítési szabályok az ügyfelek tranzakciós adataiból és ajánlások a fogyasztók számára a termékek vásárlásához.
  2. Közösségi média platform: Kivonja a kapcsolatokat a különböző felhasználókkal, hogy termékeket vagy szolgáltatásokat javasoljon. Javasoljon új embereket a társadalmi kapcsolatokra.
  3. Szolgáltatások: utazási szolgáltatások ajánlása, házak bérbeadása vagy házassági szolgáltatások.
  4. Banki tevékenység: Klaszter ügyfelek pénzügyi tranzakcióik alapján. Klaszter csaló tranzakció a csalás felderítésére.
  5. Politika: A klaszter szavazóinak véleménye egy adott párt nyerésének esélyéről.
  6. Adatok megjelenítése: Fürtözéses és t-eloszlott sztochasztikus szomszédos beágyazással (t-SNE) képesek vizualizálni a nagy dimenziós adatokat. Ez is felhasználható a dimenzió csökkentésére.
  7. Szórakozás: Ajánlások filmekre, zenére, ahogyan a Netflix és az Amazon tesz.
  8. Kép szegmentálás: A csoportos képek részei a legközelebbi pixelértékek alapján.
  9. Tartalom: személyre szabott újságok, weboldalak ajánlásai, e-tanulási alkalmazások és e-mail szűrők.
  10. Strukturális felfedezés: A klaszterezéssel bármilyen rejtett szerkezetet felfedezhetünk az adatokban. A klaszter twitter adatai az érzelmi elemzéshez.

Következtetés

A nem felügyelt gépi tanulás nem túl számszerűsíthető, de sok olyan problémát megoldhat, amelyekben a felügyelt algoritmusok meghiúsulnak. Számos alkalmazás létezik a felügyelet nélküli tanuláshoz olyan területeken, ahol strukturálatlan és címkézetlen adatok vannak. Felügyelet nélkül használhatjuk tanulási technikákat arra, hogy megtanítsuk gépeinket, hogy jobban végezzenek munkánkat, mint mi. Az utóbbi években a gépek felülmúltak az embereknél olyan feladatok tekintetében, amelyeket az emberek évszázadok óta megoldanak. Remélem, hogy ez a cikk megértette, hogy mi és hogyan lehet a felügyelet nélküli gépi tanulási technikákat alkalmazni a valós problémák megoldására.

Ajánlott cikkek

Ez egy útmutató a felügyelet nélküli gépi tanuláshoz. Itt tárgyaljuk a gépi tanulás típusait és a nem felügyelt gépi tanulás típusait, valamint alkalmazásait. Lehet, hogy megnézi a következő cikkeket is, ha többet szeretne megtudni -

  1. Gépi tanulási algoritmusok
  2. Mi a gépi tanulás?
  3. Bevezetés a gépi tanulásba
  4. Gépi tanulási eszközök
  5. Fürtözés a gépi tanulásban
  6. Hiperparaméter gépi tanulás
  7. Hierarchikus klaszterezési algoritmus
  8. Hierarchikus csoportosítás | Agglomerációs és megosztó csoportosulás
  9. A gépi tanulás életciklusának 8 legfontosabb szakasza

Kategória: