Bevezetés a gépi tanulásba
A gépi tanulás (ML) az algoritmusok kifejlesztésének művészete kifejezetten programozás nélkül. Az elmúlt két évtizedben az adatok exabitátjai keletkeztek, és az iparágak nagy részét teljesen digitalizálták. Ezeket a meglévő adatokat a Machine learning (ML) algoritmusok használják prediktív modellek kidolgozására és több időigényes feladat automatizálására.
Lássuk, hogyan különböznek az ML algoritmusok a programozott logikai alapú algoritmusoktól:
Egy logikai alapú algoritmus esetében az áramlás jól definiált és előre ismert, azonban számos valós életforgatókönyv (például a kép osztályozása) olyan, ahol a logika nem definiálható. Ilyen esetekben a gépi tanulás rendkívül hasznosnak bizonyult. A gépi tanulási technikák veszik a bemeneti paramétereket és a várható referencia-kimeneti adatokat, és generálnak logikát, amelyet azután a termelésbe beépítenek.
A gépi tanulás bevezetésének fő alkotóelemei:
A gépi tanulás fel van osztva a következő kategóriákra:
1. Felügyelt gépi tanulás
A felügyelt ML algoritmus bemeneti adatokat (szolgáltatásokat) vesz át, a kimeneti címkével ellátott adatokkal együtt a bemeneten. Ezeket elsősorban osztályozási és regressziós feladatokhoz használják.
Osztályozás:
- Hitel-támogathatósági döntés : Automatizálja a hitel jóváhagyási folyamatát olyan korábbi adatok felhasználásával, amelyek olyan paramétereket tartalmaznak, mint életkor, jövedelem, iskoláztatás, város stb., Hogy eldöntse, lehet-e a kérelmező kölcsönét jóváhagyni.
Regresszió:
- Házára vonatkozó előrejelzés: A ház árának előrejelzése olyan szolgáltatások használatával, mint a ház mérete, a ház kora, a szobák száma, a hely stb.
2. Nem felügyelt gépi tanulás
A nem felügyelt ML technikák nem igényelnek semmilyen címkézett adatot, és az adatok különböző szegmensekbe történő csoportosításához használják a bemeneti jellemzők alapján.
Példa: A 100 emberből álló csoport 5 klaszterre történő felosztásához a bemeneti funkciók magukban foglalhatják érdeklődési köröket, hobbi, társadalmi kapcsolatokat stb.
Gépi tanulás alkalmazásai
Az elmúlt évtizedben a gépi tanulás bevezetése számos iparágot átalakított, beleértve az egészségügyi, szociális média, a digitális marketing, az ingatlan, a logisztika, az ellátási lánc és a gyártás ágazatát. Ezekben az iparágakban a korai beköltözők már jelentős nyereséget szereztek. Növekszik a kereslet a gépi tanulással és a domain ismeretekkel rendelkező, képzett munkaerő iránt.
Az alábbiakban bemutatunk néhány alkalmazást, ahol az ML technikák jelentős szerepet játszottak:
-
Spam levelek besorolása:
A levél spamnek / nem spamnek való osztályozása címkézett válaszok felhasználásával, például adatokkal, például az üzenet tartalmával, a promóciós e-mailekben használt szókincs használatával, a feladó e-mail címével, a feladó IP-jével, a hiperhivatkozások használatával, a szám írásjelekkel stb.
-
Rákdetektálás:
Az ML-t egyre inkább használják az egészségügyben diagnosztizáláshoz és még a rák felderítéséhez is, a korábbi betegek orvosi adatainak felhasználásával. Az emlőrák kimutatására az edzési algoritmus bemeneti adatokként veszi be a tumor méretét, sugárát, görbületét és kerületét. A kimeneten megkapjuk annak a valószínűségét, hogy a daganat rosszindulatú-e vagy sem.
-
Értékesítési előrejelzés :
Egyre több eladó gyártó digitalizálja nyilvántartását, és sokan már gépi tanulási eszközöket használnak az adott cikk eladásának előrejelzésére egy adott héten, hogy elegendő mennyiségű készlet rendelkezésre állhassanak. Bevezetés A gépi tanulási technikákhoz felhasználnák a különféle elemek előző évi eladásaiból származó információkat, és megkeresnék a szezonális eltérések mintáit, és konkrét előrejelzéseket adnának egyes elemek eladására. Az alacsony teljesítményű tételeket az eladások szempontjából is azonosíthatjuk.
-
Arcfelismerés:
Valószínűleg megfigyelted, amikor képeket töltöttek fel a Facebookra, hogy az megcímkézi barátja arcát a nevükre. A háttér-számítógépen / mély tanulási algoritmusok végzik ezt a munkát. A gépi tanulás elveinek ugyanazt az alapvető bevezetését használják az arcfelismeréshez is, ahol a bemeneti arc képeket adagolják és az ideghálózatokat kiképzik e képek osztályozására.
-
Szöveg osztályozás:
Az egyre növekvő népesség online megjelenésével kötelezővé vált a weboldal / szociális média társaságok, például a Twitter, a Facebook, a Quora számára a szöveges osztályozáson alapuló rendszerek telepítése. A Twitter / Quora ezt gyűlöletbeli megjegyzések / hozzászólások azonosítására használja. Egyes hírcégek szöveges osztályozási algoritmusokat is használnak hasonló hírcikkek csoportosítására.
-
Audio / Hang értelmezés:
Gondolkodjon azon azon azon, hogy az olyan eszközök, mint például az Alexa, a Siri és a Google, napról napra intelligensvé válnak a különböző nyelvek audiotadatainak megértésénél, különféle kiejtéssel. Ezekben az eszközökben hatalmas mennyiségű adatot képznek a gépi tanulási technikák bevezetésére, ami ezt lehetővé teszi.
-
Csalás-felderítő rendszerek:
Az ML-alapú csalás-felderítő rendszereket számos e-kereskedelmi vállalat telepíti, hogy azonosítsa a hamis megrendeléseket generáló ügyfeleket, és kiküszöbölje a hamisított termékeket a platformon értékesítő szolgáltatókat is. A bankipar és az egyéb pénzügyi technológiai induló vállalkozások nagymértékben támaszkodnak az ML technikákra a csalások tranzakcióinak felderítésére
-
Ajánlott motorok
A Netflix felügyelet nélküli ML-t használ a filmek ajánlására, az Amazon pedig a vásárlásra szánt termékek ajánlására.
Előnyök
-
Automatizálja az időigényes feladatokat:
Az ML-alapú alkalmazások számos feladatot automatizáltak, például alacsony szintű döntéshozatalt, adatbevitelt, telefonhívást, kölcsön-jóváhagyási folyamatokat.
-
Megtakarítás:
Az algoritmus kidolgozása és gyártása után jelentős költségmegtakarítást eredményezhet, mivel az emberi munka és a döntéshozatal minimális.
-
Átfutási idő:
Sok alkalmazás esetén a teljes idő kiemelkedő jelentőségű. Az ML csökkentheti az időt olyan területeken, mint például az autóbiztosítási kárigények, ahol a felhasználó képeket tölt fel és a biztosítási összeg kiszámításra kerül. Segített az e-kereskedelmi vállalatok számára az eladott készlet visszatérítésének kezelésében.
-
Adatvezérelt döntéshozatal:
Nem csak a vállalatok, hanem sok kormány támaszkodik az ML-re, hogy döntést hozzon annak eldöntésében, hogy mely projektekbe fektessen be és hogyan használja fel a meglévő forrásokat optimálisan.
hátrányok
-
Az ML algoritmusok torzíthatók:
Az ML algoritmus bemeneti adatait sokszor egy adott nemre, fajra, országra, kasztra stb. Torzítják. Ez azt eredményezi, hogy az ML algoritmusok a nem kívánt elfogultságot terjesztik a döntéshozatali folyamatba. Ezt megfigyelték egyes alkalmazásokban, amelyek telepítették az ML-szerű iskolai / egyetemi felvételi eljárást és a közösségi média ajánlásait.
-
Nagy adat szükséges az elfogadható pontosság eléréséhez:
Míg az emberek könnyen megtanulhatnak kis adatkészleteket, bizonyos alkalmazásokhoz a gépi tanuláshoz való bevezetés hatalmas mennyiségű adatot igényel a kellő pontosság elérése érdekében.
-
Manipulálni a felhasználói döntést:
A közelmúltban a Cambridge Analytica elemző cég ML algoritmusokat alkalmazott a közösségi médiában a szavazók döntésének megcélzására és befolyásolására.
-
Jelenleg a gépi tanulási algoritmus bevezetése a jövőben is megfelelő lehet:
A jelenlegi adatkészletre kiképzett ML technika lehet, hogy nem megfelelő a jövőben, mivel a bemeneti eloszlás idővel jelentősen változhat. Az egyik ellenintézkedés ennek leküzdésére a modell időszakos átképzése.
Ajánlott cikkek
Ez útmutatóként szolgál a gépi tanulás bevezetéséhez. Itt megbeszéljük a gépi tanulást a gépi tanulás bevezetésének alapvető pontjaival és jellemzőivel. A következő cikkeket is megnézheti:
- Gépi tanulási technikák
- Gépi tanulás vs neurális hálózat
- Karrier a gépi tanulásban
- Különbség a nagy adatok és a géptanulás között
- Hiperparaméter gépi tanulás