Bevezetés a többváltozós regresszióba
- A többváltozós kifejezés egynél több változóval rendelkező modellt jelent
- A többváltozós regresszió a többváltozós statisztikák része.
- A többváltozós regresszió egy olyan módszer, amelyet egyetlen regressziós modell becslésére használnak, ha egynél több kimeneti változó van.
- A többváltozós regresszió általában gépi tanulási algoritmust használt, amely felügyelt tanulási algoritmus.
Miért nem működik az egységes regressziós modell?
- Mint ismeretes, a regressziós analízist elsősorban egy függő és független változó közötti kapcsolat feltárására használják.
- A valós világban sok olyan helyzet van, amikor sok független változót más változók befolyásolnak, ezért más opciókra kell átállnunk, mint egy egyetlen regressziós modell, amely csak egy független változót képes felvenni.
Mi a többváltozós regresszió?
- A többváltozós regresszió segít egynél több független változó és egynél több függõ változó szögének mérésében. Megtalálja a változók közötti kapcsolatot (Lineáris kapcsolatban).
- Megjósolták a kimeneti változó viselkedését és a prediktív változók asszociációját, valamint azt, hogy a prediktív változók hogyan változnak.
- Számos gyakorlati területen alkalmazható, mint például a politika, a gazdaság, az orvostudomány, a kutatási munkák és sokféle vállalkozás.
- A többváltozós regresszió a többes regresszió egyszerű kiterjesztése.
- A többszörös regressziót egy változó értékének előrejelzésére és cseréjére használják a prediktív változók egynél több értékének együttes értéke alapján.
- Először példát fogunk venni a többváltozós regresszió alkalmazásának megértésére, utána pedig megoldást keresünk erre a kérdésre.
Példák a többváltozós regresszióra
- Ha az e-kereskedelemmel foglalkozó vállalat összegyűjtötte az ügyfelek adatait, mint például a kor, az ügyfél vásárolt előzményei, a nem és a vállalat, meg akarják találni a kapcsolatot a különféle eltartottak és a független változók között.
- Az edzőtermi edző összegyűjtötte az edzőterembe érkező ügyfeleinek adatait, és meg akarja figyelni az ügyfél néhány olyan dolgát, amelyek az egészség, az étkezési szokások (melyik terméket fogyaszt az ügyfél minden héten), az ügyfél súlya. Összefüggést akar találni e változók között.
Mint látta a fenti két példában, hogy mindkét esetben több változó is létezik, néhány függ, és mások függetlenek, tehát az egyetlen regresszió nem elegendő az ilyen típusú adatok elemzéséhez.
Itt van a képen megjelenő többváltozós regresszió.
1. Funkcióválasztás -
A jellemzők kiválasztása játszik a legfontosabb szerepet a többváltozós regresszióban.
Annak a szolgáltatásnak a megkeresése, amelyre szükség van annak meghatározásához, hogy mely változó függ ettől a funkciótól.
2. Funkciók normalizálása -
A jobb elemzés érdekében a funkciókat méretezni kell, hogy egy adott tartományba kerüljenek. Megváltoztathatjuk az egyes szolgáltatások értékét is.
3. Válassza ki a veszteség funkciót és a hipotézist -
A veszteségfüggvény kiszámítja a veszteséget, ha a hipotézis rossz értéket jelez.
És a hipotézis azt jelenti, hogy a jellemző változóból becsült értéket kell megadni.
4. Állítsa be a hipotézisparamétereket -
Állítsa be azt a hipotézis-paramétert, amely csökkentheti a veszteség funkciót és meg tudja jósolni.
5. minimalizálja a veszteség funkciót-
A veszteség minimalizálása néhány veszteség minimalizáló algoritmussal, és az adathalmazon történő felhasználása, amely segíthet a hipotézis paramétereinek beállításában. Amint a veszteség minimalizálódik, felhasználható az előrejelzéshez.
Számos algoritmus használható fel a veszteség csökkentésére, például a gradiens leszállása.
6. Tesztelje a hipotézis funkciót -
Ellenőrizze a hipotézis funkciót, hogy mennyire helyes előrejelzi az értékeket, tesztelje a teszt adatain.
A többváltozós regresszió archívumának követésének lépései
1) Importálja a szükséges általános könyvtárakat, mint például a zsibbadt, a pandák
2) Olvassa el az adatkészletet a pandák könyvtárával
3) Ahogy már fentebb tárgyaltuk, a jobb eredmények elérése érdekében az adatokat normalizálni kell. Miért normalizálva, mert minden tulajdonságnak eltérő értéktartománya van.
4) Készítsen egy modellt, amely archiválja a regressziót, ha lineáris regressziós felhasználási egyenletet használ
Y = mx + c
Amelyben x bemenet van megadva, m egy lejtős vonal, c állandó, y a kimeneti változó.
5) Tanítsa meg a modellt hiperparaméter segítségével. Ismerje meg a hiperparamétert, amelyet a modell szerint állított be. Mint például a tanulási arány, korszakok, iterációk.
6) Mint fentebb tárgyaltuk, hogy a hipotézis fontos szerepet játszik az elemzésben, ellenőrizze a hipotézist és mérje meg a veszteség / költség függvényt.
7) A veszteség / költség funkció segít felmérni, hogy a hipotézis értéke valódi és pontos-e.
8) A veszteség / költség funkció minimalizálása segíti a modellt az előrejelzés javításában.
9) A veszteség egyenlet a becsült érték és a tényleges érték közötti négyzet különbségének és az adathalmaz kétszeresének négyzetének összegével határozható meg.
10) A Lose / költség függvény minimalizálása érdekében használjon gradiens leszállást, ez egy véletlenszerű értékkel kezdődik, és megállapítja, hogy a veszteségfüggvény melyik a legkevesebb.
A fentiek segítségével megvalósíthatjuk a többváltozós regressziót
A többváltozós regresszió előnyei
- A többváltozós technika lehetővé teszi a változók vagy jellemzők közötti kapcsolat megállapítását
- Segít megtalálni a korrelációt a független és függő változók között.
A többváltozós regresszió előnyei
- A többváltozós technikák egy kicsit összetett és magas szintű matematikai számítások
- A többváltozós regressziós modell kimenete nem könnyen értelmezhető, és néha azért, mert egyes veszteségek és hibák kimenete nem azonos.
- Ez nem alkalmazható kis adatkészletre, mert a nagyobb adatkészletekben az eredmények egyértelműbbek.
Következtetés - többváltozós regresszió
- A többváltozós regresszió fő célja az, ha egynél több változó áll rendelkezésre, és ebben az esetben az egyenes lineáris regresszió nem fog működni.
- Elsősorban a valós világnak több változója vagy jellemzője van, amikor több változó / jellemző játszik szerepet, többváltozós regresszió kerül felhasználásra.
Ajánlott cikkek
Ez egy útmutató a többváltozós regresszióhoz. Itt tárgyaljuk a Bevezetést, a többváltozós regresszió példáit, valamint az előnyeket és a dis előnyeket. A további javasolt cikkeken keresztül további információkat is megtudhat -
- Regressziós képlet
- Adattudományi kurzus Londonban
- SAS operátorok
- Adattudományi technikák
- Változók a JavaScript-ben
- A regresszió és a besorolás legfontosabb különbségei