Bevezetés a polinomiális regresszióba
A regressziót úgy kell meghatározni, hogy az eredmény kiszámításához a független és a függő változók közötti kapcsolatot megtalálja. Az első polinomiális regressziós modellt Gergonne 1815-ben alkalmazta. Arra szolgál, hogy megtalálják a legmegfelelőbb sort a regressziós vonal segítségével az eredmények előrejelzésére. A regressziós technikáknak sokféle típusa létezik, ezek közül a polinomiális regresszió egyike. Mielõtt ezt megértené, tanácsos megfelelõ ismeretekkel rendelkezni a lineáris regresszióról, így könnyû megjelölni a különbségeket közöttük.
Miért a polinomiális regresszió?
- Ez az egyik olyan regressziós technika, amelyet a szakemberek használnak az eredmény előrejelzésére. Ez a független és a függő változók közötti kapcsolat, ha a függő változó az n. Fokozatú független változóhoz kapcsolódik. Nem követeli meg, hogy a függő és a független változók közötti kapcsolat legyen lineáris, tehát ha a vonal görbe, akkor lehet, hogy bármilyen polinom kifejezése van.
- A fő különbség a lineáris és a polinomiális regresszió között az, hogy a lineáris regresszió megköveteli a függő és független változók lineáris összekapcsolását, miközben ez jobban illeszkedik a vonalhoz, ha az egyenletben magasabb fokot foglalunk be a független változó kifejezésbe. Az n-edik fokú polinomiális regresszió egyenlete így írható:
I = b0 + a1x + a2x 2 + a3x 3 +…. ANX n
- Ha magasabb fokokat adunk hozzá, például kvadratikusan, akkor a vonal görbévé válik, amely jobban illeszkedik az adatokhoz. Általában akkor használják, amikor az adatkészlet pontjai szétszórtak, és a lineáris modell nem képes egyértelműen leírni az eredményt. Mindig figyelemmel kell kísérnünk a túlfutást és az alulépést, miközben figyelembe vesszük ezeket az egyenleteket.
- Fontosabb, ha figyelembe vesszük azt az fokot, amely minden adatponton áthalad, de olykor, ha magasabb fokozatot vesz igénybe, például 10 vagy 20, akkor az átjuthat az összes adatponton és csökkentheti a hibát, ugyanakkor rögzíti az adatok zaját is, amely túlteljesíti a modellt, és elkerülhető, ha további mintákat ad az edzési adatkészlethez. Tehát mindig tanácsos az optimális fokozatot választani, hogy illeszkedjen a modellhez.
Két módszer létezik az egyenlet mértékének meghatározására:
- Előreválasztás: Ez a fokozat-növelési módszer, amíg ez nem lesz elég jelentős a modell meghatározásához.
- Háttérválasztás: Ez a fokozat csökkentésének módszere, amíg az nem lesz elég jelentős a modell meghatározásához.
A polinomiális regresszió alkalmazásának eljárása
Kérjük, olvassa el az alábbi lépéseket vagy eljárást a polinomiális regresszió bármely adatkészletre történő alkalmazására:
1. lépés: Importálja a megfelelő adatkészletet bármilyen platformra (R vagy Python), és telepítse a modell alkalmazásához szükséges csomagokat.
2. lépés: Osszuk el az adatkészletet edzési és tesztelési halmazokba, hogy az algoritmust fel lehessen használni az edzési adatkészletre, és teszteljük a tesztelési adatkészlettel.
3. lépés: Fedezze fel az adatelemzési módszereket az adatok hátterének, például középérték, medián, mód, első kvartilis, második kvartilis stb. Tanulmányozására.
4. lépés: Alkalmazza a lineáris regressziós algoritmust az adatkészletre és tanulmányozza a modellt.
5. lépés: Alkalmazza a polinomiális regressziós algoritmust az adatkészletre, és tanulmányozza a modellt az RMSE vagy az R négyzet eredményeinek összehasonlítására a lineáris regresszió és a polinomiális regresszió között.
6. lépés: Vizualizálja és megjósolja mind a lineáris, mind a polinom regresszió eredményeit, és azonosítsa, melyik modell jobb eredményekkel jósolja meg az adatkészletet.
Polinomiális regressziós felhasználások
- Számos kísérleti eljárásban használják az eredmény létrehozására az egyenlet felhasználásával.
- Nagyon határozott kapcsolatot biztosít a független és a függő változók között.
- Az üledékek izotópjainak tanulmányozására szolgál.
- A különféle betegségek növekedésének tanulmányozására szolgál bármely populáción belül.
- Bármely szintézis előállításának tanulmányozására szolgál.
A polinomiális regresszió jellemzői
- Ez egy nemlineáris regressziós módszer, amely megmondja nekünk a független és függő változó közötti kapcsolatot, ha a függő változó az n. Fokozat független változójához kapcsolódik.
- A legmegfelelőbb vonalat a polinomiális regressziós egyenlet foka határozza meg.
- A polinomiális regresszióból származó modellt a kiugró értékek befolyásolják, ezért mindig jobb, ha a kiugró értékeket kezeljük, mielőtt az algoritmust az adatkészletre alkalmaznánk.
- A polinomialfeature () függvény a mátrix jellemzőjé alakul át az egyenlet mértékétől függően.
- A görbe természetét egy egyszerű szórási diagram segítségével meg lehet tanulmányozni vagy megjeleníteni, amely jobb képet ad a változók közötti linearitási viszonyról, és ennek megfelelően dönt.
Következtetés
A polinomiális regressziót sok szervezet alkalmazza, amikor nemlineáris kapcsolatot azonosítanak a független és a függő változók között. Ez a nehéz regressziós technikák egyike a többi regressziós módszerhez képest, így a megközelítés és az algoritmus alapos ismerete segít jobb eredmények elérésében.
Ajánlott cikkek
Ez egy útmutató a polinomiális regresszióhoz. Itt tárgyaljuk a polinomiális regresszió tulajdonságait és felhasználását. A további javasolt cikkeken keresztül további információkat is megtudhat -
- SVM algoritmus
- Kernel módszerek
- LINEST Excel Function
- Gépi tanulási algoritmusok
- Lineáris regresszió vs logisztikus regresszió | Legfontosabb különbségek