Bevezetés a polinomiális regresszióba

A regressziót úgy kell meghatározni, hogy az eredmény kiszámításához a független és a függő változók közötti kapcsolatot megtalálja. Az első polinomiális regressziós modellt Gergonne 1815-ben alkalmazta. Arra szolgál, hogy megtalálják a legmegfelelőbb sort a regressziós vonal segítségével az eredmények előrejelzésére. A regressziós technikáknak sokféle típusa létezik, ezek közül a polinomiális regresszió egyike. Mielõtt ezt megértené, tanácsos megfelelõ ismeretekkel rendelkezni a lineáris regresszióról, így könnyû megjelölni a különbségeket közöttük.

Miért a polinomiális regresszió?

  • Ez az egyik olyan regressziós technika, amelyet a szakemberek használnak az eredmény előrejelzésére. Ez a független és a függő változók közötti kapcsolat, ha a függő változó az n. Fokozatú független változóhoz kapcsolódik. Nem követeli meg, hogy a függő és a független változók közötti kapcsolat legyen lineáris, tehát ha a vonal görbe, akkor lehet, hogy bármilyen polinom kifejezése van.
  • A fő különbség a lineáris és a polinomiális regresszió között az, hogy a lineáris regresszió megköveteli a függő és független változók lineáris összekapcsolását, miközben ez jobban illeszkedik a vonalhoz, ha az egyenletben magasabb fokot foglalunk be a független változó kifejezésbe. Az n-edik fokú polinomiális regresszió egyenlete így írható:

I = b0 + a1x + a2x 2 + a3x 3 +…. ANX n

  • Ha magasabb fokokat adunk hozzá, például kvadratikusan, akkor a vonal görbévé válik, amely jobban illeszkedik az adatokhoz. Általában akkor használják, amikor az adatkészlet pontjai szétszórtak, és a lineáris modell nem képes egyértelműen leírni az eredményt. Mindig figyelemmel kell kísérnünk a túlfutást és az alulépést, miközben figyelembe vesszük ezeket az egyenleteket.
  • Fontosabb, ha figyelembe vesszük azt az fokot, amely minden adatponton áthalad, de olykor, ha magasabb fokozatot vesz igénybe, például 10 vagy 20, akkor az átjuthat az összes adatponton és csökkentheti a hibát, ugyanakkor rögzíti az adatok zaját is, amely túlteljesíti a modellt, és elkerülhető, ha további mintákat ad az edzési adatkészlethez. Tehát mindig tanácsos az optimális fokozatot választani, hogy illeszkedjen a modellhez.

Két módszer létezik az egyenlet mértékének meghatározására:

  • Előreválasztás: Ez a fokozat-növelési módszer, amíg ez nem lesz elég jelentős a modell meghatározásához.
  • Háttérválasztás: Ez a fokozat csökkentésének módszere, amíg az nem lesz elég jelentős a modell meghatározásához.

A polinomiális regresszió alkalmazásának eljárása

Kérjük, olvassa el az alábbi lépéseket vagy eljárást a polinomiális regresszió bármely adatkészletre történő alkalmazására:

1. lépés: Importálja a megfelelő adatkészletet bármilyen platformra (R vagy Python), és telepítse a modell alkalmazásához szükséges csomagokat.

2. lépés: Osszuk el az adatkészletet edzési és tesztelési halmazokba, hogy az algoritmust fel lehessen használni az edzési adatkészletre, és teszteljük a tesztelési adatkészlettel.

3. lépés: Fedezze fel az adatelemzési módszereket az adatok hátterének, például középérték, medián, mód, első kvartilis, második kvartilis stb. Tanulmányozására.

4. lépés: Alkalmazza a lineáris regressziós algoritmust az adatkészletre és tanulmányozza a modellt.

5. lépés: Alkalmazza a polinomiális regressziós algoritmust az adatkészletre, és tanulmányozza a modellt az RMSE vagy az R négyzet eredményeinek összehasonlítására a lineáris regresszió és a polinomiális regresszió között.

6. lépés: Vizualizálja és megjósolja mind a lineáris, mind a polinom regresszió eredményeit, és azonosítsa, melyik modell jobb eredményekkel jósolja meg az adatkészletet.

Polinomiális regressziós felhasználások

  • Számos kísérleti eljárásban használják az eredmény létrehozására az egyenlet felhasználásával.
  • Nagyon határozott kapcsolatot biztosít a független és a függő változók között.
  • Az üledékek izotópjainak tanulmányozására szolgál.
  • A különféle betegségek növekedésének tanulmányozására szolgál bármely populáción belül.
  • Bármely szintézis előállításának tanulmányozására szolgál.

A polinomiális regresszió jellemzői

  • Ez egy nemlineáris regressziós módszer, amely megmondja nekünk a független és függő változó közötti kapcsolatot, ha a függő változó az n. Fokozat független változójához kapcsolódik.
  • A legmegfelelőbb vonalat a polinomiális regressziós egyenlet foka határozza meg.
  • A polinomiális regresszióból származó modellt a kiugró értékek befolyásolják, ezért mindig jobb, ha a kiugró értékeket kezeljük, mielőtt az algoritmust az adatkészletre alkalmaznánk.
  • A polinomialfeature () függvény a mátrix jellemzőjé alakul át az egyenlet mértékétől függően.
  • A görbe természetét egy egyszerű szórási diagram segítségével meg lehet tanulmányozni vagy megjeleníteni, amely jobb képet ad a változók közötti linearitási viszonyról, és ennek megfelelően dönt.

Következtetés

A polinomiális regressziót sok szervezet alkalmazza, amikor nemlineáris kapcsolatot azonosítanak a független és a függő változók között. Ez a nehéz regressziós technikák egyike a többi regressziós módszerhez képest, így a megközelítés és az algoritmus alapos ismerete segít jobb eredmények elérésében.

Ajánlott cikkek

Ez egy útmutató a polinomiális regresszióhoz. Itt tárgyaljuk a polinomiális regresszió tulajdonságait és felhasználását. A további javasolt cikkeken keresztül további információkat is megtudhat -

  1. SVM algoritmus
  2. Kernel módszerek
  3. LINEST Excel Function
  4. Gépi tanulási algoritmusok
  5. Lineáris regresszió vs logisztikus regresszió | Legfontosabb különbségek

Kategória: