Lineáris regresszió vs logisztikus regresszió - A 6 legfontosabb különbség a tanuláshoz

Tartalomjegyzék:

Anonim

Különbség a lineáris regresszió és a logisztikus regresszió között

A következő cikk: Lineáris regresszió vs. logisztikus regresszió nyújtja a legfontosabb különbségeket mindkettő között, de mielőtt megnézzük, mit jelent a regresszió?

Regresszió

A regresszió alapvetően statisztikai mérőszám az egyik függő változó, azaz az Y kimenet és más független változók sorozata közötti kapcsolat erősségének meghatározására, azaz X 1, X 2 és így tovább. A regressziós elemzést alapvetően a jóslatokra és az előrejelzésekre használják.

Mi az a lineáris regresszió?

A lineáris regresszió egy olyan algoritmus, amely a gépi tanulás felügyelt tanulási tartományán alapul. Lineáris kapcsolatot örököl bemeneti változói és az egyetlen kimeneti változó között, ahol a kimeneti változó folyamatos természetű. A kimenet értékének becslésére szolgál, mondjuk, hogy Y a bemenetek közül, mondjuk X. Ha csak egyetlen bemenetet tekintünk, egyszerű lineáris regressziónak nevezzük.

Két fő kategóriába sorolható:

1. Egyszerű regresszió

Működési elv: A fő cél az egyenes egyenletének kiderítése, amely a legjobban illeszkedik a mintába felvett adatokhoz. Ez az egyenlet algebrai módon leírja a két változó közötti kapcsolatot. A legjobban illeszkedő egyeneset regressziós vonalnak hívják.

Y = β 0 + β 1 X

Hol,

β a tulajdonságokat képviseli

β 0 jelzi az elfogást

β 1 a X tulajdonság együtthatóját jelenti

2. Többváltozós regresszió

Egynél több független változó és egy függő változó közötti korreláció becslésére szolgál. A kettőnél több független változóval történő regresszió az alakot illeti az adatok csillagképéhez egy többdimenziós grafikonon. A regresszió alakjának olyannak kell lennie, hogy minimalizálja a forma távolságát minden adatponttól.

A lineáris kapcsolatmodell matematikai módon ábrázolható az alábbiak szerint:

Y = β 0 + β 1 X 1 + β 2 X 2 + β 3 X 3 + ……. + β n X n

Hol,

β a tulajdonságokat képviseli

β 0 jelzi az elfogást

β 1 az X 1 jellemző koefficiense

β n az X n tulajdonság koefficiense

A lineáris regresszió előnyei és hátrányai

Az alábbiakban bemutatjuk az előnyöket és hátrányokat:

Előnyök

  • Egyszerűségének köszönhetően széles körben használják a jóslatok és következtetések modellezésére.
  • Az adatok elemzésére és az adatok előfeldolgozására összpontosít. Tehát különféle adatokkal foglalkozik, anélkül, hogy a modell részleteivel foglalkoznának.

hátrányok

  • Hatékonyan működik, ha az adatokat általában szétosztják. Így a hatékony modellezéshez el kell kerülni a kollinearitást.

Mi a logisztikus regresszió?

Ez a regresszió egy formája, amely lehetővé teszi a diszkrét változók előrejelzését folyamatos és diszkrét prediktorok keverékével. Ennek eredményeként a függő változók egyedi átalakulását eredményezi, amely nemcsak a becslési folyamatot, hanem a független változók együtthatóit is befolyásolja. Ugyanazzal a kérdéssel foglalkozik, amelyet a többszörös regresszió tesz, de nincs megoszlási feltételezés a prediktorokról. Logisztikus regresszióban az eredményváltozó bináris. Az elemzés célja több magyarázó változó hatásának felmérése, amelyek lehetnek numerikusak, kategorikusak vagy mindkettő.

A logisztikus regresszió típusai

Az alábbiakban bemutatjuk a logisztikus regresszió 2 típusát:

1. Bináris logisztikus regresszió

Abban az esetben használják, ha a függő változó kétoldalú, azaz olyan, mint egy két ágú fa. Akkor használja, ha a függő változó nem paraméteres.

Használva, amikor

  • Ha nincs linearitás
  • A függő változónak csak két szintje van.
  • Ha a többváltozós normalitás kétséges.

2. Multinomális logisztikus regresszió

A multinomális logisztikus regressziós elemzés megköveteli, hogy a független változók metrikusak vagy kétirányúak legyenek. Nem tesz feltételezést a linearitás, a normalitás és a variancia homogenitása szempontjából a független változók esetében.

Akkor használják, ha a függő változónak kétnél több kategóriája van. A nem metrikus függő változó és a metrikus vagy dikotóm független változók közötti kapcsolatok elemzésére szolgál, majd összehasonlít több csoportot bináris logisztikus regresszió kombinációjával. Végül együttmûködési együtthatókkal szolgál mind a két összehasonlításhoz. A referenciacsoport együtthatóinak minden nullát figyelembe kell venni. Végül az előrejelzést a legmagasabb eredményszintű valószínűség alapján végezzük.

A logisztikus regresszió előnye: Ez egy nagyon hatékony és széles körben alkalmazott technika, mivel nem igényel sok számítási erőforrást és hangolást.

A logisztikus regresszió hátránya: Nem alkalmazható nemlineáris problémák megoldására.

A fej közötti összehasonlítás a lineáris regresszió és a logisztikus regresszió között (Infographics)

Az alábbiakban bemutatjuk a 6 legfontosabb különbséget a Lineáris Regresszió és a Logisztikus Regresszió között

Legfontosabb különbség a lineáris regresszió és a logisztikus regresszió között

Beszéljünk néhány főbb különbségről a Lineáris Regresszió és a Logisztikus Regresszió között

Lineáris regresszió

  • Ez egy lineáris megközelítés
  • Egyenes vonalat használ
  • Nem lehet kategorikus változókat venni
  • Figyelembe kell venni a megfigyeléseket, ahol hiányzik a numerikus független változó értékei
  • Az Y kimenetet így kell megadni

  • X egységnyi növekedése növeli Y-t α-val

Alkalmazások

  • A termék árának előrejelzése
  • A mérkőzés eredményének előrejelzése

Logisztikus regresszió

  • Ez statisztikai megközelítés
  • Szigmoid függvényt használ
  • Ez kategorikus változókat igényelhet
  • Még akkor is hozhat döntéseket, ha hiányzó értékekkel rendelkező megfigyelések vannak jelen
  • Az Y kimenetet úgy kell megadni, mint ahol z van megadva

  • X egységnyi növekedése növeli Y-t α log-esélyével
  • Ha P egy esemény valószínűsége, akkor (1-P) annak valószínűsége, hogy nem történik meg. Sikeres esélyek = P / 1-P

Alkalmazások

  • Annak előrejelzése, hogy ma esik-e vagy sem.
  • Annak előrejelzése, hogy az e-mail spam vagy sem.

Lineáris regresszió vs logisztikus regresszió összehasonlító táblázat

Beszéljük meg a lineáris regresszió és a logisztikus regresszió legfelső összehasonlítását

Lineáris regresszió

Logisztikus regresszió

A regressziós problémák megoldására szolgálAz osztályozási problémák megoldására szolgál
A függő változó és egy vagy több független változó kapcsolatát modelleziMegjósolja egy olyan eredmény valószínűségét, amelynek csak két értéke lehet a kimeneten: 0 vagy 1
A várható output folyamatos változóA becsült output diszkrét változó
A várható Y kimenet meghaladhatja a 0 és 1 tartománytA várható Y kimenet 0 és 1 tartományon belülre esik
A várható Y kimenet meghaladhatja a 0 és 1 tartománytVárható output

Következtetés

Ha a jellemzők nem járulnak hozzá az előrejelzéshez, vagy ha ezek nagyon korrelálnak egymással, akkor ez zajt kölcsönöz a modellnek. Tehát azokat a funkciókat, amelyek nem eléggé járulnak hozzá a modellhez, el kell távolítani. Ha a független változók szorosan korrelálnak, akkor a multi-kollinearitás problémáját okozhatja, amelyet úgy lehet megoldani, hogy az egyes független változókon külön modelleket futtatunk.

Ajánlott cikkek

Ez egy útmutató a Lineáris Regresszió vs Logisztikus Regresszió szakaszhoz. Itt tárgyaljuk a Lineáris Regresszió vs Logisztikus Regresszió kulcsfontosságú különbségeket az infographics és az összehasonlító táblázat segítségével. Lehet, hogy megnézi a következő cikkeket is, ha többet szeretne megtudni -

  1. Data Science vs Data Visualization
  2. Gépi tanulás vs neurális hálózat
  3. Felügyelt tanulás vs mély tanulás
  4. Logisztikus regresszió R-ben