logo

Lineáris regresszió vs logisztikai regresszió

A lineáris regresszió és a logisztikai regresszió a két híres gépi tanulási algoritmus, amelyek felügyelt tanulási technikák alá tartoznak. Mivel mindkét algoritmus felügyelt jellegű, ezért ezek az algoritmusok címkézett adatkészletet használnak az előrejelzések elkészítéséhez. De a fő különbség köztük az, hogy hogyan használják őket. A lineáris regressziót a regressziós problémák megoldására, míg a logisztikus regressziót az osztályozási problémák megoldására használják. Az alábbiakban mindkét algoritmus leírását a különbségtáblázattal együtt adjuk meg.

inear regresszió vs logisztikai regresszió

Lineáris regresszió:

  • A lineáris regresszió az egyik legegyszerűbb gépi tanulási algoritmus, amely a felügyelt tanulási technika alá tartozik, és regressziós problémák megoldására szolgál.
  • A folytonos függő változó előrejelzésére szolgál független változók segítségével.
  • A lineáris regresszió célja a legjobb illeszkedési vonal megtalálása, amely pontosan megjósolja a folytonos függő változó kimenetét.
  • Ha egyetlen független változót használunk az előrejelzéshez, akkor egyszerű lineáris regressziónak nevezzük, és ha kettőnél több független változó van, akkor ezt a regressziót többszörös lineáris regressziónak nevezzük.
  • A legjobb illeszkedési vonal megtalálásával az algoritmus megállapítja a kapcsolatot a függő változó és a független változó között. És a kapcsolatnak lineárisnak kell lennie.
  • A lineáris regresszió kimenete csak a folytonos értékek lehetnek, mint az ár, életkor, fizetés stb. A függő változó és a független változó közötti kapcsolat az alábbi képen látható:
inear regresszió vs logisztikai regresszió

A fenti képen a függő változó az Y tengelyen (fizetés) és a független változó az x tengelyen (tapasztalat) található. A regressziós egyenes a következőképpen írható fel:

 y= a<sub>0</sub>+a<sub>1</sub>x+ &#x3B5; 

Hol egy0és a1az együtthatók, ε pedig a hibatag.

Logisztikus regresszió:

  • A logisztikai regresszió az egyik legnépszerűbb gépi tanulási algoritmus, amely a felügyelt tanulási technikák alá tartozik.
  • Használható osztályozási és regressziós problémákra, de főleg osztályozási problémákra.
  • Logisztikus regressziót használunk a kategorikus függő változó előrejelzésére független változók segítségével.
  • A logisztikai regressziós probléma kimenete csak 0 és 1 között lehet.
  • A logisztikus regresszió akkor használható, ha két osztály közötti valószínűségekre van szükség. Például hogy ma esik-e vagy sem, 0 vagy 1, igaz vagy hamis stb.
  • A logisztikai regresszió a Maximum Likelihood becslés koncepcióján alapul. E becslés szerint a megfigyelt adatoknak a legvalószínűbbnek kell lenniük.
  • A logisztikus regresszió során a bemenetek súlyozott összegét egy aktiváló függvényen keresztül adjuk át, amely 0 és 1 közötti értékeket tud leképezni. Az ilyen aktiválási függvény az úgynevezett szigmafunkció és a kapott görbét szigmoid görbének vagy S-görbének nevezzük. Vegye figyelembe az alábbi képet:
inear regresszió vs logisztikai regresszió
  • A logisztikus regresszió egyenlete:
inear regresszió vs logisztikai regresszió

A lineáris regresszió és a logisztikai regresszió közötti különbség:

Lineáris regresszió Logisztikus regresszió
Lineáris regressziót használunk a folytonos függő változó előrejelzésére egy adott független változókészlet segítségével. A logisztikai regressziót a kategorikus függő változó előrejelzésére használják egy adott független változókészlet segítségével.
A lineáris regressziót a regressziós probléma megoldására használják. A logisztikus regressziót osztályozási problémák megoldására használják.
A Lineáris regresszióban a folytonos változók értékét jósoljuk meg. A logisztikus regresszióban megjósoljuk a kategorikus változók értékeit.
A lineáris regresszióban megtaláljuk a legjobban illeszkedő egyenest, amellyel könnyen megjósolhatjuk a kimenetet. A logisztikai regresszióban megtaláljuk az S-görbét, amely alapján osztályozhatjuk a mintákat.
A pontosság becslésére a legkisebb négyzetes becslési módszert használják. A maximális valószínűség becslési módszert használják a pontosság becslésére.
A lineáris regresszió kimenetének folytonos értéknek kell lennie, például ár, életkor stb. A logisztikai regresszió kimenetének kategorikus értéknek kell lennie, például 0 vagy 1, igen vagy nem stb.
A Lineáris regresszióban a függő változó és a független változó közötti kapcsolatnak lineárisnak kell lennie. A logisztikus regresszióban nem szükséges, hogy a függő és a független változó között lineáris kapcsolat legyen.
Lineáris regresszióban a független változók között kollinearitás lehet. A logisztikus regresszióban nem lehet kollinearitás a független változó között.