A felügyelt tanulás a gépi tanulás azon típusai, amelyek során a gépeket jól „címkézett” képzési adatok felhasználásával képezik ki, és ezek alapján a gépek előrejelzik a kimenetet. A címkézett adatok azt jelentik, hogy bizonyos bemeneti adatok már meg vannak jelölve a megfelelő kimenettel.
A felügyelt tanulás során a gépeknek biztosított betanítási adatok felügyelőként működnek, amely megtanítja a gépeket a kimenet helyes előrejelzésére. Ugyanazt a koncepciót alkalmazza, mint amit a diák a tanár felügyelete alatt tanul.
A felügyelt tanulás egy olyan folyamat, amely során bemeneti adatokat, valamint helyes kimeneti adatokat biztosítanak a gépi tanulási modellhez. A felügyelt tanulási algoritmus célja, hogy keressen egy leképezési függvényt a bemeneti változó (x) és a kimeneti változó (y) leképezéséhez .
A való világban a felügyelt tanulás használható Kockázatértékelés, képbesorolás, csalásfelderítés, spamszűrés stb.
Hogyan működik a felügyelt tanulás?
A felügyelt tanulás során a modelleket címkézett adatkészletek segítségével képezik, ahol a modell megismeri az egyes adattípusokat. A betanítási folyamat befejezése után a modell tesztelésre kerül a tesztadatok (a betanítási halmaz egy részhalmaza) alapján, majd előrejelzi a kimenetet.
A felügyelt tanulás működése könnyen megérthető az alábbi példa és diagram alapján:
Tegyük fel, hogy van egy adatkészletünk különböző típusú alakzatokból, amelyek magukban foglalják a négyzetet, a téglalapot, a háromszöget és a sokszöget. Most az első lépés az, hogy minden alakzathoz meg kell tanítanunk a modellt.
- Ha az adott alakzatnak négy oldala van, és minden oldala egyenlő, akkor a címkével lesz ellátva Négyzet .
- Ha az adott alakzatnak három oldala van, akkor a címkével lesz ellátva háromszög .
- Ha az adott alakzatnak hat egyforma oldala van, akkor a következővel lesz megjelölve hatszög .
Most edzés után a tesztkészlet segítségével teszteljük a modellünket, a modell feladata pedig az alakzat azonosítása.
A gép már minden típusú formára betanítva van, és amikor új formát talál, több oldal alapján osztályozza az alakzatot, és megjósolja a kimenetet.
A felügyelt tanulás lépései:
- Először határozza meg a képzési adatkészlet típusát
- Gyűjtsük össze/gyűjtsük össze a megjelölt edzési adatokat.
- Ossza fel a képzési adatkészletet edzésre adatkészlet, tesztadatkészlet és érvényesítési adatkészlet .
- Határozza meg a betanítási adatkészlet bemeneti jellemzőit, amelyeknek elegendő tudással kell rendelkezniük ahhoz, hogy a modell pontosan előre jelezhesse a kimenetet.
- Határozza meg a modellhez megfelelő algoritmust, például támogató vektorgépet, döntési fát stb.
- Hajtsa végre az algoritmust a betanítási adatkészleten. Néha szükségünk van érvényesítési készletekre, mint vezérlőparaméterekre, amelyek a betanítási adatkészletek részhalmazai.
- Értékelje a modell pontosságát a tesztkészlet megadásával. Ha a modell megjósolja a helyes kimenetet, az azt jelenti, hogy a modellünk pontos.
A felügyelt gépi tanulási algoritmusok típusai:
A felügyelt tanulás további két problématípusra osztható:
1. Regresszió
Regressziós algoritmusokat használunk, ha kapcsolat van a bemeneti változó és a kimeneti változó között. Folyamatos változók, például időjárás-előrejelzés, piaci trendek stb. előrejelzésére szolgál. Az alábbiakban néhány népszerű regressziós algoritmust mutatunk be, amelyek felügyelt tanulás alatt állnak:
- Lineáris regresszió
- Regressziós fák
- Nem-lineáris regresszió
- Bayes-féle lineáris regresszió
- Polinomiális regresszió
2. Osztályozás
Az osztályozási algoritmusokat akkor használjuk, ha a kimeneti változó kategorikus, ami azt jelenti, hogy két osztály létezik, például igen-nem, férfi-nő, igaz-hamis stb.
Spam szűrés,
- Random Forest
- Döntési fák
- Logisztikus regresszió
- Támogatja a vektoros gépeket
Megjegyzés: Ezeket az algoritmusokat a későbbi fejezetekben részletesen tárgyaljuk.
A felügyelt tanulás előnyei:
- A felügyelt tanulás segítségével a modell képes előre jelezni a kimenetet a korábbi tapasztalatok alapján.
- A felügyelt tanulás során pontos elképzelésünk lehet az objektumok osztályairól.
- A felügyelt tanulási modell segít különféle valós problémák megoldásában, mint pl csalás felderítése, spam szűrés stb.
A felügyelt tanulás hátrányai:
- A felügyelt tanulási modellek nem alkalmasak az összetett feladatok kezelésére.
- A felügyelt tanulás nem tudja megjósolni a helyes kimenetet, ha a tesztadatok eltérnek a betanítási adatkészlettől.
- A képzés sok számítási időt igényelt.
- A felügyelt tanulás során elegendő ismeretre van szükségünk az objektumok osztályairól.