A gépi tanulás az AI egy részhalmaza, amely lehetővé teszi a gép számára, hogy automatikusan tanuljon az adatokból, javítsa a teljesítményt a korábbi tapasztalatok alapján, és előrejelzéseket készítsen. . A gépi tanulás olyan algoritmusokat tartalmaz, amelyek hatalmas mennyiségű adaton dolgoznak. Ezeknek az algoritmusoknak az adatokat betáplálják, és a betanítás alapján felállítják a modellt és végrehajtanak egy adott feladatot.
Ezek az ML algoritmusok segítenek megoldani a különböző üzleti problémákat, például a regressziót, az osztályozást, az előrejelzést, a klaszterezést és az asszociációkat stb.
A tanulás módszerei és módja alapján a gépi tanulást alapvetően négy típusra osztják, amelyek a következők:
- Felügyelt gépi tanulás
- Felügyelet nélküli gépi tanulás
- Félig felügyelt gépi tanulás
- Megerősítő tanulás
Ebben a témakörben részletes leírást adunk a gépi tanulás típusairól a megfelelő algoritmusokkal együtt:
1. Felügyelt gépi tanulás
Ahogy a neve is sugallja, Felügyelt gépi tanulás felügyeleten alapul. Ez azt jelenti, hogy a felügyelt tanulási technikában a „címkézett” adatkészlet segítségével betanítjuk a gépeket, és a betanítás alapján a gép előrejelzi a kimenetet. Itt a címkézett adatok azt jelzik, hogy a bemenetek egy része már le van képezve a kimenetre. Még értékesebben mondhatjuk; először betanítjuk a gépet a bemenettel és a megfelelő kimenettel, majd megkérjük a gépet, hogy a tesztadatkészlet segítségével előre jelezze a kimenetet.
Értsük meg a felügyelt tanulást egy példán keresztül. Tegyük fel, hogy van egy bemeneti adatkészletünk macskák és kutyák képeiből. Tehát először is megtanítjuk a gépet a képek megértéséhez, például a macska és kutya farkának alakja és mérete, szem alakja, színe, magassága (a kutyák magasabbak, a macskák kisebbek) stb. A képzés befejezése után beírjuk a macska képét, és megkérjük a gépet, hogy azonosítsa a tárgyat és jósolja meg a kimenetet. Most a gép jól képzett, így ellenőrzi a tárgy összes jellemzőjét, mint például a magasság, az alak, a szín, a szemek, a fülek, a farok stb., és megállapítja, hogy az egy macska. Tehát a Macska kategóriába kerül. Ez az a folyamat, amellyel a gép azonosítja az objektumokat a felügyelt tanulásban.
A felügyelt tanulási technika fő célja a bemeneti változó (x) és a kimeneti változó (y) leképezése. A felügyelt tanulás néhány valós alkalmazása Kockázatértékelés, Csalásfelderítés, Spamszűrés, stb.
A felügyelt gépi tanulás kategóriái
A felügyelt gépi tanulás két problématípusba sorolható, amelyeket az alábbiakban mutatunk be:
a) Osztályozás
Osztályozási algoritmusokat használnak az olyan osztályozási problémák megoldására, amelyekben a kimeneti változó kategorikus, mint pl. Igen vagy nem, Férfi vagy Nő, Piros vagy Kék stb . Az osztályozási algoritmusok előre jelzik az adatkészletben található kategóriákat. Néhány valós példa az osztályozási algoritmusokra Spam észlelés, e-mail szűrés stb.
katódsugárcsöves monitor
Az alábbiakban bemutatunk néhány népszerű osztályozási algoritmust:
b) Regresszió
A regressziós algoritmusokat olyan regressziós problémák megoldására használják, amelyekben lineáris kapcsolat van a bemeneti és kimeneti változók között. Ezeket a folyamatos kimeneti változók előrejelzésére használják, mint például a piaci trendek, az időjárás előrejelzése stb.
Az alábbiakban bemutatunk néhány népszerű regressziós algoritmust:
A felügyelt tanulás előnyei és hátrányai
Előnyök:
- Mivel a felügyelt tanulás a címkézett adatkészlettel dolgozik, így pontos elképzelésünk lehet az objektumok osztályairól.
- Ezek az algoritmusok segítséget nyújtanak a kimenet előrejelzésében a korábbi tapasztalatok alapján.
Hátrányok:
- Ezek az algoritmusok nem képesek bonyolult feladatok megoldására.
- Rossz kimenetet jelezhet előre, ha a tesztadatok eltérnek a betanítási adatoktól.
- Az algoritmus betanítása sok számítási időt igényel.
A felügyelt tanulás alkalmazásai
A felügyelt tanulás néhány gyakori alkalmazása az alábbiakban található:
A képszegmentálás során felügyelt tanulási algoritmusokat használnak. Ebben a folyamatban a képosztályozás különböző képadatokon történik előre meghatározott címkékkel.
A felügyelt algoritmusokat az orvostudományban is használják diagnosztikai célokra. Ezt orvosi képek és múltbeli címkézett adatok felhasználásával végzik, a betegségek állapotára vonatkozó címkékkel. Egy ilyen eljárással a gép képes azonosítani a betegséget az új betegek számára.
2. Felügyelet nélküli gépi tanulás
Felügyelet nélküli tanulás g eltér a felügyelt tanulási technikától; ahogy a neve is sugallja, nincs szükség felügyeletre. Ez azt jelenti, hogy a felügyelet nélküli gépi tanulás során a gépet a címkézetlen adatkészlet használatával képezik ki, és a gép minden felügyelet nélkül előrejelzi a kimenetet.
A felügyelet nélküli tanulás során a modelleket azokkal az adatokkal képezik ki, amelyek nincsenek sem osztályozva, sem címkézve, és a modell ezekre az adatokra felügyelet nélkül hat.
A felügyelet nélküli tanulási algoritmus fő célja a rendezetlen adatkészlet csoportosítása vagy kategorizálása a hasonlóságok, minták és különbségek szerint. A gépek utasítást kapnak, hogy találják meg a rejtett mintákat a bemeneti adatkészletből.
Vegyünk egy példát, hogy jobban megértsük; Tegyük fel, hogy van egy kosár gyümölcsképekből, és bevisszük a gépi tanulási modellbe. A képek a modell számára teljesen ismeretlenek, a gép feladata az objektumok mintáinak, kategóriáinak megtalálása.
Tehát most a gép felfedezi a mintáit és különbségeit, például a színkülönbséget, az alakkülönbséget, és megjósolja a kimenetet, amikor a tesztadatkészlettel tesztelik.
A felügyelt gépi tanulás kategóriái
A felügyelet nélküli tanulás további két típusba sorolható, amelyeket az alábbiakban adunk meg:
1) Klaszterezés
A klaszterezési technikát akkor használjuk, ha meg akarjuk találni az adatokból a benne rejlő csoportokat. Ez egy módja annak, hogy az objektumokat egy klaszterbe csoportosítsák úgy, hogy a legtöbb hasonlósággal rendelkező objektumok egy csoportban maradjanak, és kevésbé vagy egyáltalán nem hasonlóak más csoportok objektumaihoz. A klaszterezési algoritmusra példa a vevők vásárlási magatartásuk szerinti csoportosítása.
Az alábbiakban bemutatunk néhány népszerű klaszterezési algoritmust:
2) Egyesület
Az asszociációs szabályok tanulása egy nem felügyelt tanulási technika, amely érdekes kapcsolatokat talál a változók között egy nagy adathalmazon belül. Ennek a tanulási algoritmusnak az a fő célja, hogy megtalálja egy adatelem függőségét egy másik adatelemtől, és ennek megfelelően leképezi ezeket a változókat, hogy maximális profitot termelhessen. Ezt az algoritmust főleg azokban alkalmazzák Piackosár elemzés, Webhasználat bányászat, folyamatos gyártás stb.
Az asszociációs szabályok tanulásának néhány népszerű algoritmusa Apriori algoritmus, Eclat, FP-növekedési algoritmus.
A felügyelet nélküli tanulási algoritmus előnyei és hátrányai
Előnyök:
- Ezek az algoritmusok a felügyeltekhez képest bonyolult feladatokhoz használhatók, mivel ezek az algoritmusok a címkézetlen adatkészleten dolgoznak.
- A nem felügyelt algoritmusok előnyösebbek különböző feladatokhoz, mivel a címkézetlen adatkészlet beszerzése könnyebb, mint a címkézett adatkészlet.
Hátrányok:
- A nem felügyelt algoritmus kimenete kevésbé pontos lehet, mivel az adatkészlet nincs címkézve, és az algoritmusok nincsenek betanítva az előző pontos kimenettel.
- A felügyelet nélküli tanulással való munka nehezebb, mivel a címkézetlen adatkészlettel működik, amely nem képezi le a kimenetet.
A felügyelet nélküli tanulás alkalmazásai
3. Félig felügyelt tanulás
A félig felügyelt tanulás egyfajta gépi tanulási algoritmus, amely a felügyelt és a nem felügyelt gépi tanulás között helyezkedik el. . Ez jelenti a köztes talajt a felügyelt (címkézett képzési adatokkal) és a nem felügyelt tanulási (címkézett képzési adatok nélkül) algoritmusok között, és a címkézett és címkézetlen adatkészletek kombinációját használja a betanítási időszakban.
A Bár a félig felügyelt tanulás a középút a felügyelt és a nem felügyelt tanulás között, és néhány címkéből álló adatokon működik, többnyire címkézetlen adatokból áll. Mivel a címkék költségesek, de vállalati célokra, előfordulhat, hogy kevés címkét tartalmaznak. Teljesen különbözik a felügyelt és felügyelet nélküli tanulástól, mivel ezek a címkék meglétén és hiányán alapulnak.
A felügyelt tanulás és a nem felügyelt tanulási algoritmusok hátrányainak kiküszöbölésére bevezettük a félig felügyelt tanulás fogalmát. . A félig felügyelt tanulás fő célja az összes rendelkezésre álló adat hatékony felhasználása, nem csak a címkézett adatok, mint a felügyelt tanulás során. Kezdetben a hasonló adatok egy felügyelt tanulási algoritmussal együtt vannak csoportosítva, majd segít a címkézetlen adatok címkézett adatokká címkézésében. Ez azért van, mert a címkézett adatok viszonylag drágábbak, mint a címkézetlen adatok.
Ezeket az algoritmusokat egy példával el tudjuk képzelni. A felügyelt tanulás az, amikor a hallgató egy oktató felügyelete alatt áll otthon és a főiskolán. Továbbá, ha az adott hallgató önelemzi ugyanazt a koncepciót az oktató segítsége nélkül, akkor az felügyelet nélküli tanulás alá esik. A félig felügyelt tanulás során a hallgatónak felül kell vizsgálnia magát, miután egy főiskolai oktató irányítása alatt elemzi ugyanazt a koncepciót.
A félig felügyelt tanulás előnyei és hátrányai
Előnyök:
- Egyszerű és könnyen érthető az algoritmus.
- Nagyon hatékony.
- A felügyelt és nem felügyelt tanulási algoritmusok hátrányainak megoldására szolgál.
Hátrányok:
- Előfordulhat, hogy az iterációk eredményei nem stabilak.
- Ezeket az algoritmusokat nem tudjuk alkalmazni hálózati szintű adatokra.
- A pontosság alacsony.
4. Megerősítő tanulás
A megerősítő tanulás egy visszacsatoláson alapuló folyamaton működik, amelyben egy AI-ügynök (A szoftverkomponens) automatikusan felfedezi a környezetét úgy, hogy nyomon követi, cselekszik, tanul a tapasztalatokból, és javítja a teljesítményét. Az ügynök minden jó akcióért jutalmat kap, és minden rossz akcióért megbüntetik; ezért a megerősítő tanulási ügynök célja a jutalom maximalizálása.
A megerősített tanulásban nincsenek olyan címkézett adatok, mint a felügyelt tanulás, és az ügynökök csak a tapasztalataikból tanulnak.
A megerősítés tanulási folyamata hasonló az emberhez; például a gyermek a mindennapi élet során szerzett tapasztalatok révén különféle dolgokat tanul meg. A megerősítő tanulásra példa egy olyan játék, ahol a játék a környezet, az ügynök lépésenkénti lépései állapotokat határoznak meg, és az ügynök célja a magas pontszám elérése. Az ügynök visszajelzést kap a büntetés és a jutalom tekintetében.
usa hány város
Munkamódszeréből adódóan a megerősítő tanulást különböző területeken alkalmazzák, mint pl Játékelmélet, működéskutatás, információelmélet, többügynök-rendszerek.
Egy megerősítéses tanulási probléma formalizálható a segítségével Markov döntési folyamat (MDP). Az MDP-ben az ügynök folyamatosan interakcióba lép a környezettel és műveleteket hajt végre; minden egyes cselekvésre a környezet reagál és új állapotot generál.
A megerősítő tanulás kategóriái
A megerősítő tanulás alapvetően kétféle módszerre/algoritmusra osztható:
A megerősítő tanulás valós felhasználási esetei
Az RL algoritmusok nagyon népszerűek a játékalkalmazásokban. Emberfeletti teljesítmény elérésére használják. Néhány népszerű játék, amely RL algoritmust használ AlphaGO és AlphaGO Zero .
A „Resource Management with Deep Reforcement Learning” című dokumentum bemutatta, hogyan lehet az RL-t számítógépben használni az automatikus tanuláshoz, és az erőforrások ütemezését a különböző munkákra való várakozásra, hogy minimálisra csökkentsék az átlagos munkalassulást.
Az RL-t széles körben használják a robotikai alkalmazásokban. A robotokat ipari és gyártási területen használják, és ezeket a robotokat megerősítő tanulással teszik erősebbé. Különböző iparágak képzelik el, hogy mesterséges intelligencia és gépi tanulási technológia segítségével intelligens robotokat építsenek.
A szövegbányászatot, az NLP egyik nagyszerű alkalmazását most a Salesforce cég Reinforcement Learning segítségével valósítják meg.
A megerősítéses tanulás előnyei és hátrányai
Előnyök
- Segít olyan összetett valós problémák megoldásában, amelyeket általános technikákkal nehéz megoldani.
- Az RL tanulási modellje hasonló az emberi lények tanulásához; így a legpontosabb eredmények érhetők el.
- Segít a hosszú távú eredmények elérésében.
Hátrány
- Az RL algoritmusokat nem részesítik előnyben egyszerű problémák esetén.
- Az RL algoritmusok hatalmas adatokat és számításokat igényelnek.
- A túl sok megerősített tanulás az állapotok túlterheléséhez vezethet, ami gyengítheti az eredményeket.
A dimenzionalitás átka korlátozza a megerősítő tanulást a valós fizikai rendszerek számára.