logo

Felügyelet nélküli gépi tanulás

Az előző témakörben megtanultuk a felügyelt gépi tanulást, amelyben a modelleket címkézett adatok felhasználásával tanítják a betanítási adatok felügyelete mellett. De sok esetben előfordulhat, hogy nem rendelkezünk címkézett adatokkal, és meg kell találnunk a rejtett mintákat az adott adatkészletből. Tehát az ilyen típusú esetek megoldásához a gépi tanulásban felügyelet nélküli tanulási technikákra van szükségünk.

Mi az a felügyelet nélküli tanulás?

Ahogy a neve is sugallja, a felügyelet nélküli tanulás egy gépi tanulási technika, amelyben a modelleket nem felügyelik betanítási adatkészlet segítségével. Ehelyett a modellek maguk találják meg a rejtett mintákat és betekintést az adott adatokból. Összehasonlítható a tanulással, amely az emberi agyban megy végbe, miközben új dolgokat tanul. A következőképpen határozható meg:

számoljon külön sql-t
A felügyelet nélküli tanulás a gépi tanulás egy olyan típusa, amelyben a modelleket címkézetlen adatkészletek segítségével képezik ki, és felügyelet nélkül kezelhetik ezeket az adatokat.

A nem felügyelt tanulást nem lehet közvetlenül alkalmazni egy regressziós vagy osztályozási problémára, mert a felügyelt tanulással ellentétben rendelkezésünkre állnak a bemeneti adatok, de nincsenek megfelelő kimeneti adatok. A felügyelet nélküli tanulás célja az keresse meg az adatkészlet mögöttes szerkezetét, csoportosítsa az adatokat a hasonlóságok szerint, és ábrázolja az adatkészletet tömörített formátumban .

Példa: Tegyük fel, hogy a felügyelet nélküli tanulási algoritmus kap egy bemeneti adatkészletet, amely különböző típusú macskák és kutyák képeit tartalmazza. Az algoritmust soha nem tanítják az adott adatkészletre, ami azt jelenti, hogy fogalma sincs az adatkészlet jellemzőiről. A felügyelet nélküli tanulási algoritmus feladata a képi jellemzők önmagukban történő azonosítása. A felügyelt tanulási algoritmus ezt a feladatot úgy hajtja végre, hogy a képadatkészletet csoportokba csoportosítja a képek közötti hasonlóságok szerint.

Felügyelt gépi tanulás

Miért használja a felügyelet nélküli tanulást?

Az alábbiakban felsorolunk néhány fő okot, amelyek leírják a felügyelet nélküli tanulás fontosságát:

  • A felügyelet nélküli tanulás segít hasznos betekintést nyerni az adatokból.
  • A felügyelet nélküli tanulás sokban hasonlít ahhoz, ahogy az ember saját tapasztalatai alapján tanul meg gondolkodni, ami közelebb teszi a valódi mesterséges intelligenciához.
  • A felügyelet nélküli tanulás címkézetlen és kategorizálatlan adatokon működik, ami még fontosabbá teszi a felügyelet nélküli tanulást.
  • A való világban nem mindig rendelkezünk bemeneti adatokkal a megfelelő kimenettel, így az ilyen esetek megoldásához felügyelet nélküli tanulásra van szükség.

A felügyelet nélküli tanulás munkája

A felügyelet nélküli tanulás működése az alábbi ábrán értelmezhető:

Felügyelt gépi tanulás

Itt egy címkézetlen bemeneti adatot vettünk, ami azt jelenti, hogy nincs kategorizálva, és a megfelelő kimenetek sincsenek megadva. Most ezeket a címkézetlen bemeneti adatokat betápláljuk a gépi tanulási modellbe annak betanítása érdekében. Először is értelmezi a nyers adatokat, hogy megtalálja a rejtett mintákat az adatokból, majd megfelelő algoritmusokat alkalmaz, mint például a k-means klaszterezés, a döntési fa stb.

A megfelelő algoritmus alkalmazása után az algoritmus csoportokra osztja az adatobjektumokat az objektumok közötti hasonlóságok és különbségek szerint.

A nem felügyelt tanulási algoritmusok típusai:

A felügyelet nélküli tanulási algoritmus további két típusú probléma kategóriába sorolható:

fájlrendszer Linux alatt
Felügyelt gépi tanulás
    Klaszterezés: A klaszterezés az objektumok fürtökbe történő csoportosításának módszere úgy, hogy a legtöbb hasonlósággal rendelkező objektumok egy csoportban maradnak, és kevésbé vagy egyáltalán nem hasonlóak egy másik csoport objektumaihoz. A fürtelemzés megtalálja az adatobjektumok közötti közös vonásokat, és kategorizálja azokat a közös jellemzők megléte és hiánya szerint.Egyesület: Az asszociációs szabály egy nem felügyelt tanulási módszer, amelyet a változók közötti kapcsolatok megtalálására használnak a nagy adatbázisban. Meghatározza az adatkészletben együtt előforduló elemek halmazát. Az asszociációs szabály hatékonyabbá teszi a marketingstratégiát. Például azok, akik X terméket vásárolnak (tegyük fel, hogy egy kenyeret), hajlamosak Y (vaj/lekvár) terméket is vásárolni. Az asszociációs szabály tipikus példája a piaci kosárelemzés.

Megjegyzés: Ezeket az algoritmusokat a későbbi fejezetekben fogjuk megtanulni.

Felügyelet nélküli tanulási algoritmusok:

Az alábbiakban felsorolunk néhány népszerű, felügyelt tanulási algoritmust:

    A K-csoportosulást jelent KNN (k-legközelebbi szomszédok) Hierarchikus klaszterezés Anomália észlelése Neurális hálózatok Alapelem-elemzés Független komponenselemzés Apriori algoritmus Szinguláris érték felbontás

A felügyelet nélküli tanulás előnyei

  • A felügyelt tanuláshoz képest összetettebb feladatokhoz használjuk a felügyelet nélküli tanulást, mivel a felügyelet nélküli tanulás során nem rendelkezünk címkézett bemeneti adatokkal.
  • A felügyelet nélküli tanulás előnyösebb, mivel a címkézett adatokkal összehasonlítva könnyen lehet címkézetlen adatokat szerezni.

A felügyelet nélküli tanulás hátrányai

  • A felügyelet nélküli tanulás alapvetően nehezebb, mint a felügyelt tanulás, mivel nincs megfelelő kimenete.
  • A felügyelet nélküli tanulási algoritmus eredménye kevésbé pontos lehet, mivel a bemeneti adatok nincsenek címkézve, és az algoritmusok nem ismerik előre a pontos kimenetet.