Az ellenérdekű keresés olyan keresés, ahol azt a problémát vizsgáljuk, amely akkor merül fel, amikor megpróbálunk a világ előtt tervezni, és más ügynökök terveznek ellenünk.
- Az előző témakörökben azokat a keresési stratégiákat tanulmányoztuk, amelyek csak egyetlen ágenshez kapcsolódnak, és célja a megoldás megtalálása, amely gyakran cselekvési sorozat formájában fejeződik ki.
- De előfordulhatnak olyan helyzetek, amikor egynél több ügynök keresi a megoldást ugyanazon a keresési területen, és ez a helyzet általában játék közben fordul elő.
- Az egynél több ágenssel rendelkező környezetet nak nevezzük többügynök környezet , amelyben minden ügynök egy másik ügynök ellenfele, és egymás ellen játszanak. Minden ügynöknek figyelembe kell vennie a másik ágens tevékenységét és annak hatását a teljesítményére.
- Így, Azokat a kereséseket, amelyek során két vagy több, egymással ütköző céllal rendelkező játékos ugyanazt a keresési teret próbálja feltárni a megoldásért, ellentmondásos keresésnek nevezik, gyakran játékok néven. .
- A játékok keresési problémaként és heurisztikus kiértékelő függvényként vannak modellezve, és ez a két fő tényező, amely segít a játékok modellezésében és megoldásában az AI-ban.
A mesterséges intelligencia játéktípusai:
Meghatározó | Chance Moves | |
---|---|---|
Tökéletes információ | Sakk, dáma, hajrá, Othello | Backgammon, monopólium |
Tökéletlen információ | Csatahajók, vak, tic-tac-toe | Bridge, póker, scrabble, atomháború |
Példa: Backgammon, Monopoly, Póker stb.
Megjegyzés: Ebben a témakörben a determinisztikus játékokat, a teljesen megfigyelhető környezetet, a nulla összeget és azt, hogy az egyes ágensek felváltva működnek-e.
Zéró-összegű játék
- A nulla összegű játékok ellentmondásos keresés, amely tiszta versenyt foglal magában.
- A zéró összegű játékban minden ügynök haszonnyeresége vagy vesztesége pontosan kiegyenlítődik egy másik ügynök hasznosságának veszteségeivel vagy nyereségével.
- A játék egyik játékosa egyetlen értéket próbál maximalizálni, míg a másik játékos megpróbálja minimalizálni.
- A játékban egy játékos minden lépését ply-nek nevezzük.
- A sakk és a tic-tac-toe a nulla összegű játék példái.
Nulla összegű játék: Beágyazott gondolkodás
A nulla összegű játék beágyazott gondolkodást tartalmazott, amelyben az egyik ügynök vagy játékos megpróbálja kitalálni:
- Mit kell tenni.
- Hogyan döntsük el a lépést
- Az ellenfélre is gondolni kell
- Az ellenfél is gondolkodik, mit tegyen
A játékosok mindegyike megpróbálja kideríteni, hogyan reagál az ellenfél tetteire. Ehhez beágyazott gondolkodásra vagy visszamenőleges gondolkodásra van szükség az AI játékproblémáinak megoldásához.
A probléma formalizálása:
A játékot úgy határozhatjuk meg, mint egyfajta keresést az AI-ban, amely a következő elemekből formalizálható:
Játékfa:
A játékfa olyan fa, ahol a fa csomópontjai a játékállapotok, a fa élei pedig a játékosok lépései. A játékfa tartalmazza a kezdeti állapotot, a műveleti funkciót és az eredményfüggvényt.
Példa: Tic-Tac-Toe játékfa:
A következő ábra a tic-tac-toe játék játékfájának egy részét mutatja. Íme néhány kulcsfontosságú pont a játékban:
- Két játékos van MAX és MIN.
- A játékosoknak van egy másik körük, és MAX-mal kezdik.
- A MAX maximalizálja a játékfa eredményét
- A MIN minimalizálja az eredményt.
Példa magyarázat:
- A kezdeti állapottól számítva MAX-nak 9 lehetséges lépése van, mivel először kezd. MAX hely x és MIN hely o, és mindkét játékos felváltva játszik, amíg el nem érünk egy levél csomópontot, ahol az egyik játékosnak három van egy sorban, vagy az összes mező be nem töltődik.
- Mindkét játékos kiszámítja az egyes csomópontokat, a minimax-ot, azt a minimax értéket, amely a legjobb elérhető segédprogram az optimális ellenféllel szemben.
- Tegyük fel, hogy mindkét játékos jól ismeri a tic-tac-toe-t, és a legjobb játékot játssza. Minden játékos mindent megtesz, hogy megakadályozza a másik nyerését. MIN Max ellen lép fel a játékban.
- Tehát a játékfában van egy Max és egy MIN rétegünk, és mindegyik réteg neve: Ply . Max. helyezze el az x-et, majd a MIN beírja az o-t, hogy megakadályozza Max nyerését, és ez a játék a terminál csomópontig folytatódik.
- Ebben vagy MIN nyer, MAX nyer, vagy döntetlen. Ez a játékfa a lehetőségek teljes keresési tere, amelyben MIN és MAX tic-tac-toe-t játszanak, és felváltva váltják egymást.
Ezért a minimax eljárás kontradiktórius keresése a következőképpen működik:
- Célja, hogy megtalálja az optimális stratégiát a MAX számára a játék megnyeréséhez.
- A Mélységben való keresés megközelítését követi.
- A játékfában az optimális levélcsomópont a fa bármely mélységében megjelenhet.
- Addig terjessze a minimax értékeket a fába, amíg a terminálcsomópontot fel nem fedezi.
Egy adott játékfában az egyes csomópontok minimax értékéből határozható meg az optimális stratégia, amit MINIMAX(n)-ként írhatunk fel. A MAX a maximális értékű állapotba, a MIN pedig a minimális értékű állapotba szeretne váltani, majd: