Tip:
Highlight text to annotate it
X
Va fi benefica introducerea unei terminologii de baza
care este frecvent utilizata in inteligenta artificiala pentru a distinge diferite tipuri de probleme.
Primul cuvant care vi-l voi invata este complet vs. partial observabil.
Un mediu se numeste complet observabil daca ceea ce agentul vostru percepe
in orice moment de timp este complet suficient pentru a lua decizia optima.
De exemplu, in multe jocuri de carti,
cand toate cartile sunt pe masa, situatia momentana al tuturor acelor carti
este intradevar suficienta pentru a face alegerea optima.
Acesta este in contrast cu unele medii unde ai nevoie de memorie
de partea agentului pentru a putea alege cea mai buna decizie posibila.
De exemplu, in jocul de poker, cartile nu sunt la vedere pe masa,
memorizarea mutarilor anterioare te va ajuta in luarea unei decizii mai bune.
Pentru a intelege complet diferenta, consideram interactiunea unui agent
cu mediul prin senzori si actuatori,
aceasta interactiune se intampla de-a lungul multor cicluri,
adesea numite cicluri perceptie-actiune.
Pentru multe medii, este convenabil de presupus
ca mediul are un fel de stare interna.
De exemplu, in jocul de carti unde cartile nu sunt la vedere pe masa,
starea s-ar putea referi la cartile din mana.
Un mediu este complet observabil daca senzorii pot vedea intotdeauna
intreaga stare a mediului.
Este partial observabil daca senzorii pot vedea parti ale starii,
in plus memorizarea masuratorilor anterioare ne dau informatii aditionale despre starea
care nu este usor observabila momentan.
Deci orice joc, de exemplu, unde mutarile anterioare contin informatii despre
ceea ce ar putea fi in mana persoanei, sunt jocuri partial observabile,
si ele necesita o adordare diferita.
Adesea agentii care au de-a face cu medii partial observabile
au nevoie de memorie interna pentru a intelege ce
stare a mediului este, si vom vorbi extensiv
cand vorbim despre modele Markov ascunse, despre *** aceasta structura
are o astfel de memorie interna.
A doua terminologie pentru medii se refera la faptul ca mediul
este deterministic sau stohastic.
Mediu deterministic este unul unde actiunile agentului tau
determina in mod unic rezultatul.
Deci, de exemplu, in sah, nu exista cu adevarat mutare intamplatoare cand tu muti o piesa.
Efectul mutarii unei piese este complet predeterminat,
si nu conteaza unde mut aceasi piesa, continuarea este aceasi.
Acesta este ceea ce numin deterministic.
Jocurile cu zaruri, de exemplu tablele, sunt stohastice.
In timp ce-ti poti muta piesele deterministic
rezultatul unei actiuni de asemenea implica aruncarea zarurilor,
si nu poti prezice acelea.
Exista implicata o anumita cantitate de intamplare pentru rezultatul zarurilor,
si prin urmare, vom numi aceasta stohastic.
Dati-mi voie sa vorbesc despre discret vs. continuu.
Un mediu discret este unul unde avem la alegere un numar finit de actiuni,
si un numar finit de ceea ce poti percepe.
Deci, de exemplu, in sah, din nou, exista un numar finit de pozitii ale tablei,
si un numar finit de lucruri pe care le poti face.
Acesta este diferit de un mediu continuu
unde spatiul posibilitatilor de actiune sau al lucrurilor pe care le poti percepe poate fi infinit.
Deci, de exemplu, daca arunci darturi, exista o infinitate de posibilitati de a inclina dartul
sau de al accelera.
In sfarsit, distingem medii benign vs. adversariale.
In medii benigne, mediul poate fi intamplator.
Poate fi stohastic, dar nu are obiective proprii
care contrazic obiectivul propriu.
Deci, de exemplu, vremea este benigna.
Poate fi intamplatoare. Poate afecta rezultatele actiunilor tale.
Dar nu este cu adevarat acolo pentru a te prinde.
Pune fata-n fata aceasta cu mediile adversariale, *** ar fi multe jocuri, ca sahul,
unde oponentul tau este intradevar acolo sa te prinda.
Se pare ca este mult mai greu sa gasesti actiuni bune in medii adversariale
unde oponentul te urmareste activ si contracareaza ceea ce tu incerci sa ajungi
in raport cu mediul benign, unde mediul poate fi pur si simplu stocastice
dar nu este cu adevarat interesat sa-ti faca viata amara.
Asa ca, haideti sa vedem in ce masura aceste expresii au sens pentru tine
mergand la urmatorul chestionar.
Deci avem aici, din nou, cele 4 concepte: partial observabil vs. complet observabil,
stohastic vs. deterministic, continuu vs. discret,
adversarial vs. benign.
Si permiteti-mi sa va intreb despre jocul de dame.
Bifati una sau toate acele atribute care sunt valabile.
Deci, daca consideri ca damele sunt partial observabile, bifeaza aceasta.
In caz contrar, nu o bifa.
Daca consideri ca este stohastic, bifeaza aceasta,
continuu, bifeaza aceasta, adversarial, bifeaza aceasta.
Daca nu cunoasteti jocul de dame, puteti cauta pe web si in Google
pentru a gasi un pic mai multa informatie despre dame.