Jocuri celebre repetate
Închide
Articolul precedent
Articolul urmator
472 14
Ultima descărcare din IBN:
2024-03-12 20:10
SM ISO690:2012
LOZAN, Victoria. Jocuri celebre repetate. In: Integrare prin cercetare şi inovare.: Ştiinţe naturale, exacte şi inginereşti , 26-28 septembrie 2013, Chișinău. Chisinau, Republica Moldova: Universitatea de Stat din Moldova, 2013, R, SNEI, pp. 143-145.
EXPORT metadate:
Google Scholar
Crossref
CERIF

DataCite
Dublin Core
Integrare prin cercetare şi inovare.
R, SNEI, 2013
Conferința "Integrare prin cercetare şi inovare"
Chișinău, Moldova, 26-28 septembrie 2013

Jocuri celebre repetate


Pag. 143-145

Lozan Victoria
 
Universitatea de Stat din Moldova
 
Disponibil în IBN: 2 iunie 2020


Rezumat

În diverse situaţii de conflict şi cooperare, sunt implicaţi doar doi decidenţi. Teoria jocurilor studiază o varietate largă de jocuri diadice 2 2× , fiecare dintre ele corespunzând unei game la fel de largi de probleme din viaţa reală. Unele dintre aceste jocuri au devenit celebre. Printre ele sunt jocurile Bătălia Sexelor (BS) şi Dilema Deţinutului (DD). Primele referinţe la BS ţin de anul 1957 şi de lucrarea Games and Decisions: Introduction and Critical Survey, scrisă de R.D. Luce şi H.Raiffa. În BS jucătorii îşi coordonează comportamentul având preferinţe contradictorii: Două persoane de sex opus, El şi Ea, doresc să petreacă o seară în comun, însă au preferinţe diferite în legătură cu locul unde vor să meargă. Ea vrea să meargă la cinema, El – la baschet. Ambii jucători sunt interesaţi de coordonare (fie cinema – cinema, fie baschet – baschet). Un alt joc celebru este DD formulat în 1950 de angajaţii companiei RAND Corporation Merrill Flood şi Melvin Dresher şi desăvârşit de către A.W. Tucker sub forma DD. Se descrie o dilemă socială ca joc de două persoane. Se arată cum pot conduce hotărârile raţionale individuale la rezultate colective neoptime. A.W. Tucker a formalizat jocul sub forma Dilemei Deţinutului: Doi membri ai unei bande criminale: Alan şi John, sunt arestaţi şi închişi. Deţinuţii sunt izolaţi unul de celălalt şi nu au posibilitatea de a comunica. Poliţia nu posedă dovezi suficiente pentru a-i acuza de infracţiunea principală, însă are posibilitatea de a-i condamna la câte un an de detenţie, pe ambii, pentru o infracţiune mai mică. În acelaşi timp, poliţia oferă fiecărui deţinut o negociere Faustiană. Dacă depune mărturii împotriva partenerului său, atunci el este liber, în timp ce celălalt primeşte trei ani de închisoare pentru infracţiunea de bază. Însă există o captură: dacă ambii depun mărturii împotriva celuilalt, atunci fiecare va primi câte doi ani de puşcărie. Rezultatele posibile ale jocurilor descrise mai sus sunt ilustrate în Tab. 1 şi 2. Tabelul 1. Rezultatele posibile în jocul BS  Tabelul 2. Rezultatele posibile în DD În Tabele sunt prezentate pe orizontală strategiile primului jucător, iar pe verticală cele ale jucătorului doi. Fiecare celulă conţine utilităţile obţinute de decidenţii jocului corespunzător în aceeaşi situaţie, separate prin virgulă. Cazul discret este relativ simplu de analizat: pentru BS – soluţia Nash este (cinema, cinema) şi (baschet, baschet) cu câştigurile (4, 3) şi (3, 4), respectiv, şi pentru DD – echilibrul Nash este (mărturiseşte, mărturiseşte) cu câştigurile (2, 2). Un interes deosebit se acordă jocurilor repetate, deoarece în ele apar noi strategii şi noi echilibre. Cercetările de iniţiere au fost efectuate de R.Axelrod (1984) în lucrarea [1] şi ţin de studierea cooperării dintre decidenţi. R.Axelrod organizează anual un turneu în baza jocului DD. Numărul de etape din cadrul turneului este finit. El se desfăşoară între programele de calculator. La a douăzecea aniversare a turneului câştigătorii au fost participanţii de la Universitatea Southampton din Marea Britanie. Rezultatele turneului pot fi vizualizate pe pagina http://www.prisoners-dilemma.com/. În jocurile repetate [2-3] utilităţile jucătorilor pentru secvenţa infinită ( ) ... , ..., , , 10 t zzz se calculează conform formulei: ( ) ( ) ( ) ( ) ( ) ∑ ∞ = =+++++= 0 2210 ... ... t t i tt i t iiii z fzfzfzfzfu δδ δδ , unde () 1 ,0∈ δ , δ − factor de reducere, ( ) ttt yxz ,= − rezultat ce se obţine în perioada t, ( )( ) ( ) ( ) 111100 , ..., , , , , − −= t tt y xyxyxh , ... ,2 ,1=t − o istorie a jocului în perioada de timp t. În jocul repetat DD, sunt posibile 13 strategii de bază: ochi pentru ochi, neîncredere, ciudă, Pavlov, gradual, probant, strategia Southampton, tăinuieşte întotdeauna, mărturiseşte întotdeauna, aleatoriu, periodic sau amical, periodic şi neamical, decide conform majorităţii. Strategia eficientă este considerată ochi pentru ochi – în prima rundă t ăinuieşte faptele (cooperează cu partenerul), iar în perioadele ce urmează copiază mutarea anterioară a partenerului de joc. Însă strategia Southampton oferă rezultate mai bune. Strategiile enumerate pot fi adaptate şi pentru jocul BS, dar pot fi definite şi strategii noi de tipul azi eu – mâine tu – o variantă a strategiei cooperează întotdeauna, adică cooperarea şi satisfacerea pe rând a preferinţelor: I. dacă jocul începe cu strategia (cinema, cinema), se obţin câştigurile: 22 12t2t32 1 3 1 4...34...3434 δ δ δ δδ δδ δ − + − =+++++++= + Eau , 22 12t2t32 1 4 1 3...43...4343 δ δ δ δδ δδ δ − + − =+++++++= + Elu ; II. dacă jocul începe cu strategia (baschet, baschet), se obţin câştigurile: 22 1 4 1 3 δ δ δ − + − =Eau , 2 2 1 3 1 4 δ δ δ − + − =Elu . Când [ ] 99,0 ;01,0∈ δ  câştigurile variază pe segmentele [ ] 350,25 ;03,4 şi [] 349,75 ;04,3 , respectiv – în primul caz şi [ ] 349,75 ;04,3 şi [ ] 350,25 ;03,4 , respectiv – în cazul doi. Se poate concluziona că această strategie oferă aproximativ aceleaşi câştiguri pentru ambii jucători după un număr mare de etape. Abaterea de la strategia azi eu – mâine tu a unuia dintre membrii cuplului duce la pierderea reputaţiei sale şi la micşorarea câştigurilor obţinute. O atenţie deosebită în DD repetat este acordată strategiei ochi pentru ochi. Însă infractorii pot coopera, până când unul se abate de la acordul stabilit anterior, celălalt deja va trăda tot timpul, se joacă strategia ciudă (spite) – este foarte răzbunătoare. Bineînţeles că, cel care trădează, deja nu va mai selecta strategia tăinuieşte, cunoscând consecinţa trădării sale. Se obţine secvenţa: ( ) ( ) ( ) ( ) { ( ) ( )... ,0 ,0 ,0 ,0 ,0 ,1 ,1 ,1 ..., ,1 ,1 ,1 ,1 perioada timpde perioade tt 4 434 421 ( ) ( ) ( ) ( ) { ( ) ( ) ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ ... ,0 ,0 ,0 ,0 ,1 ,0 ,1 ,1 ..., ,1 ,1 ,1 ,1sau  perioada timpde perioade tt 4 434 421  şi câştigurile δ δ δ δ δ δδ δδ δ − ++ − − =+++++++= + ++− 1 23 1 1...223...1 1 t2t1tt1 tt t Alanu ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − + − − = + δ δ δ δ 1 2 1 1 1 tt Alanu , δ δ δ δ δδ δδ − + − − =++++++= + ++− 1 2 1 1...22...1 1 2t1t1 tt t Johnu ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − ++ − − = + δ δ δ δ δ 1 23 1 1 1 t tt Johnu , pentru [] 99,0 ;01,0∈ δ şi ∞ →t se obţin valorile funcţiilor de câştig [] 100 ;01,1 pentru ambii infractori. Ei pot juca, după abatere, strategia ochi pentru ochi. Însă această strategie, după un termen lung de joc, poate duce la blocarea jucătorilor într-o confruntare de durată. După o perioadă îndelungată, ambii aleg pe termen lung strategia vendetta – răzbunare. Strategiile cercetate duc la obţinerea rezultatelor aproximativ egale pentru BS (strategia azi eu – mâine tu) şi egale pentru DD (strategia ciudă). Pentru realizarea câştigurilor maxime, este utilă atât cooperarea, cât şi comportamentul strategic, nu doar în conflictele militare şi afaceri, ci şi în căsătorie şi criminologie.  

DataCite XML Export

<?xml version='1.0' encoding='utf-8'?>
<resource xmlns:xsi='http://www.w3.org/2001/XMLSchema-instance' xmlns='http://datacite.org/schema/kernel-3' xsi:schemaLocation='http://datacite.org/schema/kernel-3 http://schema.datacite.org/meta/kernel-3/metadata.xsd'>
<creators>
<creator>
<creatorName>Lozan, V.</creatorName>
<affiliation>Universitatea de Stat din Moldova, Moldova, Republica</affiliation>
</creator>
</creators>
<titles>
<title xml:lang='ro'>Jocuri celebre repetate</title>
</titles>
<publisher>Instrumentul Bibliometric National</publisher>
<publicationYear>2013</publicationYear>
<relatedIdentifier relatedIdentifierType='ISBN' relationType='IsPartOf'></relatedIdentifier>
<dates>
<date dateType='Issued'>2013</date>
</dates>
<resourceType resourceTypeGeneral='Text'>Conference Paper</resourceType>
<descriptions>
<description xml:lang='ro' descriptionType='Abstract'><p>&Icirc;n diverse situaţii de conflict şi cooperare, sunt implicaţi doar doi decidenţi. Teoria jocurilor studiază o varietate largă de jocuri diadice 2 2&times; , fiecare dintre ele corespunz&acirc;nd unei game la fel de largi de probleme din viaţa reală. Unele dintre aceste jocuri au devenit celebre. Printre ele sunt jocurile Bătălia Sexelor (BS) şi Dilema Deţinutului (DD). Primele referinţe la BS ţin de anul 1957 şi de lucrarea Games and Decisions: Introduction and Critical Survey, scrisă de R.D. Luce şi H.Raiffa. &Icirc;n BS jucătorii &icirc;şi coordonează comportamentul av&acirc;nd preferinţe contradictorii: Două persoane de sex opus, El şi Ea, doresc să petreacă o seară &icirc;n comun, &icirc;nsă au preferinţe diferite &icirc;n legătură cu locul unde vor să meargă. Ea vrea să meargă la cinema, El &ndash; la baschet. Ambii jucători sunt interesaţi de coordonare (fie cinema &ndash; cinema, fie baschet &ndash; baschet). Un alt joc celebru este DD formulat &icirc;n 1950 de angajaţii companiei RAND Corporation Merrill Flood şi Melvin Dresher şi desăv&acirc;rşit de către A.W. Tucker sub forma DD. Se descrie o dilemă socială ca joc de două persoane. Se arată cum pot conduce hotăr&acirc;rile raţionale individuale la rezultate colective neoptime. A.W. Tucker a formalizat jocul sub forma Dilemei Deţinutului: Doi membri ai unei bande criminale: Alan şi John, sunt arestaţi şi &icirc;nchişi. Deţinuţii sunt izolaţi unul de celălalt şi nu au posibilitatea de a comunica. Poliţia nu posedă dovezi suficiente pentru a-i acuza de infracţiunea principală, &icirc;nsă are posibilitatea de a-i condamna la c&acirc;te un an de detenţie, pe ambii, pentru o infracţiune mai mică. &Icirc;n acelaşi timp, poliţia oferă fiecărui deţinut o negociere Faustiană. Dacă depune mărturii &icirc;mpotriva partenerului său, atunci el este liber, &icirc;n timp ce celălalt primeşte trei ani de &icirc;nchisoare pentru infracţiunea de bază. &Icirc;nsă există o captură: dacă ambii depun mărturii &icirc;mpotriva celuilalt, atunci fiecare va primi c&acirc;te doi ani de puşcărie. Rezultatele posibile ale jocurilor descrise mai sus sunt ilustrate &icirc;n Tab. 1 şi 2. Tabelul 1. Rezultatele posibile &icirc;n jocul BS&nbsp; Tabelul 2. Rezultatele posibile &icirc;n DD &Icirc;n Tabele sunt prezentate pe orizontală strategiile primului jucător, iar pe verticală cele ale jucătorului doi. Fiecare celulă conţine utilităţile obţinute de decidenţii jocului corespunzător &icirc;n aceeaşi situaţie, separate prin virgulă.&nbsp;Cazul discret este relativ simplu de analizat: pentru BS &ndash; soluţia Nash este (cinema, cinema) şi (baschet, baschet) cu c&acirc;ştigurile (4, 3) şi (3, 4), respectiv, şi pentru DD &ndash; echilibrul Nash este (mărturiseşte, mărturiseşte) cu c&acirc;ştigurile (2, 2). Un interes deosebit se acordă jocurilor repetate, deoarece &icirc;n ele apar noi strategii şi noi echilibre. Cercetările de iniţiere au fost efectuate de R.Axelrod (1984) &icirc;n lucrarea [1] şi ţin de studierea cooperării dintre decidenţi. R.Axelrod organizează anual un turneu &icirc;n baza jocului DD. Numărul de etape din cadrul turneului este finit. El se desfăşoară &icirc;ntre programele de calculator. La a douăzecea aniversare a turneului c&acirc;ştigătorii au fost participanţii de la Universitatea Southampton din Marea Britanie. Rezultatele turneului pot fi vizualizate pe pagina http://www.prisoners-dilemma.com/. &Icirc;n jocurile repetate [2-3] utilităţile jucătorilor pentru secvenţa infinită ( ) ... , ..., , , 10 t zzz se calculează conform formulei: ( ) ( ) ( ) ( ) ( ) &sum; &infin; = =+++++= 0 2210 ... ... t t i tt i t iiii z fzfzfzfzfu &delta;&delta; &delta;&delta; , unde () 1 ,0&isin; &delta; , &delta; &minus; factor de reducere, ( ) ttt yxz ,= &minus; rezultat ce se obţine &icirc;n perioada t, ( )( ) ( ) ( ) 111100 , ..., , , , , &minus; &minus;= t tt y xyxyxh , ... ,2 ,1=t &minus; o istorie a jocului &icirc;n perioada de timp t. &Icirc;n jocul repetat DD, sunt posibile 13 strategii de bază: ochi pentru ochi, ne&icirc;ncredere, ciudă, Pavlov, gradual, probant, strategia Southampton, tăinuieşte &icirc;ntotdeauna, mărturiseşte &icirc;ntotdeauna, aleatoriu, periodic sau amical, periodic şi neamical, decide conform majorităţii. Strategia eficientă este considerată ochi pentru ochi &ndash; &icirc;n prima rundă t ăinuieşte faptele (cooperează cu partenerul), iar &icirc;n perioadele ce urmează copiază mutarea anterioară a partenerului de joc. &Icirc;nsă strategia Southampton oferă rezultate mai bune. Strategiile enumerate pot fi adaptate şi pentru jocul BS, dar pot fi definite şi strategii noi de tipul azi eu &ndash; m&acirc;ine tu &ndash; o variantă a strategiei cooperează &icirc;ntotdeauna, adică cooperarea şi satisfacerea pe r&acirc;nd a preferinţelor: I. dacă jocul &icirc;ncepe cu strategia (cinema, cinema), se obţin c&acirc;ştigurile: 22 12t2t32 1 3 1 4...34...3434 &delta; &delta; &delta; &delta;&delta; &delta;&delta; &delta; &minus; + &minus; =+++++++= + Eau , 22 12t2t32 1 4 1 3...43...4343 &delta; &delta; &delta; &delta;&delta; &delta;&delta; &delta; &minus; + &minus; =+++++++= + Elu ; II. dacă jocul &icirc;ncepe cu strategia (baschet, baschet), se obţin c&acirc;ştigurile: 22 1 4 1 3 &delta; &delta; &delta; &minus; + &minus; =Eau , 2 2 1 3 1 4 &delta; &delta; &delta; &minus; + &minus; =Elu . C&acirc;nd [ ] 99,0 ;01,0&isin; &delta; &nbsp;c&acirc;ştigurile variază pe segmentele [ ] 350,25 ;03,4 şi [] 349,75 ;04,3 , respectiv &ndash; &icirc;n primul caz şi [ ] 349,75 ;04,3 şi [ ] 350,25 ;03,4 , respectiv &ndash; &icirc;n cazul doi. Se poate concluziona că această strategie oferă aproximativ aceleaşi c&acirc;ştiguri pentru ambii jucători după un număr mare de etape. Abaterea de la strategia azi eu &ndash; m&acirc;ine tu a unuia dintre membrii cuplului duce la pierderea reputaţiei sale şi la micşorarea c&acirc;ştigurilor obţinute. O atenţie deosebită &icirc;n DD repetat este acordată strategiei ochi pentru ochi. &Icirc;nsă infractorii pot coopera, p&acirc;nă c&acirc;nd unul se abate de la acordul stabilit anterior, celălalt deja va trăda tot timpul, se joacă strategia ciudă (spite) &ndash; este foarte răzbunătoare. Bine&icirc;nţeles că, cel care trădează, deja nu va mai selecta strategia tăinuieşte, cunosc&acirc;nd consecinţa trădării sale. Se obţine secvenţa: ( ) ( ) ( ) ( ) { ( ) ( )... ,0 ,0 ,0 ,0 ,0 ,1 ,1 ,1 ..., ,1 ,1 ,1 ,1 perioada timpde perioade tt 4 434 421 ( ) ( ) ( ) ( ) { ( ) ( ) ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ ... ,0 ,0 ,0 ,0 ,1 ,0 ,1 ,1 ..., ,1 ,1 ,1 ,1sau&nbsp; perioada timpde perioade tt 4 434 421 &nbsp;şi c&acirc;ştigurile &delta; &delta; &delta; &delta; &delta; &delta;&delta; &delta;&delta; &delta; &minus; ++ &minus; &minus; =+++++++= + ++&minus; 1 23 1 1...223...1 1 t2t1tt1 tt t Alanu ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ &minus; + &minus; &minus; = + &delta; &delta; &delta; &delta; 1 2 1 1 1 tt Alanu , &delta; &delta; &delta; &delta; &delta;&delta; &delta;&delta; &minus; + &minus; &minus; =++++++= + ++&minus; 1 2 1 1...22...1 1 2t1t1 tt t Johnu ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ &minus; ++ &minus; &minus; = + &delta; &delta; &delta; &delta; &delta; 1 23 1 1 1 t tt Johnu , pentru [] 99,0 ;01,0&isin; &delta; şi &infin; &rarr;t se obţin valorile funcţiilor de c&acirc;ştig [] 100 ;01,1 pentru ambii infractori. Ei pot juca, după abatere, strategia ochi pentru ochi. &Icirc;nsă această strategie, după un termen lung de joc, poate duce la blocarea jucătorilor &icirc;ntr-o confruntare de durată. După o perioadă &icirc;ndelungată, ambii aleg pe termen lung strategia vendetta &ndash; răzbunare. Strategiile cercetate duc la obţinerea rezultatelor aproximativ egale pentru BS (strategia azi eu &ndash; m&acirc;ine tu) şi egale pentru DD (strategia ciudă). Pentru realizarea c&acirc;ştigurilor maxime, este utilă at&acirc;t cooperarea, c&acirc;t şi comportamentul strategic, nu doar &icirc;n conflictele militare şi afaceri, ci şi &icirc;n căsătorie şi criminologie. &nbsp;</p></description>
</descriptions>
<formats>
<format>application/pdf</format>
</formats>
</resource>