Geskryf deur: CB Garcia en WI Zangwill

Professor in bestuurswetenskap aan die Booth School of Business (albei afgetree)

Hersien Augustus 18, 2018 van (Garcia en Zangwill [8, 9]).

Sleutelwoorde: Spelteorie, gevangene se dilemma, Bayesiaanse, subjektiewe waarskynlikhede

Abstract: Von Neumann en Morgenstern (VNM), met behulp van die verwagte nutshypotese, het die fundamentele formulering van die spelteorie-probleem verskaf. Tot op hierdie punt was dit egter moeilik om die formulering op te los sonder om addisionele aannames op te lê. Nash moes aanvaar dat die spelers ontkoppel is, sodat die waarskynlikheid dat speler A sou optree, onafhanklik was van die waarskynlikheid dat speler B sou optree. In hierdie artikel skakel ons die aannames van Nash uit, insluitend die aanname dat spelers se strategieë algemene kennis is, en stel ons 'n model voor wat volledig gelykstaande is aan die algemene VNM-probleem. Ons maklik oplosbare formulering elimineer sommige van die inherente probleme met die Nash-benadering, wat dikwels teenstrydige en teen-intuïtiewe resultate opgelewer het, soos die gevangene se dilemma, die hoenderwedstryd, die paradoks van Newcomb, die jag van jag en baie ander speletjies. Byvoorbeeld, deur Nash se onderlinge onafhanklikheidsaanvaarding in die dilemma van die gevangene te laat vaar, demonstreer ons model dat die spelers in staat is om superieure vergoedings te behaal, en om dit te bereik, hoef hulle nie samewerkend te speel of te kommunikeer nie, maar bloot die stelling van Bayes toe te pas in die styl van (Harsanyi [10]; Kadane en Larkey [11]). Ons benadering verdeel die waarskynlikheidsruimte in twee halwe ruimtes of streke, waarvan die relatiewe grootte afhang van die uitbetalings. Nou hoef 'n mens nie die waarskynlikheid presies te skat nie, maar slegs te bepaal in watter streek dit is. Dit bied aansienlike voordele, want as die een streek aansienlik groter is as die ander, lewer dit onmiddellik 'n aansienlike insig oor hoe om die spel te speel. Ons algemene oplossing, wat nie gekorreleer is nie, sê in die sin van Aumann [1], bevat die Nash-ewewig as spesifieke oplossings. In teenstelling met die beskrywende Nash-oplossings, is ons oplossing 'n voorskriftelike paar suiwer strategieë met rasionele verwagtinge, wat 'n nuwe basis bied vir spelteorie. Ons brei ons benadering tot algemene M-Person-speletjies uit, soos ons dit illustreer in die spel met 'n skêr-papier-skêr en die probleem met die kroeë.

Opsomming van die resultate.

Ons gee nou 'n opsomming van die resultate, gebaseer op die besonderhede en eksplisiete uitbetalings hieronder. Ons glo dat hierdie resultate die waarde van ons benadering tot onderrig en navorsing toon, aangesien die resultate dikwels nuwe oplossings bied.

Koördinasiespel: Die Nash-aanname van onafhanklikheid mis die beter Bayes-benadering wat ons gebruik. Vir die onderstaande uitbetalings, speel die eerste strategie as u meen dat die teenstander se waarskynlikheid om sy eerste strategie te speel, ten minste 1 / 3 is, anders speel die tweede strategie. Nash bied geen insigte oor wanneer om watter strategie toe te pas nie. As die uitbetalings ook verander word, bied ons benadering hersiene waarskynlikhede. Slag van die geslagte: Twee partye verskil oor waarheen hulle moet gaan, maar mag nie kommunikeer nie. Albei partye kry 'n goeie uitbetaling as hulle na dieselfde keuse gaan, aangesien hulle ten minste albei saam is. 'N Gepaste party kry 'n bonus as hulle altwee na die party se keuse gaan. Nie een van die goedere sal betaal as hulle op verskillende plekke gaan nie. Gegewe die onderstaande uitbetalings, moet speler A die gewenste strategie speel as hy glo dat die ander speler ook die gewenste keuse van A sal kies, met 'n waarskynlikheid van minstens 33%. In teenstelling hiermee bied Nash drie ewewigte sonder enige insig om te speel wanneer en sonder die ontleding van die waarskynlikhede. Passende pennies: Twee spelers, Even en Odd, onthul gelyktydig 'n sent. As die pennies ooreenstem, hou Even albei pennies; anders hou Odd albei pennies. Die unieke Nash-ewewig vir hierdie nul-som-spel is dat albei spelers lukraak speel. Gegewe die onderstaande uitbetalings, moet Even hoofde speel as hy glo dat Odd hoofde sal speel met 'n waarskynlikheid van minstens 50%. Aan die ander kant moet Odd koppe speel as hy glo dat Even hoofde sal speel met 'n waarskynlikheid van hoogstens 50%. Hoenderwedstryd: Twee motors ry vinnig na mekaar en is op die punt om 'n kopkraak te kry. Nash stel voor dat die een motor moet swaai en die ander een moet reguit gaan, maar bied min insig in wat moet swaai. Gegewe die onderstaande uitbetalings, stel ons benadering voor dat u moet swaai as u glo dat die teenstander sal swaai met 'n waarskynlikheid van hoogstens 90%, anders gaan dit reguit. Let hier op dat albei spelers wat swaai (of albei reguit gaan) nie 'n Nash-ewewig is nie, maar dat albei spelers wat swaai (of albei reguit gaan) in die verwagting dat die teenstander reguit sal gaan (of swaai), 'n ewewigscenario is. As die uitbetalings verander word, bied ons benadering opgedateerde waarskynlikhede. Wapenwedloop: elke land hou aanvanklik wapens op, sodat dit nie aangeval kan word nie. Maar soos hieronder getoon, is die afnemende opbrengste van die opslag van wapens realiseer, wat 'n geleentheid bied vir 'n vredesverdrag. Nash identifiseer nie die geleentheid vir die vredesverdrag nie. Staanjag: jag jag as u glo dat die teenstander met 'n waarskynlikheid van ten minste 50% soos jag sal jag, anders jag haas. (Die suiwer Nash-ewewig is vir albei om takbok te jag, of vir albei om haas te jag). Newcomb se probleem: as Newcomb se probleem as 'n gevangene-dilemma gestel word, kan die oplossing van Newcomb se probleem op twee maniere gevind word: as die nie-samewerkende Nash-ewewig met behulp van die oorheersingsbeginsel, of as 'n koöperatiewe oplossing met behulp van die verwagte nutshypotese. Rots-papier-skêr-spel: die Nash-ewewig is om u willekeurig met 'n 3-sy te speel. Wat 'n nuwe strategie vir hierdie antieke spel lyk, is dat u rock moet speel as u glo dat u teenstander papier sal speel met 'n waarskynlikheid van hoogstens 33% en 'n skêr met 'n waarskynlikheid van minstens 33%; om papier te speel as u glo dat u teenstander 'n skêr sal speel met 'n waarskynlikheid van hoogstens 33% en rock met 'n waarskynlikheid van minstens 33%; anders om skêr te speel. (Ons benadering kan u help om te sê, u het gegewens oor u vorige toneelstukke van u teenstander.) Bar-stamp-spel het 3-vriende A, B en C: elkeen wat alleen na die kroeg gaan, kry niks - om tuis te bly is 'n beter keuse. As twee vriende na die kroeg gaan, is dit die beste opsie. As al drie gaan, gooi die kroeg al drie uit. Die Nash-ewewig is vir almal om tuis te bly, of vir almal om hul eerste strategie te speel met 'n waarskynlikheid gelyk aan 33%. Maar as u enige insig in u vriende het en die Bayes-waarskynlikheid van hul gedrag kan skat, kan ons strategie help.

Ons brei ook ons ​​benadering tot die M-person-spel uit en verkry soortgelyke insigte. Ons wys byvoorbeeld die volledige oplossing vir algemene 2-persoon-speletjies en algemene 3-persone x 2-strategie-speletjies.

Die verwagte nutshypotese.

In 'n 2-persoon-speletjie, moet spelers A en B 2-strategieë hê: A1 of A2 vir speler A, en B1 of B2 vir speler B.

Die basis vir verwagte nutsteorie is die von Neumann - Morgenstern nutstelling (von Neumann en Morgenstern [20]): laat Aij en Bij die uitbetalings wees vir spelers A en B onderskeidelik as speler A speel Ai en speler B speel Bj, vir i , j = 1 of 2. Die verwagte nutshypotese lui dat spelers A en B hul verwagte uitbetalings moet maksimeer1:

waar pA (Ai en Bj) speler A is, is die waarskynlikheid dat A speel Ai en B speel Bj, en net so vir speler B.

Voorwaardelike waarskynlikhede[1].

Vir ons benadering, ons val Nash se aanname dat spelers se waarskynlikhede wedersyds onafhanklik is. Dit laat ons probleem (1) meer algemeen wees en meer oplossings kry wat aan die verwagte nutshipotese voldoen.

Laat EP (A | Ai) en EP (B | Bj) die verwagte uitbetalings wees[2],[3] van A en B onderskeidelik gegee dat A speel Ai en B speel Bj, vir i, j = 1, 2:

Laat ons begin met die bewys van 'n elementêre “Bayesiese” stelling van speletjies wat die ekwivalensie van ons benadering tot die VNM-formulering demonstreer:

Stelling 1[5]. Probleme (3) hieronder is gelykstaande aan probleme (1)[6]:

Bewys. Deur die stelling van Bayes,

Dan,

Die maksimum[7] van bogenoemde vergelyking is pA (A1) = 1 (dit wil sê, speelstrategie A1) as EP (A | A1) ≥ EP (A | A2), of pA (A1) = 0 (dit wil sê, speel strategie A2) as EP ( A | A1) EP (A | A2). Vandaar (3) geld vir speler A. 'n Soortgelyke argument geld vir speler BQED

VNM-streke.

Definieer die VNM-streke A1 en A2 om die konvekse polytope te wees:

Soos hieronder getoon, moet A strategie A1 speel as dit verwag dat B in streek A1 sal wees. Andersins, moet A A2 speel. Die ewewigslyn

skei die waarskynlikheidsruimte in die twee streke en bied 'n visueel nuttige manier om die situasie te ontleed[8].

Belangrikheid van die streke: die twee streke is prakties belangrik, aangesien 'n mens nou nie die waarskynlikheid hoef presies te skat nie, maar slegs bepaal watter van die twee streke dit is. Dikwels sal gesien word dat die waarskynlike kans waarskynlik in een streek sal wees. , en die identifisering van daardie streek is voldoende inligting om die toepaslike speletjie voor te stel. Gestel byvoorbeeld dat streek A1 aansienlik groter is as die ander, so die waarskynlikheid is waarskynlik in daardie streek A1. Dit bied dwingende inligting dat speler A waarskynlik A1 sal speel.

Analoog vir B:

Die VNM-streke is afhanklik van die verspreiding van die waarskynlike verspreiding van die spelers, dikwels bloot die voorafgaande genoem (Jaynes [13]; Harsanyi [10]; Kadane en Larkey [11]), wat die spelers se uitdrukking gee van oortuigings oor die waarskynlikheidsverspreiding van hul teenstander. [9]

Corollary 2. Gegee (3), speel A strategie A1 indien en slegs as hy verwag dat speler B in die VNM-streek A1 sal wees. Andersins, A speel strategie A2. Net so speel B strategie B1 as en slegs as hy verwag dat speler A in die VNM-streek B1 sal wees. Anders, B speel strategie B2.

Bewys. EP (A | A1) ≥ EP (A | A2) indien en slegs as A11 pA (B1 | A1) + A12 pA (B2 | A1) ≥ A21 pA (B1 | A2) + A22 pA (B2 | A2) indien en slegs indien (A11 - A12) pA (B1 | A1) + (A21 - A22) pA (B2 | A2) + A12 - A21 ≥ 0.

Net so is EP (B | B1) ≥ EP (B | B2) indien en slegs as B11 pB (A1 | B1) + B21 pB (A2 | B1) ≥ B12 pB (A1 | B2)

+ B22 pB (A2 | B2) indien en slegs indien (B11 - B21) pB (A1 | B1) + (B12 - B22) pB (A2 | B2) + B21 - B12 ≥ 0. QED

Van stelling 1 en Corollary 2, vir punte in die streke (5) en (7), geld die verwagte nutshypotese, dit wil sê, die VNM-streke definieer die algemene oplossing vir die 2-persoon-spel[10].

Nash ewewig.

As die waarskynlikhede van die spelers onderling onafhanklik is, vereenvoudig die VNM-streke om:

Voorstel 3. Gestel 'n Nash-ewewig (p (A1), p (B1)) is in VNM-streek Ai en VNM-streek Bj, vir sommige i, j = 1, 2. Dan sal speler A strategie Ai speel en speler B strategie speel

BJ.

Bewys. Nash se ewewigsprobleem is probleem (1), waar pA (Ai en Bj) = pB (Ai en Bj) = p (Ai) p (Bj), of probleem (3), waar pA (Bj | Ai) = p (Bj ) en pB (Ai | Bj) = p (Ai), vir i, j = 1, 2. Dus hou Corollary 2, waar VNM-streke gedefinieër word deur (8), vir pA (B1) = p (B1) en pB (A1) = p (A1). QED

Onthou dat die ewewigsvergelykings

skei die VNM-streke, en gee sodoende die algemene oplossing vir enige spel. Dieselfde ewewigsvergelykings, waar pB (A1) = p (A1) en pA (B1) = p (B1), lewer die gemengde Nash-ewewig11, soos getoon in die onderstaande tabel.

Voorstel 4. Gegee enige speletjie A = [[A11, A12], [A21, A22]] en B = [[B11, B12], [B21, B22]], word die Nash-ewewig vir die spel bereken uit die toepaslike ry van Tabel 112.

Bewys. Let op dat (i, j) 'n suiwer Nash-ewewig is en slegs indien sgn (2i - 1) * (A11 - A21)> 0 en sgn (2j - 1) * (B11 - B12)> 0, vir i, j = 0, 1. Gebruik hierdie feit vir elke ry in Tabel 1, lys ons al die pare (i, j) wat suiwer Nash-ewewig is.

Laastens, vir die paar (a, b) wat deur (9) gedefinieër is om 'n gemengde Nash-ewewig te wees, hoef ons slegs aan te toon dat 0 <a <1 en 0 <b <1. Maar let op dat vir rye 6, 7, 10 en 11 van Tabel 1, die teller en noemer van a, 1 - a, b of 1 - b beide positief of beide negatief is; vandaar a, 1 - a, b, 1 - b is almal groter as 0. QED

Iterated Dominance Voorbeeld[13].

Laat A = [[2, 2], [3, 1]] en B = [[0, 1], [0, 2]]. “Speel A1 & B2” is die Nash-ewewig.

Voorstel 5. Gegee A = [[2, 2], [3, 1]] en B = [[0, 1], [0, 2]], dan sal speler A speel A1 en speler B sal B2 speel.

Bewys. VNM-streek A1 is: pA (B2 | A2) ≥ 1 / 2, en VNM-streek B2 is: pB (A2 | B2) ≥ -1. Speler B sal dus B2 speel. Speler A weet ook dat dit die geval is, vandaar dat pA (B2 | A2) = 1. Aangesien pA (B2 | A2) = 1 'n punt is in die VNM-streek A1, speel speler A A1. QED

Koördineringsvoorbeeld.

Laat A = B = [[2, 0], [0, 1]]. Daar is 3 Nash ewewigspunte: “speel A1 & B1”, “speel A2 & B2”, en “speel A1 (of B1) met die waarskynlikheid 1 / 3”. VNM-streek A1 is: 2pA (B1 | A1) ≥ pA (B2 | A2) en VNM-streek B1 is: 2pB (A1 | B1) ≥ pB (A2 | B2). Deur hierdie VNM-streke visueel te ontleed, sal A en B waarskynlik strategieë A1 en B1 kies.

Voorstel 6. Gegee A = B = [[2, 0], [0, 1]], as die spelers se waarskynlikheid onderling onafhanklik is, speel dan die eerste strategie as u glo dat die teenstander se waarskynlikheid om sy eerste strategie te speel, ten minste 1 / is 3, anders speel die tweede strategie.

Bewys. VNM-streek A1 is: pA (B1) ≥ 1 / 3 en VNM-streek B1 is: pB (A1) ≥ 1 / 3. QED

Battle of the Sexes Voorbeeld.

Laat A = [[3, 1], [1, 2]] en B = [[2, 1], [1, 3]]. Daar is 3 Nash-ewewigspunte: “speel A1 & B1”, “speel A2 & B2”, en “speel A1 met die waarskynlikheid 2 / 3, speel B1 met die waarskynlikheid 1 / 3”. VNM-streek A1 is: 2pA (B1 | A1) ≥ pA (B2 | A2) en VNM-streek B1 is: pB (A1 | B1) ≥ 2pB (A2 | B2). A verkies eerder A1 en B verkies eerder B2.

Voorstel 7. Gegee A = [[3, 1], [1, 2]] en B = [[2, 1], [1, 3]], as die waarskynlikheid van die spelers onderling onafhanklik is, speel dan A1 as pA (B1 ) ≥ 1 / 3, speel anders A2; speel B1 as pB (A1) ≥ 2 / 3, anders speel B2.

Bewys. Die VNM-streek A1 is: pA (B1) ≥ 1 / 3 en VNM-streek B1 is: pB (A1) ≥ 2 / 3. QED

Bypassende Pennies-voorbeeld.

Laat A = [[1, -1], [-1, 1]] en B = [[-1, 1], [1, -1]]. Hierdie nul-som-spel het 'n gemengde Nash-ewewig: “speel A1 met waarskynlikheid 1 / 2, speel B1 met die waarskynlikheid 1 / 2”.

Voorstel 8. Gegee A = [[1, -1], [-1, 1]] en B = [[-1, 1], [1, -1]], as die spelers se waarskynlikheid onderling onafhanklik is, speel dan A1 as pA (B1) ≥ 1 / 2, speel anders A2; speel B1 as pB (A1) 1 / 2, anders speel B2[14].

Bewys. Die VNM-streek A1 is: pA (B1) ≥ 1 / 2 en VNM-streek B1 is: pB (A1) 1 / 2. QED

Hoenderwild-voorbeeld (Sugden [19]).

Laat A = [[0, -1], [1, -10]] en B = [[0, 1], [-1, -10]]. Die Nash-ewewig is “speel A1 (swerve) & B2 (gaan reguit)”, “speel A2 (gaan reguit) & B1 (swerve)” en “speel A1 (B1) met waarskynlikheid 0.9”.

Voorstel 9. As die spelers se waarskynlikheid onderling onafhanklik is in die hoenderwedstryd, dan: swaai as u glo dat die teenstander sal swaai met 'n waarskynlikheid van hoogstens 90%, gaan anders.

Bewys. Die VNM-streek A1 is: pA (B1) + 11pA (B2) ≥ 2, of pA (B1) ≤ 9 / 10. Net so is die VNM-streek B1: pB (A1) ≤ 9 / 10. QED

Let daarop dat as u teenstander te veel entoesiasme (ten minste 90%) toon om te swaai, u reguit moet gaan.

Voorkeurscenario: die spelers is meer geneig om te swaai as om reguit te gaan.

Hoender scenario: Gestel pA (B1) = pB (A1) = 0. Albei spelers verwag dat die ander speler reguit moet gaan. Albei sal swaai.

Katastrofe-scenario: Gestel pA (B1) = pB (A1) = 1. Albei spelers verwag dat die ander speler sal swaai. Albei gaan reguit[15].

Nash ewewigsscenario: Gestel pA (B1) = 1 - pB (A1), en pB (A1) = 0 of 1. Die speler wat van die ander speler verwag om reguit te gaan swaai, en die speler wat van die ander speler verwag om te swaai, gaan reguit.

Arms Race Voorbeeld.

Laat voorstelling 9 A = [[0, -x], [1, -10x]], B = [[0, 1], [-y, -10y]], vir x, y ≥ 0. Laat A1 of B1 “soek vrede” en A2 of B2 wees “kernaanval”. Die waardes x en y dui die wapenvoorraad van B en A onderskeidelik aan.

Land A soek vrede as die waarskynlikheid dat land B aanval, groter is as 1 / (9x + 1); anders val A aan. Die waarskynlikheidskromme pA (B1) = 1 / (9x + 1) daal vinnig, bv. PA (B1) = 1 / 2 by x = 1 / 9, maar word binnekort dramaties gevleg: B moet aanvanklik vinnig opgaar, maar as die kurwe plat, sal B nie veel voordeel trek vir die opslag van arms nie.

En net so vir land B.

Samevattend hou elke land aanvanklik wapens op, sodat dit nie aangeval kan word nie. Maar vinnig afnemende opbrengste op die opslag van wapens realiseer 'n geleentheid vir 'n vredesverdrag.

Ter illustrasie, oorweeg die geraamde globale kernvoorraad van 2018[16] van Tabel 2.

Op grond van die uitbetalings hierbo en Tabel 2, sou 'n rasionele Noord-Korea 'n vredesverdrag met die Verenigde State en Rusland moet soek.

Skyrms [16]).

Laat A = [[4, 1], [3, 2]] en B = [[4, 3], [1, 2]]. Die Nash-ewewig is “speel A1 (Stag) & B1 (Stag)”, “play A2 (Hare) & B2 (Hare)” en “play A1 (B1) met die waarskynlikheid 0.5”.

Voorstel 10. As die spelers se waarskynlikheid onderling onafhanklik van mekaar is, jaag dan: as jy glo dat die teenstander die jag met 'n waarskynlikheid van minstens 50% sal jag, jaag anders haars.

Bewys. Die VNM-streek A1 is: 3pA (B1) + pA (B2) ≥ 2, of pA (B1) ≥ 1 / 2. Net so is die VNM-streek B1: pB (A1) ≥ 1 / 2. QED

Dilemma gevangene se[17].

Laat A12 <A22 <A11 <A21, en laat B gelyk wees aan die transpose van A. Aangesien A11 <A21 en A12 <A22, lewer die gebruik van die oorheersingsbeginsel die Nash-ewewig, naamlik die nie-samewerkende oplossing “speel A2 (defek) en B2 (defek) ”. Maar aangesien A22 <A11, A en B beter daaraan toe is as hulle albei die koöperatiewe oplossing speel: speel A1 (stilte) en B1 (stilte).

Voorstel 11. In die dilemma van die gevangene, as die waarskynlikhede van die spelers onderling onafhanklik is, speel spelers dan nie-samewerkend[18].

Bewys. Beskou die linkerkant van die VNM-streek A1:

(A11 - A12 - A21 + A22) pA(B1) + A12 - A22.

As A11 - A12 - A21 + A22 ≤ 0, dan (A11 - A12 - A21 + A22) pA(B1) + A12 - A22 ≤ A12 - A22 <0. Aan die ander kant, as A11 - A12 - A21 + A22> 0, dan (A11 - A12 - A21 + A22) pA(B1) + A12 - A22 ≤ (A11 - A12 - A21 + A22) + A12 - A22 = A11 - A21 <0. Dus, vir enige voorafgaande speler vir speler A, is VNM-streek A1 die nulstel, dus moet dit strategie 2 speel.

Net so moet speler B strategie 2 speel. QED

Uit voorstel 11 blyk dit duidelik dat die aanname van onafhanklikheid ons beperk tot die nie-samewerkende oplossing.

Voorbeeld van klassieke gevangene.

In die klassieke gevangene se dilemma is A = [[-1, -3], [0, -2]] en B = [[-1, 0], [-3, -2]].

Voorstel 12. In die klassieke gevangene se dilemma, as die spelers se voorgangers is: pA (B1 | A1) + pA (B2 | A2) ≥ 3 / 2, pB (A1 | B1) + pB (A2 | B2) ≥ 3 / XUM die spelers sal die koöperatiewe oplossing speel2.

Bewys. Die VNM-streek A1 is: pA (B1 | A1) + pA (B2 | A2) ≥ 3 / 2, en die VNM-streek B1 is: pB (A1 | B1) + pB (A2 | 2) Vir die gegewe voorafgaande moet spelers A en B dus die koöperatiewe oplossing speel. QED

Let in die voorstel 12 op die hoë maat wat benodig word om die koöperatiewe oplossing te speel. Die spelers kies eerder om die nie-koöperatiewe oplossing te speel.

'N Geval waar die Nash-benadering nie oorweeg om die koöperatiewe strategie te speel nie.

Oorweeg die gevangene se dilemma waar A11 - A12 = A21 - A22, A21 = A11 + m en A22 = A11 - M, waar m> 0 klein is en M> 0 baie groot. Byvoorbeeld, A = [[100, -3], [101, -2]]. Onthou uit Voorstel 11 dat as die spelers se waarskynlikheid onderling onafhanklik is, spelers nie-samewerkend sal speel.

Dit is duidelik dat die spelers dwaas sou wees om nie eers die strategie 1 te oorweeg nie, want as 'n speler 2 speel, sou die kans dat die ander speler ook 2 speel, 'n beduidende verlies lewer, so hoekom dit waag? Dit is duidelik dat die Nash-benadering nie oorweeg om die koöperatiewe oplossing te speel nie, selfs al is dit die ooglopende oplossing om te speel - 'n baie belangrike punt in die bespreking van markafbrekings in algemene ekonomiese ewewigsmodelle.

Aan die ander kant, soos die volgende stelling toon, sal ons benadering die samewerkende oplossing eerder as die nie-koöperatiewe oplossing speel deur die aanname van onafhanklikheid te laat val.

Die swart lyn is die onverskilligheidslyn vir die dilemma van die klassieke gevangene. Dit is waarskynlik dat 'n speler strategie 2 speel as gevolg van die onwaarskynlike waarskynlikheid dat hy in die streek sal wees om strategie te speel

1.

Die groen lyn is die onverskilligheidslyn vir hierdie geval van die dilemma van die gevangene: pA (B1 | A1) + pA (B2 | A2) = 1 + m / (M + m). Hier is die grootte van die waarskynlikheidsgebied vir strategie 1 amper die van strategie 2. Ons benadering is om die spelers aan te beveel om strategie 1 te oorweeg.

Voorstel 13. Gegewe 'n gevangene se dilemma waar A11 - A12 = A21 - A22, A21 = A11 + m en A22 = A11 - M, waar m> 0 klein is en M> 0 baie groot is, sal spelers A en B die koöperatiewe oplossing speel20.

  • Daarom sal spelers nie die nie-koöperatiewe oplossing speel nie.
  • Om die koöperatiewe oplossing te bereik, word aannames bygevoeg, bv. Begrensde rasionaliteit, onvolledige inligting (Aumann en Maschler [2]; Acevedo en Krueger [4]; Daley Gegewe A se verwagte gesamentlike waarskynlikhede pA (Ai en Bj)), A kom tot die gevolgtrekking dat pA (A1 en B1) moet naby 1 wees, dit is omdat A en B waarskynlik strategie 1 sal speel, waar hul uitbetalings redelik hoog is en slegs m eenhede minder as maksimum is.

Daarom moet pA (B1 | A1) = pA (A1 en B1) / pA (A1) ook naby 1 wees.

A kom ook tot die gevolgtrekking dat pA (A2 en B2) pA (A2 en B1) aangesien B waarskynliker is om strategie 2 te speel as A strategie 2 speel. Vandaar dat pA (B2 | A2) = pA (A2 en B2) / (pA (A2 en B1) + pA (A2 en B2)) 1 / 2. A kom tot die gevolgtrekking dat Fig. 1 gebruik word dat B voldoende binne die VNM-streek A1 is. Net so sal B strategie 1 speel. QED

Newcomb se paradoks as weergawe van die gevangene se dilemma.

In die beroemde Newcomb se paradoks (Wolpert en Benford [21]) is daar 'n voorspeller B, 'n speler A en 'n boks X. Die speler A kry die keuse om die vak X of die vak X plus $ 1,000 te neem. Voordat A sy keuse maak, voorspel B wat A gaan doen, en B se voorspellings is byna seker. As B voorspel dat A slegs vak X sal neem, dan plaas B $ 1,000,000 in vak X. In hierdie geval, aangesien die vak 'n $ 1,000,000 daarin het, sal A $ 1,000,000 of $ 1,001,000 ontvang, afhangende van of A vak X kies of X plus $ 1,000. Aan die ander kant, as B voorspel dat A vak X plus $ 1,000 sal neem, plaas B niks in vak X nie. In hierdie geval, afhangende van sy keuse, ontvang A óf $ 1,000 óf niks.

Die paradoks van Newcomb is dat twee perfek rasionele ontledings botsende antwoorde gee op die optimeringsprobleem van speler A: volgens die verwagte nutshypotese, moet speler A slegs vakkie X neem, aangesien die verwagte uitbetaling van die neem van X baie hoër is. Aan die ander kant, volgens die oorheersingsbeginsel, moet speler A boks X plus $ 1,000 neem.

Die paradoks word die beste verstaan ​​deur 'n gedeelte in (Wolpert en Benford [21]): “... Newcomb het gesê dat hy net X sou neem; waarom 'n Godagtige wese veg? Nozick het egter gesê: 'Vir byna almal is dit duidelik en voor die hand liggend wat gedoen moet word. Die probleem is dat hierdie mense bykans eweredig oor die probleem gaan verdeel, met groot getalle wat dink dat die opponerende helfte net dom is. '...'.

Wolpert en Benford los die paradoks op deur aan te toon dat Newcomb se probleem eintlik twee verskillende speletjies met verskillende waarskynlike uitkomste verteenwoordig.

In hierdie afdeling sal ons die paradoks oplos deur Newcomb se probleem as 'n gevangene-dilemma te stel. Sodoende kan die oplossing van Newcomb se probleem op twee maniere verkry word: as die nie-koöperatiewe oplossing (neem vak X plus $ 1,000) deur die oorheersingsbeginsel te gebruik, of as die koöperatiewe oplossing (neem slegs vak X) deur die verwagte nut hipotese.

Gestel daar is 'n ryk weldoener wat belowe om 'n uitbetalingsmatriks vir voorspeller B te finansier, wat die volgende spel lewer: A = [[$ 1,000,000, 0], [$ 1,001,000, $ 1,000]] en B = [[$ 1,000,000, $ 1,001,000 ], [0, $ 1,000]].

As B reg voorspel, kry B wat speler A kry. Maar as B verkeerd voorspel, kry B $ 1,001,000 minus wat A kry21.

Vanaf Proposition 13, sal spelers A en B saamwerk aan hierdie wedstryd.

As die speler, soos Nash, die probleem oplos deur die oorheersingsbeginsel te gebruik, so is die voorspeller ook. Beide voorspeller en speler sal by die nie-samewerkende oplossing wees: neem X plus $ 1,000. As die speler die probleem oplos deur die verwagte nutshypotese te gebruik, sal die voorspeller ook wees, en beide voorspeller en speler sal by die koöperatiewe oplossing wees: neem slegs X. In beide gevalle is die voorspeller van die voorspeller

en Sadowski [6]) of nuwe metodes word beskryf, bv. tit-for-tat, gekorreleerde ewewig (Axelrod [3]; Aumann [1]).

21 Let daarop dat deur die probleem van Newcomb as 'n PD-probleem te stel, die voorspeller 'n persoonlike aansporing kry wat in Newcomb se probleem afwesig is.

sekere. Aangesien spelers vanaf Proposition 13 nie die nie-samewerkende oplossing sal speel nie, stem ons saam met Newcomb dat samewerking die voor die hand liggende strategie is.

Let op in Figuur 1, maar die samewerkingsgebied is onbeduidend kleiner as vir nie-samewerking. Dit verbaas ons nie as mense eweredig verdeel oor watter strategie hulle moet neem nie.

'N Veralgemening van die gevangene se dilemma aan M-persone.

Om 'n beter begrip van die oplossing van die Nash-oplossing in algemene ekonomiese ewewigsmodelle te laat kom, laat ons die dilemma van die gevangene veralgemeen na M-Persone, met elke speler wat 2-strategieë het, vir M 2.

Laat ons die M-Person-spel via binêre bome beskryf.

Figuur 2 is die gevangene van die gevangene vir speler A. Tree (2, 1) is die binêre boom met speler B (speler 2) as ouer, en speler A (speler 1) as kind. Om die opbrengste vir speler B te verkry, skakel die rolle van ouer en kind na Boom (1, 2). Onthou dat A12 <A22 <A11 <A21 vir die dilemma van die gevangene.

Veronderstel vervolgens dat Tree (M - 1, M - 2, ..., 2, 1) speler A se uitbetaling vir 'n (M - 1) -persoonlike spel, vir M 3. Konstrueer die uitbetalingsboom van speler A (M, M - 1, ..., 2, 1) vir 'n M-Person-speletjie deur speler A's Tree (M - 1, M - 2, ..., 2, 1) die subbome op beide te laat takke van ouer speler M.

Die numeriese waardes van die uitbetaling aan die regter subboom word aanvaar anders as dié op die linker subboom, solank die verhouding A12 <A22 <A11 <A21 oral in die boom gehandhaaf word.

Laastens, gegee Boom (M, M - 1, ..., 2, 1) vir speler A, skep Boom (1, M, M - 1, ..., 3, 2) vir speler B (speler 2) deur 1 die hoogste te maak ouer; Boom (1, 2, M, M - 1, ..., 4, 3) vir speler 3 deur 2 die tweede hoogste ouer te maak, ..., Tree (1, 2, 3, ..., M - 2, M, M - 1 ) vir speler M - 1 deur M - 2 die derde laagste kind te maak, Boom (1, 2, 3, ..., M - 1, M) vir speler M deur M - 1 die tweede laagste kind te maak.

Dit voltooi die beskrywing van die spelers se uitbetalings vir 'n M-Persoon-gevangene-dilemmaspel, met elke speler wat 2-strategieë het.

Stelling 14. Vir die M-Person-gevangene se dilemma, M 2, volgens die oorheersingsbeginsel, is die Nash-oplossing vir die spelers om strategie 2 te speel.

Bewys. Ons weet reeds dat die stelling geld vir M = 2. Aanvaar deur induksie dat die stelling geld vir M - 1, vir M 3. Laat ons aantoon dat die stelling geld vir M.

Gegewe boom (M, M - 1, ..., 2, 1) vir speler A, moet u onthou dat die onderbome aan die linker- en regtertak van konstruksie die vorm is van boom (M - 1, M - 2, ..., 2 , 1) vir speler 1, Boom (M, M - 1, ..., 2) vir speler 2, Boom (2, M, M - 1, ..., 4, 3) vir speler 3, ..., Boom (2, ... , M - 2, M, M - 1) vir speler M - 1. Hierdie subbome is identies vir spelers 1, 2, ..., M - 1, behalwe vir die etikettering op die ouers se knope. Let daarop dat elke speler se strategie 2 sy strategie 1 onder enige voorwaarde oorheers. Deur induksie, met behulp van die oorheersingsbeginsel, sal spelers 1 tot M - 1 strategie 2 speel.

Gegewe Boom (1, 2, ..., M - 1, M) is dus vir speler M, as M 1 speel, is die uitbetaling vir speler M b (die tweede regsste nodus van die boom), terwyl M speel 2, is die uitbetaling vir speler M b vir speler M is A22 (die grootste knooppunt van die boom). Volgens die oorheersingsbeginsel, aangesien A12 <A22, sal speler M ook strategie 2 speel. QED

Gestel nou dat enige uitbetaling van die tipe A11 veel groter is as enige uitbetaling van die tipe A22; en dat A21 = A11 + m, waar uitbetalings A11 en A21 in aangrensende nodusse is.

Dit is duidelik dat die Nash-benadering nie oorweeg om die koöperatiewe oplossing “speelstrategie 1” te speel nie, selfs al is dit die voor die hand liggende oplossing om te speel.

Na aanleiding van die induktiewe argument van Stelling 14, kan ons ook die gevolgtrekking maak dat, aangesien die onderbome aan die linker- en regter takke die vorm Boom het (M - 1, M - 2, ..., 2, 1) vir speler 1, Tree ( M - 1, M - 2, ..., 2) vir speler 2, Tree (2, M, M - 1, ..., 4, 3) vir speler 3, ..., Tree (2, ..., M - 2, M, M - 1) vir speler M - 1, deur induksie, met behulp van die verwagte nutshypotese, sal spelers 1 tot M - 1 strategie 1 speel waar die uitbetaling van die tipe A11 is.

Gegewe Boom (1, 2, ..., M - 1, M) is dus vir speler M, as M 1 speel, is die uitbetaling vir speler M 'n (die linker knooppunt van die boom), terwyl M speel 2, is die uitbetaling vir speler M speler M is A21 = A11 + m (die tweede linksste knooppunt van die boom). Sedert A11 <A21, kan speler M dalk in die versoeking kom om strategie 2 te speel. Maar waarom waag u die strategie 2 vir m eenhede meer as A11, as dit kan lei tot 'n uitbetaling van die tipe A22, 'n bedrag wat aansienlik minder is as A11?

Volgens die verwagte nutshypotese moet speler M ook strategie 1 speel.

Algemene M-persoon speletjies.

Laastens veralgemeen ons Stelling 1 vir algemene M-persoon-speletjies.

Laat daar M-spelers wees, waar elke speler i nie moontlike strategieë het vir elke i = 1, 2, ..., M. Gegewe die strategievector (j1, j2, ..., jM), laat die uitbetaling aan speler i Ai weesj1j2 ... JM. Laat xi 'n gemengde strategie wees vir speler i, dit wil sê 'n strategie xi waar Σj xij = 1, xij 0, almal j, en laat x = (xi, xi) dui die strategieë van alle spelers aan. Nash se probleem is:

waar EP (i | xi) die verwagte uitbetaling is vir speler wat ek xi gegee het en waar die opsomming oor alle jk en alle k is.

'N Strategie x * is 'n Nash-ewewig as xi * 'n oplossing is vir speler i se probleem hierbo, gegewe xi *.

Laat ons vir ons benaderingj1, j2, ..., JM wees speler i se verwagte waarskynlikheid dat speler k vir jk speel, vir alle jk en alle k. Die Von Neumann – Morgenstern verwagte nutsteorie sê dat speler i se doel is om die verwagte uitbetaling te maksimeer:

waar die opsomming oor alle jk en alle k is.

definieer

waar-ek speel j-i beteken dat speler k speel jk en waar die opsomming is vir alle jk, vir alle k i.

Stelling 15. Probleme (13) hieronder is gelykstaande aan probleme (11):

Bewys.. By definisie,

waar die opsomming alle rk is, vir enige k i.

Die noemer van (14) is die waarskynlikheid pi (i speel ji). vandaar,

Sedert Σ pi (ek speel ji) = 1 en pi (ek speel ji) 0 vir alle ji, dit volg dat speler i strategie speel [arg maxji EP (i | i speel ji)]. QED

'N Metode om die beste strategie vir speler i te vind, is soos volg: Vir enige paar strategieë vir speler i, sê strategie r en strategiee, bereken die lokus van punte waar die verwagte uitbetalings is afhanklik van die speler wat ek speel of r of s gelyk is. . Dit definieer 'n onverskilligheidsoppervlak wat die voorwaardelike waarskynlikheidsruimte in 2 VNM-streke verdeel. Een VNM-streek word gemerk r omdat die strategie van keuse r is, en die ander VNM-streek gemerk s omdat die strategie van keuse s is.

Na die berekeninge hierbo, sal elke VNM-streek soveel keer gemerk word as daar verskillende pare strategieë bestaan. Neem vir enige gegewe VNM-streek enige twee van die meervoudige etikette uit en skakel een daarvan uit op die onverskilligheidsoppervlak wat deur hierdie paar etikette geskep word. Die proses eindig wanneer elke VNM-streek slegs een etiket het.

Algemene 2-persoonspeletjies.

Laat speler A strategieë hê Ai, i = 1, 2, ... n1 en speler B het strategieë Bj, j = 1, 2, ... n2. Aanvaar dat die waarskynlikhede van die spelers onderling onafhanklik is. Probleem (13) is:

Die VNM-streke word dus gedefinieër deur konvekse polytope:

Soos gesien kan word in (16), is dit eenvoudig om die oplossing vir 'n algemene 2-persoon-speletjie te vind. Oorweeg byvoorbeeld die meer as tweeduisend jaar oue Rock-Paper-Scissors-speletjie, waar die Nash-ewewig is: speel enige strategie met 33% -waarskynlikheid:

Strategie A1 of B1 (rock) verloor na strategie A2 of B2 (papier) verloor aan strategie A3 of B3 (skêr) verloor aan rock.

Vir speler A het ons in die algemeen waar 0 PA (Bj) 1,

wat verminder tot

En net so vir speler B.

Wat 'n nuwe strategie vir hierdie antieke spel lyk, is: speel rock as u glo dat u teenstander papier sal speel met 'n waarskynlikheid van hoogstens 33% en 'n skêr met 'n waarskynlikheid van minstens 33%; speel papier as u glo dat u teenstander 'n skêr sal speel met 'n waarskynlikheid van hoogstens 33% en rock met 'n waarskynlikheid van minstens 33%; anders speel skêr22.

3-persoon-speletjies waar elke persoon 2-strategieë het.

Laat ons Stelling 15 toepas om die oplossing vir 'n 3-persoon-speletjie te vind, waar elke speler A, B en C 2-strategieë het Ai, Bi, Ci, vir i = 1, 2.

Aanvaar dat die waarskynlikhede van die spelers onderling onafhanklik is. Vir speler A is vergelyking (13)

en op soortgelyke wyse vir spelers B en C. Met behulp van Stelling 15 word die oplossing gedefinieer deur:

Kom ons gebruik bogenoemde vir die Bar-crowding-spel[21]:

As die speler tuis is, is die uitbetaling daarvan 1; as die speler alleen op die kroeg is, is die uitbetaling daarvan 0; as die speler saam met 'n ander persoon aan die kroeg is, is die uitbetaling daarvan 2; anders is die uitbetaling -1.

Ons het: A111 - A211 = -2, A112 - A212 = A121 - A221 = 1, A122 - A222 = -1, dus VNM-streek A1 is die streek -3pA (B1 X) (C1) - 2 ≥ 1, of gelykstaande aan die streek[22] pA (B1) ≥ (1 - 2pA (C1)) / (2 - 3pA (C1)). Net so is VNM-streek B1 die streek pB (A1) ≥ (1 - 2pB (C1)) / (2 - 3pB (C1)) en VNM-streek C1 is die streek pC (B1) ≥ (1) / (2 - 1pC (A2)). Die Nash-ewewig is p (A) = p (B) = p (C) = 3 en p (A) = p (B) = p (C) = 1 / 1.

Erkenning.

Ons bedank Al Roth en Todd Davies vir hul onskatbare raad en leiding met die voorbereiding van hierdie artikel.

voetnote

[1] Ter wille van eenvoud neem ons die algemene aanname dat nut 'n lineêre funksie van die opbrengs is (Starmer [18]). Die maksimalisering van die verwagte nut is dus dieselfde as die verwagte uitbetaling te maksimeer.

[2] Ons Bayes-benadering vir speletjies verskil van vorige Bayes-werk (byvoorbeeld Acevedo en Krueger [4]; Aumann [1]; Daley en Sadowski [6]; McKelvey en Palfrey [12]; Quattrone en Tversky [15]) in die sin dat ons benadering, anders as die ander benaderings, voorwaardelike waarskynlikhede onomwonde aan die verwagte nutshypotese, wat ons oplossing altyd bevredig, beïnvloed.

[3] 'n Kritikus sê: “rasionele spelers moet nie en moet nie die voorwaardelike waarskynlikhede oorweeg nie ... Stel jou voor 'n agent wat weet dat die waarskynlikheid van reën p. U 'oplossing' blyk te wees dat die agent 'n sambreel saam met hom moet neem as dit reën en die sambreel verlaat as dit nie reën nie. '
Stelling 1 wys dat die voormalige kritiek nie geregverdig is nie. Met betrekking tot laasgenoemde kritiek, laat EP (agent | bring 'n sambreel) = p, en EP (agent | bring nie 'n sambreel nie) = 1 - p. Ons oplossing sou dan wees: om 'n sambreel te bring as p ≥ 1 / 2; Moenie 'n sambreel saambring as p ≤ 1 / 2 nie.

[4] Die voorwaardelike waarskynlikhede van (2) is nie in stryd met die beginsel in Spohn [17]: “Enige voldoende kwantitatiewe besluitnemingsmodel mag nie eksplisiet of implisiet enige subjektiewe waarskynlikhede vir dade bevat nie.” Die voorwaardelike waarskynlikhede van 'n speler is subjektiewe waarskynlikhede vir die teenstander se strategieë, nie vir sy eie strategieë nie.

[5] Hierdie stelling sal veralgemeen word na een vir M-persoon-speletjies.

[6] Daar is geen sein tussen die spelers nie.

[7] Die onafhanklike veranderlikes pA (B1 | A1) en pA (B2 | A2) word aanvaar in die maksimaliseringsprobleem, 'n vereenvoudiging wat die probleem van oneindige regressie vermy (soortgelyk aan Nash se aanname dat p (B1) vir speler gegee word A in die formulering van sy maksimaliseringsprobleem).

[8] Ongelykheid (5) is die (ontdekte) oplossing vir die probleem (1) op dieselfde manier as wat die kwadratiese formule die oplossing is vir 'n algemene kwadratiese vergelyking.

[9] Die voorafgaande van die speler kan afhang van gedeeltelik waarneembare ewekansige gebeure, soos die weer. Raadpleeg (Harsanyi [10]) vir die gebruik van vooraf in speletjies met onvolledige inligting wat deur Bayesiese spelers gespeel word.

[10] Hierdie algemene oplossing bevat die Nash-ewewig as spesifieke oplossings. In teenstelling met die beskrywende Nash-oplossings, is ons oplossing 'n paar voorskriftelike rasionele verwagtinge suiwer strategieë. Verder, as speler per ongeluk in die VNM-streek A1 is en A2 speel, sê Corollary 2 dat speler A 'n laer verwagte uitbetaling sal kry.

[11] Dit is interessant om daarop te let dat die strategie van die speler by 'n gemengde ewewig van Nash afhanklik is van die ken van die ander speler se uitbetalingsfunksie.

[12] Nul tekens word in die tabel geïgnoreer, aangesien hierdie gevalle ontaard: 'n speler kan nie tussen sy twee strategieë kies nie. Dit is ook interessant om daarop te let dat elke Nash-ewewig in presies vier rye voorkom.

[13] Die volgende 3-voorbeelde word aangepas uit (Davies [7]) op 'n manier wat kan dien as 'n pedagogiese tegniek vir studente in spelteorie. Tabel 1 kan gebruik word om vinnig die Nash-ewewig te vind vir al die voorbeelde van 2-persone wat hierin beskryf word.

[14] A se aksies beïnvloed nie B se keuse van aksies nie. Dit is omdat A se oortuigings nie met B se oortuigings verband hou nie. Aan die ander kant, as oortuigings gekorreleer is, moet albei spelers se waarskynlikheid gelyk wees aan 50%, anders, as ons sê dat die spelers se waarskynlikheid albei is> 50%, weet A dat B strategie 2 (sterte) sal speel, dus speel strategie 1 (koppe) kan nie 'n regte voorskrif vir A wees nie. As dit gesê word, A se waarskynlikheid is> 50% en B se waarskynlikheid <50%, B weet dat A hoofde sal speel, en dus kan koppe nie 'n regte voorskrif vir A. ens wees nie. unieke oplossing is dus die Nash-ewewig: speel lukraak vir albei.

[15] Let daarop dat pA (B1) = pB (A1) = 0 of 1 'n ewewigscenario is: albei spelers swaai (of albei gaan reguit) as albei spelers verwag dat die ander speler reguit moet gaan (of swaai). In teenstelling hiermee, kan p (A1) = p (B1) = 0 of 1 nie 'n Nash-ewewig wees nie: as B reguit gaan (of swaai), sal A swaai (of reguit gaan).

[16] Bronne: Arms Control Association, Federation of American Scientists, International Panel on Fissile Materials, US Department of Defense, US Department of State and Stockholm International Peace Research Institute.

[17] Sedert Flood en Dresher se oorspronklike artikel is duisende artikels daaroor gepubliseer. 'N Google-geleerde se soeke na “die gevangene se dilemma” lewer 104,000-resultate vanaf hierdie skrywe. Gee dit asseblief (Kuhn [14]).

[18] Daarom sal spelers nie die koöperatiewe oplossing speel nie.

[19] As u teenstander nie lukraak speel nie, kan u vooraf beïnvloed word deur die vorige toneelstukke van u teenstander.

[20] Die formule kan uitgebrei word na M-persone, vir M> 3.

[21] Hierdie wedstryd is gebaseer op die El Farol-balkprobleem (Arthur [5]).

[22] Die lokus van onverskilligheid is 'n kwadratiese kromme wat deur die punte gaan (pA (C1), pA (B1)) = (0.5, 0), (0.33, 0.33), (0, 0.5).

Verwysings

[1] Aumann RJ (1974) Subjektiwiteit en korrelasie in gerandomiseerde strategieë. Tydskrif vir Wiskundige Ekonomie 1: 67-96

[2] Aumann RJ, Maschler M (1995) Herhaalde speletjies met onvolledige inligting. MIT Press, Cambridge Londen

[3] Axelrod R (1984) The Evolution of Cooperation. Basiese boeke

[4] Acevedo M, Krueger JI (2005) Bewese redenering in die gevangene se dilemma. The American Journal of Psychology 118: 431-457

[5] Arthur WB (1994) Induktiewe redenering en beperkte rasionaliteit. Amerikaanse ekonomiese oorsig 84: 406-411

[6] Daley B, Sadowski P (2017) Magiese denke: 'n representatiewe resultaat. Teoretiese ekonomie 12: 909-956 24 Hierdie spel is gebaseer op die El Farol-balkprobleem (Arthur [5]). 25 Die lokus van onverskilligheid is 'n kwadratiese kromme wat deur die punte gaan (pA (C1), pA (B1)) = (0.5, 0), (0.33, 0.33), (0, 0.5).

[7] Davies T (2004) nutsteorie en spelteorie. Lesingsnotas

[8] Garcia CB, Zangwill WI (2017) 'n Nuwe benadering tot oorlog of vrede. Werkpapier

[9] Garcia CB, Zangwill WI (2018) dominansie, verwagte nut en die gevangene se dilemma. Werkpapier

[10] Harsanyi J (1967) speletjies met onvolledige inligting gespeel deur “Bayesiaanse” spelers I - III. J. Bestuurswetenskap 14 (3): 159-182

[11] Kadane JB, Larkey PD (1982) Subjektiewe waarskynlikheid en die teorie van speletjies. Bestuurswetenskap 28 (2): 113-120

[12] McKelvey RD, Palfrey TR (1995) Quantal Response Equilibria vir normale vormspele. Speletjies en ekonomiese gedrag 10: 6-38

[13] Jaynes ET (1968) Voorheen waarskynlikhede. IEEE-transaksies op stelselwetenskap en kubernetika 4 (3): 227-241

[14] Kuhn S (2017) Gevangene se dilemma. The Stanford Encyclopedia of Philosophy

[15] Quattrone GA, Tversky A (1984) Oorsaaklike versus diagnostiese gebeurlikhede: op selfbedrog en op die illusie van die kieser. Joernaal vir persoonlikheid en sosiale sielkunde 46: 237-248

[16] Skyrms B (2004) The Stag Hunt and the Evolution of Social Structure. Cambridge University Press, Cambridge

[17] Spohn W (1977) Waar Luce en Krantz die besluitnemingsmodel van Savage regtig veralgemeen. Erkenntnis 11: 113-134

[18] Starmer C (2000) Ontwikkelings in die nie-verwagte nutsteorie: die jag na 'n beskrywende teorie van keuse onder risiko. Tydskrif vir Ekonomiese Letterkunde 38: 332-382

[19] Sugden R (2005) The Economics of Rights, Cooperation and Welfare. Palgrave MacMillan, 2-uitgawe: 132

[20] Von Neumann J, Morgenstern O (1953) Theory of Games and Economic Behaviour. Princeton University Press, New Jersey

[21] Wolpert DH, Benford G (2011) The Lesson of Newcomb's Paradox. Sintese 190: 1637-164