I 1930'erne blev John von Neumann og Oscar Morgenstern grundlæggerne af en ny og interessant gren af matematik kaldet "spilteori". I 1950'erne blev den unge matematiker John Nash interesseret i denne retning. Ligevægtsteorien blev emnet for hans afhandling, som han skrev i en alder af 21. Således fødtes en ny spilstrategi kaldet "Nash Equilibrium", som vandt Nobelprisen mange år senere - i 1994.
Den lange afstand mellem at skrive en afhandling og generel anerkendelse er blevet en prøve for en matematiker. Geni uden anerkendelse resulterede i alvorlige psykiske lidelser, men John Nash var i stand til at løse dette problem takket være sit fremragende logiske sind. Hans Nash Equilibrium-teori vandt en Nobelpris, og hans liv blev filmet i Beautiful mind.
Kort om spilteori
Da Nash-ligevægtsteorien forklarer menneskers adfærd under interaktionsbetingelser, er det værd at overveje spilteoriens grundlæggende begreber.
Spilteori studerer deltagernes (agenters) adfærd i form af interaktion med hinanden som et spil, når resultatet afhænger af flere personers beslutning og adfærd. Deltageren træffer beslutninger baseret på sine forudsigelser om andres adfærd, hvilket kaldes spilstrategien.
Der er også en dominerende strategi, hvor deltageren får det bedste resultat for andre deltageres adfærd. Dette er spillerens bedste win-win-strategi.
Fangens dilemma og videnskabeligt gennembrud
Prisoner's dilemma er et tilfælde af et spil, hvor deltagerne er tvunget til at træffe rationelle beslutninger og opnå et fælles mål i lyset af en konflikt mellem alternativer. Spørgsmålet er, hvilken af disse muligheder han vil vælge, idet han indser personlig og almen interesse, såvel som umuligheden af at få begge. Spillerne ser ud til at være fængslet i et hårdt spilmiljø, hvilket nogle gange får dem til at tænke meget produktivt.
Dette dilemma blev udforsket af den amerikanske matematiker John Nash. Den balance, han nåede, var revolutionerende på sin egen måde. Denne nye tanke påvirkede især økonomernes mening om, hvordan markedsaktører træffer valg under hensyntagen til andres interesser, med tæt interaktion og skæringspunkt mellem interesser.
Det er bedst at studere spilteori gennem konkrete eksempler, da denne matematiske disciplin i sig selv ikke er tørt teoretisk.
eksempel på fangens dilemma
Eksempel, to personer begik et røveri, faldt i hænderne på politiet og bliver afhørt i separate celler. Samtidig tilbyder politibetjente hver deltager favorable betingelser for, at han bliver løsladt, hvis han vidner mod sin partner. Hver afkriminelle har følgende sæt strategier, som han vil overveje:
- Begge vidner på samme tid og får 2,5 års fængsel.
- Begge er tavse på samme tid og får 1 år hver, for i dette tilfælde vil bevisgrundlaget for deres skyld være lille.
- Den ene vidner og bliver løsladt, mens den anden er tavs og får 5 års fængsel.
Det er klart, at sagens udfald afhænger af begge deltageres beslutning, men de kan ikke blive enige, fordi de sidder i forskellige celler. Konflikten mellem deres personlige interesser i kampen for en fælles interesse er også tydeligt synlig. Hver af fangerne har to handlingsmuligheder og 4 muligheder for udfald.
Kæde af logiske slutninger
Så gerningsmanden A overvejer følgende muligheder:
- Jeg er tavs, og min partner er tavs - vi får begge 1 års fængsel.
- Jeg afleverer min partner, og han afleverer mig - vi får begge 2,5 års fængsel.
- Jeg er tavs, og min partner forråder mig - jeg får 5 års fængsel, og han bliver fri.
- Jeg afleverer min partner, men han er tavs - jeg får frihed, og han får 5 års fængsel.
Lad os give en matrix af mulige løsninger og resultater for klarhedens skyld.
Tabel over mulige udfald af fangens dilemma.
Spørgsmålet er, hvad hver deltager vælger?
"Vær stille, du kan ikke tale" eller "Du kan ikke tie, du kan ikke tale"
For at forstå deltagerens valg skal du gennemgå kæden af hans tanker. Efter forbryder A's begrundelse: hvis jeg forbliver tavs, og min partner forbliver tavs, vil vi modtage en minimumsperiode (1 år), men jegJeg ved ikke, hvordan han vil opføre sig. Hvis han vidner imod mig, så er det bedre for mig at vidne, ellers kan jeg sidde ned i 5 år. Jeg vil hellere sidde ned i 2,5 år end 5 år. Hvis han tier, så skal jeg så meget desto mere vidne, for på den måde får jeg min frihed. Deltager B.
Det er ikke svært at se, at den dominerende strategi for hver af gerningsmændene er at vidne. Det optimale punkt i dette spil kommer, når begge kriminelle vidner og modtager deres "præmie" - 2,5 års fængsel. Nash spilteori kalder dette ligevægt.
Ikke-optimal optimal Nash-løsning
Den revolutionære karakter af det nashianske synspunkt er, at en sådan ligevægt ikke er optimal, når man tager den enkelte deltager og dennes egeninteresse i betragtning. Den bedste mulighed er trods alt at forblive tavs og gå fri.
Nash-ligevægt er et punkt for konvergens af interesser, hvor hver deltager kun vælger den mulighed, der er optimal for ham, hvis andre deltagere vælger en bestemt strategi.
I betragtning af muligheden, når begge kriminelle er tavse og kun modtager 1 år, kan vi kalde det en Pareto-optimal mulighed. Det er dog kun muligt, hvis de kriminelle kunne blive enige på forhånd. Men selv dette ville ikke garantere dette resultat, da fristelsen til at trække sig tilbage fra aftalen og undgå straf er stor. Manglen på fuldstændig tillid til hinanden og faren for at få 5 år tvunget til at vælge muligheden med anerkendelse. Reflekter over, hvad deltagerne vil overholdemulighed med tavshed, at handle sammen, er simpelthen irrationelt. En sådan konklusion kan drages, hvis vi studerer Nash-ligevægten. Eksempler viser kun, at du har ret.
Egoistisk eller rationelt
The Nash Equilibrium Theory gav opsigtsvækkende konklusioner, der modbeviste de principper, der eksisterede før. For eksempel betragtede Adam Smith hver af deltagernes adfærd som fuldstændig egoistisk, hvilket bragte systemet i balance. Denne teori blev kaldt "markedets usynlige hånd."
John Nash så, at hvis alle deltagere handler i deres egne interesser, vil dette aldrig føre til et optim alt grupperesultat. I betragtning af at rationel tænkning er iboende i hver deltager, er det valg, som Nash-ligevægtsstrategien tilbyder, mere sandsynligt.
Rent mandligt eksperiment
Et godt eksempel er det blonde paradoks-spil, som, selvom det tilsyneladende er malplaceret, er en klar illustration af, hvordan Nash-spilteorien fungerer.
I dette spil skal du forestille dig, at et selskab af gratis fyre kom til en bar. I nærheden er et selskab af piger, hvoraf den ene er at foretrække frem for andre, f.eks. en blondine. Hvordan handler fyre for at få den bedste kæreste til sig selv?
Så fyrenes begrundelse: Hvis alle begynder at stifte bekendtskab med blondinen, så er der højst sandsynligt ingen, der får det, så vil hendes venner ikke have lyst til at stifte bekendtskab. Ingen ønsker at være den anden fallback. Men hvis drengene vælger at undgåblondine, så er sandsynligheden for, at hver af fyrene finder en god kæreste blandt pigerne, stor.
Nash-ligevægtssituationen er ikke optimal for fyre, fordi alle ville vælge blondinen, for kun at forfølge deres egne egoistiske interesser. Det kan ses, at forfølgelsen af kun selviske interesser vil være ensbetydende med sammenbruddet af gruppeinteresser. Nash-ligevægt vil betyde, at hver fyr handler i sine egne interesser, som er i kontakt med hele gruppens interesser. Dette er ikke den bedste mulighed for alle personligt, men den bedste for alle, baseret på den overordnede strategi for succes.
Hele vores liv er et spil
Beslutningstagning i den virkelige verden ligner meget et spil, hvor du også forventer visse rationelle adfærd fra andre deltagere. I forretningen, på arbejdet, i et team, i en virksomhed og endda i forhold til det modsatte køn. Fra store tilbud til almindelige livssituationer, alt overholder den ene eller den anden lov.
Selvfølgelig er ovenstående spilsituationer med kriminelle og en bar bare fremragende illustrationer, der demonstrerer Nash-ligevægten. Eksempler på sådanne dilemmaer opstår meget ofte på det virkelige marked, og det virker især i tilfælde, hvor to monopolister kontrollerer markedet.
Blandede strategier
Ofte er vi involveret i ikke én, men flere spil på én gang. At vælge en af mulighederne i et spil, styret af en rationel strategi, men du ender i et andet spil. Efter et par rationelle beslutninger kan du opleve, at dit resultat ikke er til din smag. Hvadtage?
Lad os overveje to typer strategi:
- Ren strategi er deltagerens adfærd, som kommer af at tænke på andre deltageres mulige adfærd.
- Blandet strategi eller tilfældig strategi er vekslen mellem rene strategier tilfældigt eller valget af en ren strategi med en vis sandsynlighed. Denne strategi kaldes også randomiseret.
I betragtning af denne adfærd får vi et nyt blik på Nash-ligevægten. Hvis det tidligere blev sagt, at spilleren vælger en strategi én gang, så kan man forestille sig en anden adfærd. Det kan antages, at spillerne vælger en strategi tilfældigt med en vis sandsynlighed. Spil, der ikke kan finde Nash-ligevægte i rene strategier, har dem altid i blandede strategier.
Nash-ligevægt i blandede strategier kaldes blandet ligevægt. Dette er en ligevægt, hvor hver deltager vælger den optimale frekvens for at vælge sine strategier, forudsat at andre deltagere vælger deres strategier med en given frekvens.
Straffe og blandet strategi
Et eksempel på en blandet strategi kan findes i fodboldspillet. Den bedste illustration af en blandet strategi er måske en straffesparkskonkurrence. Så vi har en målmand, der kun kan springe ind i det ene hjørne, og en spiller, der tager straffesparket.
Så, hvis første gang spilleren vælger strategien at skyde til venstre hjørne, og målmanden også falder ned i dette hjørne og fanger bolden, hvordan kan tingene så udvikle sig anden gang? Hvis spillerenvil ramme i det modsatte hjørne, er dette højst sandsynligt for tydeligt, men at ramme i samme hjørne er ikke mindre indlysende. Derfor har både målmanden og sparkeren intet andet valg end at stole på tilfældig udvælgelse.
Ved at skifte tilfældigt udvælgelse med en bestemt ren strategi forsøger spilleren og målmanden således at få det maksimale resultat.