Równowaga Nasha w strategiach czystych i mieszanych. Równowaga Nasha. Teoria gier dla ekonomistów (John Nash)


Póki co aktualna wersja strony niesprawdzone doświadczonych uczestników i może znacznie różnić się od wersje, dostęp 9 maja 2012; wymagane kontrole 2 zmiany.

Iść do: nawigacja,szukaj

Johna Forbesa Nasha, listopad 2006

Równowaga Nasha(język angielskiNasha równowaga) nazwany po Johna Forbesa Nasha- więc w teoria gry to rodzaj decyzji w grze dwóch lub więcej graczy, w której żaden uczestnik nie może zwiększyć wygranej poprzez jednostronną zmianę swojej decyzji, podczas gdy inni uczestnicy nie zmieniają swoich decyzji. Ten zestaw strategii wybranych przez uczestników i ich wypłat nazywany jest równowagą Nasha .

Pojęcie równowagi Nasha (NE) nie zostało po raz pierwszy użyte przez Nasha; Antoine’a Auguste’a Cournota pokazał, jak znaleźć to, co nazywamy równowagą Nasha w grze Cournota. W związku z tym niektórzy autorzy nazywają to Równowaga Nasha-Cournota. Jednak Nash jako pierwszy pokazał to w swojej rozprawie doktorskiej na temat tego zjawiska gry niekooperacyjne w 1950 r., że taka równowaga powinna istnieć dla wszystkich skończonych gier z dowolną liczbą graczy. Przed Nashem sprawdzano to tylko w grach dla 2 graczy suma zerowaJohna von Neumanna I Oscara Morgensterna(1947).

Definicja formalna

Powiedzmy - graN osób w postaci normalnej, gdzie jest zbiorem czystych strategii i jest zbiorem wypłat. Kiedy każdy gracz wybiera strategię w profilu strategii , gracz otrzymuje wygraną. Należy pamiętać, że wygrane zależą od całego profilu strategii: nie tylko od strategii wybranej przez samego gracza, ale także od strategii innych osób. Profil strategii jest równowagą Nasha, jeśli zmiana strategii nie jest korzystna dla żadnego gracza, to znaczy dla żadnego

Gra może mieć równowagę Nasha w strategiach czystych lub w mieszany(to znaczy przy wyborze czystej strategii stochastycznie ze stałą częstotliwością). Nash udowodnił to, jeśli na to pozwolimy strategie mieszane, to w każdej grze N gracze będą mieli co najmniej jedną równowagę Nasha.

Literatura

    Wasin A. A., Morozow V. V. Teoria i modele gier ekonomia matematyczna- M.: MSU, 2005, 272 s.

    Vorobyov N. N. Teoria gier dla ekonomistów cybernetycznych - M.: Nauka, 1985

    Mazałow V.V. Teoria matematyczna gry i aplikacje - Wydawnictwo Lan, 2010, 446 s.

    Petrosyan L.A., Zenkevich N. A., Shevkoplyas E. V. Teoria gier – St. Petersburg: BHV-Petersburg, 2012, 432 s.

Efektywność Pareta

Materiał z Wikipedii – wolnej encyklopedii

Iść do: nawigacja,szukaj

Optymalność Pareta- taki stan systemu, w którym nie można poprawić wartości każdego poszczególnego kryterium opisującego stan systemu bez pogorszenia położenia innych elementów.

Zatem, jak sam mówi Pareta: „Każda zmiana, która nie powoduje żadnej straty dla nikogo i przynosi korzyści niektórym osobom (w ich własnej ocenie), jest poprawą”. Oznacza to, że uznaje się prawo do wszelkich zmian, które nie przynoszą nikomu dodatkowej szkody.

Zbiór stanów optymalnych w Pareto systemu nazywany jest „zbiorem Pareto”, „zbiorem alternatyw optymalnych w Pareto” lub „zbiorem alternatyw optymalnych w Pareto”.

Sytuacja, w której osiągnięta zostaje efektywność Pareto, to sytuacja, w której wyczerpały się wszystkie korzyści z wymiany.

Efektywność Pareto jest jedną z centralnych koncepcji współczesnej ekonomii. W oparciu o tę koncepcję zbudowano Pierwsze i Drugie Twierdzenie Podstawowe zasiłek. Jednym z zastosowań optymalności Pareto jest tzw. Podział zasobów (pracy i kapitału) w stylu Pareto podczas międzynarodowej integracji gospodarczej, czyli zjednoczenia gospodarczego dwóch lub więcej państw. Co ciekawe, rozkład Pareto przed i po międzynarodowej integracji gospodarczej został odpowiednio opisany matematycznie (Dalimov R. T., 2008). Analiza wykazała, że ​​wartość dodana sektorów oraz dochody zasobów pracy poruszają się w przeciwnym kierunku, zgodnie ze znanym równaniem przewodzenia ciepła, podobnie jak gaz lub ciecz w przestrzeni, co pozwala na zastosowanie metodologii analizy stosowane w fizyce w odniesieniu do ekonomicznych problemów migracji parametrów ekonomicznych.

Optymalne w Pareto stwierdza, że ​​dobrobyt społeczeństwo osiąga maksimum, a dystrybucja zasobów staje się optymalna, jeśli jakakolwiek zmiana w tym podziale pogarsza dobrobyt chociaż jednego temat system ekonomiczny.

Pareto-optymalny stan rynku- sytuacja, w której nie da się poprawić pozycji żadnego uczestnika procesu gospodarczego bez jednoczesnego pogorszenia dobrobytu przynajmniej jednego z pozostałych.

Zgodnie z kryterium Pareto (kryterium wzrostu dobrobytu społecznego) ruch w kierunku optymalności jest możliwy tylko przy takim podziale zasobów, który zwiększa dobrobyt przynajmniej jednej osoby, nie szkodząc nikomu innemu.

Przejawia się to w rzeczywistości, aby pokazać, że pojęcie to nie jest jedynie terminem abstrakcyjnym, ale uogólnieniem rzeczywiście istniejącego wzorca. Jednak pomimo przejrzystości przykładu, na jego podstawie może się wydawać, że natknęliśmy się na jakiś zdegenerowany przypadek. Dlatego warto rozważyć więcej ogólny opis tej zasady.

Wielu czytelników może znać równowagę Nasha z jednego bardzo częstego szczególnego przypadku – tak zwanego „dylematu więźnia”. Jego istota jest w przybliżeniu następująca.

W więzieniu przebywa dwóch więźniów, którzy zostali przyłapani osobno na gorącym uczynku, ale są podejrzani o popełnienie poważniejszych przestępstw. Jeśli udowodni się udział, kara więźniów wzrośnie do dziesięciu lat. Teraz odsiadują po rok każdy. Dochodzenie zachęca każdego z nich do zawarcia umowy i złożenia zeznań przeciwko drugiemu. W takim przypadku pierwsza kara zostanie skrócona do sześciu miesięcy, a druga do dziesięciu miesięcy pozbawienia wolności. Więźniowie rozumieją jednak, że jeśli będą się wzajemnie obciążać, jest mało prawdopodobne, że oboje zostaną oszczędzeni - raczej dodadzą każdemu z nich kolejne pięć lat.

Układ można wyświetlić korzystając z poniższej tabeli.

Łatwo zauważyć, że „zielone” opcje (1, 2) i (2, 1) są symetryczne, natomiast w dwóch pozostałych pozycja więźniów będzie identyczna. Możemy więc rozpatrywać logikę sytuacji z punktu widzenia tylko jednego z więźniów – dla drugiego będzie tak samo.

Więzień oczywiście chce dla siebie jak najkrótszego wyroku. Jeśli jednak będzie milczał, być może jego kolega złoży przeciwko niemu zeznania, co zwiększy jego wyrok do dziesięciu lat. Gdyby nie obiecane skrócenie terminu, można by pocieszyć się myślą „po co mi to?”, ale pokusa skrócenia terminu jest zbyt duża. Ponadto drugi więzień, jak rozumie pierwszy, będzie go podejrzewał, pierwszy, o składanie zeznań przeciwko drugiemu i tym samym zaostrzenie kary.

„Grzebo byłoby popaść w skrajność i dać się zabić na dziesięć lat” – myśli pierwszy. Ale „ten drugi pewnie myśli tak samo i tak samo mnie podejrzewa” – rozumie – „i dlatego szansa, że ​​kolega mnie nie zastawi, jest bardzo mała. Okazuje się, że trzeba złożyć zeznania: jeśli drugi cudem zamilknie, minie sześć miesięcy, jeśli przepuści, będzie to pięć miesięcy. Cóż, przynajmniej nie te dziesięć, które nieuchronnie otrzymam dzięki mojemu wspólnikowi, który wszczął śledztwo!”

Opcja „pomarańczowa” (1, 1) jest strawna dla obu i w pewnym sensie jest w tej sytuacji optymalna. Jednak każdy ma jeszcze lepszą opcję - odpowiednią „zieloną” (1, 2) lub (2, 1). W rezultacie faktycznie zostanie wdrożona opcja „czerwona” (2, 2).

Można powiedzieć, że w przypadku każdego z więźniów nie jest tak źle: tylko pięć lat w porównaniu do dziesięciu w „zielonej” wersji na korzyść wspólnika. Wyobraźmy sobie jednak, że w wersji „czerwonej” obydwaj dostaną po dziesiątkę. Logika w w tym przypadku zmieni się trochę: „jeśli go wydam, to przynajmniej jest szansa, aby wydostać się z dziesięciu lat, ale jeśli będę milczeć, nie ma szans, prawdopodobnie zastawi mnie z tych samych powodów”. Jednak w tym przypadku system popycha więźniów do wybrania najgorszej możliwej opcji. Aktorstwo, co typowe, wyłącznie dla własnego dobra.

Rozważmy teraz inną sytuację. Są dwie firmy – A i B. Każda z nich może zastosować strategię – X lub Y. Na wyniki ma jednak wpływ nie tylko strategia wybrana przez samą firmę, ale także strategię drugiej firmy. Wygraną lub przegraną każdej firmy przedstawimy w formie poniższej tabeli.

Konkretnie, aby zwiększyć intensywność namiętności, dobrałem liczby tak, aby nierentowny stan dla obu firm tylko nieznacznie różnił się od „sąsiednich”: tym bardziej zaskakujące jest to, że zostanie zrealizowany. Firmy, działając wyłącznie we własnym interesie, najprawdopodobniej będą chciały otrzymać tysiąc rubli zamiast stu i tym samym nic nie otrzymają, a wręcz przeciwnie, stracą. Przejście jednej ze spółek na strategię X jeszcze bardziej pogorszy jej pozycję – druga firma się wzbogaci, a druga straci jeszcze więcej, choć tylko nieznacznie więcej.

Zapiszmy powyższe macierze w bardziej ogólna perspektywa, abstrahując od „firm”, „więźniów”, „terminów” i „rubli”. Załóżmy, że mamy po prostu dwóch graczy A i B, grających w jakąś grę, w której w każdym ruchu można wykonać jeden z dwóch ruchów - X lub Y. Wygrane to po prostu określone „punkty”, których największą liczbę każdy gracz stara się zdobyć.

I X wykonuje ruch A Igrek wykonuje ruch
B wykonuje ruch X O: 0
B: b 0
O: 1 > 0
B: b 1< b 3
B wykonuje ruch Igreka O: 2< a 3
B: b 2 > b 0
O: b 3
B: 3

Reguły gry, reprezentowane przez tę matrycę, „popychają” graczy do wdrożenia „czerwonej” opcji (2, 2), nawet jeśli wygrane graczy w tym przypadku będą znacznie mniejsze niż we wszystkich innych opcjach. To prawda, że ​​​​w zależności od stosunku wygranych (który może być również ujemny - to znaczy strat), oznaczonych literami „a” i „b” ze wskaźnikami, częstotliwość realizacji każdej opcji będzie inna.

W szczególności na wybór może wpływać średnia arytmetyczna wypłat przy wyborze każdej strategii, a także szacowane prawdopodobieństwo, z jakim gracz wykona dany ruch (które, nawiasem mówiąc, można przybliżyć częstotliwością ruchów wykonane w poprzednich rundach). Zatem w najprostszym przypadku gracz A, aby ocenić ruch X, dodaje 0 i 2 i dzieli wynik przez dwa, zakładając, że wybór ruchu B jest równie prawdopodobny. To samo robi z ruchem Igreka – dodaje 1 do 3, po czym wynik dzieli przez dwa – i porównuje wyniki. W bardziej złożonym przypadku gracz oblicza sumę a 0 *p x + a 2 *py y , gdzie p x i p y to prawdopodobieństwa ruchów X i Y wykonanych przez gracza B. Wynik porównuje się z a 1 *p x + a 3 *p y.

Można by oczywiście wynik ponownie podzielić przez dwa, ale skoro dzielenie przez dwa ma miejsce dla obu wariantów ruchu, to operacja ta nie jest konieczna do porównywania wartości, gdyż co prawda w przypadku „równie prawdopodobnych porusza się.”

Gracz może także skupić się na samych wartościach. Przykładowo, jeśli jeden z ruchów oznacza prawdopodobną stratę – zwłaszcza dużą, na którą gracz nie może sobie pozwolić – istnieje możliwość, że gracz wybierze inny ruch, nawet jeśli oczekiwana wypłata za ten ruch będzie średnio niższa , ale w obu przypadkach jest to wynik pozytywny .

Wreszcie, musimy pamiętać, że ludzie często, że tak powiem, „pamiętają drugiego gracza”. Jeśli drugi gracz jest konkurentem lub nawet wrogiem, może pojawić się tendencja do wybrania ruchu, który zaszkodzi drugiemu graczowi, nawet jeśli pierwszy gracz przez to niewiele zyska, a nawet może stracić. Jeśli drugi gracz jest przyjacielem, częściej zostanie wybrany ruch, który pozwoli mu też trochę wygrać - w przypadku, gdy „gra” nie jest z góry zadeklarowaną konkurencją, ale jakimś procesem od prawdziwe życie. Możliwości zemsty i pobłażania zależą oczywiście od relacji w matrixie – przy niektórych z nich woleliby zapomnieć, że przeciwnik jest Twoim przyjacielem, niż zacząć się z nim lekko bawić.

Innymi słowy, zasada, którą rozważamy, odzwierciedla właśnie tendencję, a nie determinizm. Im silniejszy stosunek wartości wygranych i przegranych jest podobny do tych, które pojawiły się w „dylemacie więźnia”, tym częściej i szybciej system będzie prowadził graczy do „najgorszej” opcji i tym „gorszą” będzie ta opcja Być.

Istnieje rodzaj „niewidzialnej ręki rynku”, która wydaje się niewidocznie popychać graczy… cóż, wiesz. Dokładniej: nie, może nie wiesz. W klasycznej wersji „ręka rynku” zdaje się pchać tam, gdzie wszyscy chcą, jednak tutaj pcha w złym kierunku. Nie dla dobra wspólnego, ale w trwały kryzys, którego w innych okolicznościach można by uniknąć, co ilustruje zarówno „dylemat więźnia”, jak i hipotetyczny przykład konkurencji między firmami, a prawdziwy przykład z nieuniknionym przeszacowaniem harmonogramów tworzenia oprogramowania, o czym mówiliśmy w poprzednim artykule.

Rynek popycha graczy w stronę równowagi Nasha, która może być arbitralnie odległa od ich wspólnego i osobistego dobra.

W tym przypadku rozważaliśmy tylko dwóch graczy i grę z dwoma ruchami, ale możliwe jest szersze uogólnienie, które jest właśnie sformułowaniem równowagi Nasha:

Jeśli w pewnej grze z dowolną liczbą graczy i macierzą wypłat istnieje taki stan, że jeśli jakikolwiek indywidualny gracz wybierze ruch, który mu nie odpowiada, jego osobiste wygrane zmniejszą się, to stan ten okaże się „ równowaga” dla tej gry.

Ponadto w niektórych przypadkach ruchy graczy będą zmierzać w stronę tego stanu, nawet jeśli w grze są inne stany, w których wypłaty graczy jako całości i/lub indywidualnie są wyższe.

Zauważalnie trudniej jest podać przykłady takiego ogólnego przypadku w sposób podobny do poprzednio stosowanego, gdyż dodanie każdego gracza doda kolejny wymiar do macierzy wypłat. Jednak o tym później.

A Oscar Morgenstern stał się założycielem nowej interesującej gałęzi matematyki, którą nazwano „teorią gier”. W latach pięćdziesiątych XX wieku tą dziedziną zainteresował się młody matematyk John Nash. Teoria równowagi stała się tematem jego rozprawy doktorskiej, którą napisał w wieku 21 lat. Tak się urodziłem nowa strategia gry o nazwie „Nash Equilibrium”, która wiele lat później – w 1994 r., zdobyła Nagrodę Nobla.

Długa przerwa między napisaniem pracy dyplomowej a powszechnym uznaniem stała się sprawdzianem dla matematyka. Geniusz bez uznania spowodował poważne zaburzenia psychiczne, ale John Nash był w stanie rozwiązać ten problem dzięki swojemu doskonałemu logicznemu umysłowi. Jego teoria „równowagi Nasha” została nagrodzona Nagrodą Nobla, a jego życie zostało sfilmowane w filmie „Piękny umysł”.

Krótko o teorii gier

Ponieważ teoria równowagi Nasha wyjaśnia ludzkie zachowanie w sytuacjach interakcyjnych, warto zatem dokonać przeglądu podstawowych pojęć teorii gier.

Teoria gier bada zachowanie uczestników (agentów) w warunkach wzajemnej interakcji niczym gry, gdy wynik zależy od decyzji i zachowań kilku osób. Uczestnik podejmuje decyzje w oparciu o swoje przewidywania dotyczące zachowania innych, co nazywa się strategią gry.

Istnieje również strategia dominująca, w której uczestnik uzyskuje optymalny wynik dla dowolnego zachowania innych uczestników. Jest to najlepsza strategia, w której wygrywają obie strony.

Dylemat więźnia i przełom naukowy

Dylemat więźnia to gra, w której uczestnicy zmuszeni są do podejmowania racjonalnych decyzji, aby osiągnąć wspólny cel w obliczu sprzecznych alternatyw. Pytanie, którą z tych opcji wybierze, uznając swój interes osobisty i ogólny oraz niemożność uzyskania obu. Gracze wydają się być zamknięci w rygorystycznych warunkach gry, co czasami zmusza ich do bardzo produktywnego myślenia.

Dylemat ten badał amerykański matematyk, a uzyskana przez niego równowaga była rewolucyjna w swoim rodzaju. Ta nowa koncepcja szczególnie wyraźnie wpłynęła na opinię ekonomistów na temat tego, w jaki sposób uczestnicy rynku dokonują wyborów, biorąc pod uwagę interesy innych, przy ścisłym powiązaniu i skrzyżowaniu interesów.

Najlepszym sposobem na studiowanie teorii gier jest konkretne przykłady, ponieważ sama ta dyscyplina matematyczna nie jest sucho teoretyczna.

Przykład dylematu więźnia

Na przykład dwie osoby dopuściły się rozboju, wpadły w ręce policji i są przesłuchiwane w oddzielnych celach. Jednocześnie policjanci oferują każdemu uczestnikowi korzystne warunki zwolnienia, jeśli będzie zeznawał przeciwko swojemu partnerowi. Każdy przestępca ma następujący zestaw strategii, które rozważy:

  1. Obaj składają zeznania w tym samym czasie i otrzymują 2,5 roku więzienia.
  2. Obaj jednocześnie milczą i każdy otrzymuje po 1 roku, ponieważ w tym przypadku podstawa dowodowa ich winy będzie niewielka.
  3. Jeden zeznaje i zostaje uwolniony, drugi milczy i dostaje 5 lat więzienia.

Oczywiście wynik sprawy zależy od decyzji obu uczestników, jednak nie mogą dojść do porozumienia, ponieważ siedzą w różnych celach. Wyraźnie widoczny jest także konflikt ich osobistych interesów w walce o wspólne interesy. Każdy więzień ma dwie opcje działania i 4 możliwe wyniki.

Łańcuch logicznych wniosków

Zatem przestępca A rozważa następujące opcje:

  1. Ja milczę i mój partner milczy – oboje dostaniemy 1 rok więzienia.
  2. Oddaję partnera, a on mnie wydaje – oboje dostajemy 2,5 roku więzienia.
  3. Ja milczę, a partner mnie donosi – ja dostaję 5 lat więzienia, a on wolność.
  4. Wydaję partnera, ale on milczy – dostaję wolność, a on dostaje 5 lat więzienia.

Przedstawmy macierz możliwe rozwiązania i wyniki dla jasności.

Tabela prawdopodobnych wyników dylematu więźnia.

Pytanie brzmi, co wybierze każdy z uczestników?

„Nie możesz milczeć, nie możesz mówić” lub „Nie możesz milczeć, nie możesz mówić”

Aby zrozumieć wybór uczestnika, musisz prześledzić łańcuch jego myśli. Idąc za rozumowaniem przestępcy A: jeśli ja będę milczeć i mój partner będzie milczał, otrzymamy karę minimalną (1 rok), ale nie wiem, jak się zachowa. Jeśli będzie zeznawał przeciwko mnie, to lepiej, żebym ja też zeznawał, bo inaczej grozi mi 5 lat więzienia. Lepiej dla mnie służyć 2,5 roku niż 5 lat. Jeśli będzie milczał, tym bardziej muszę zeznawać, bo w ten sposób uzyskam wolność. Uczestnik B argumentuje dokładnie w ten sam sposób.

Nietrudno zrozumieć, że dominującą strategią każdego z przestępców jest składanie zeznań. Optymalny moment tej gry następuje, gdy obaj przestępcy złożą zeznania i otrzymają swoją „nagrodę” – 2,5 roku więzienia. Teoria gier Nasha nazywa to równowagą.

Suboptymalne optymalne rozwiązanie Nasha

Rewolucyjny charakter poglądu Nasha nie jest optymalny, jeśli weźmiemy pod uwagę indywidualnego uczestnika i jego osobisty interes. W końcu najlepszą opcją jest milczenie i uwolnienie się.

Równowaga Nasha to punkt zbieżności interesów, w którym każdy uczestnik wybiera opcję, która jest dla niego optymalna tylko wtedy, gdy inni uczestnicy wybiorą określoną strategię.

Biorąc pod uwagę opcję, w której obaj przestępcy milczą i dostają tylko 1 rok, możemy nazwać ją opcją optymalną w sensie Pareto. Jest to jednak możliwe tylko wtedy, gdy przestępcy dojdą do porozumienia z wyprzedzeniem. Ale nawet to nie gwarantowałoby takiego wyniku, gdyż pokusa odstąpienia od porozumienia i uniknięcia kary jest ogromna. Brak całkowitego zaufania do siebie i niebezpieczeństwo otrzymania 5 lat zmuszają nas do wyboru opcji spowiedzi. Po prostu irracjonalne jest myślenie, że uczestnicy, działając w porozumieniu, będą trzymać się cichej opcji. Wniosek ten można wyciągnąć badając równowagę Nasha. Przykłady tylko potwierdzają tę tezę.

Samolubny lub racjonalny

Teoria równowagi Nasha przyniosła oszałamiające odkrycia, które obalały wcześniej istniejące zasady. Na przykład Adam Smith uważał zachowanie każdego uczestnika za absolutnie samolubne, co przywróciło równowagę w systemie. Teorię tę nazwano „niewidzialną ręką rynku”.

John Nash zauważył, że gdyby wszyscy uczestnicy działali w dążeniu wyłącznie do własnych interesów, nigdy nie doprowadziłoby to do optymalnego wyniku grupy. Biorąc pod uwagę, że racjonalne myślenie jest nieodłączną cechą każdego uczestnika, bardziej prawdopodobny jest wybór oferowany przez strategię równowagi Nasha.

Czysto męski eksperyment

Doskonałym przykładem jest gra Blonde Paradox, która choć pozornie nieodpowiednia, wyraźnie ilustruje działanie teorii gier Nasha.

W tej grze musisz sobie wyobrazić, że grupa wolnych facetów przychodzi do baru. W pobliżu jest grupa dziewcząt, z których jedna jest lepsza od pozostałych – mówi blondynka. Jak powinni się zachować faceci, aby zdobyć dla siebie najlepszą dziewczynę?

Zatem rozumowanie chłopaków: jeśli wszyscy zaczną poznawać blondynkę, najprawdopodobniej nikt jej nie zdobędzie, a jej przyjaciele też nie będą chcieli się z nią spotkać. Nikt nie chce być drugim wyborem. Ale jeśli chłopaki zdecydują się unikać blondynki, prawdopodobieństwo, że każdy z nich znajdzie dobrego przyjaciela wśród dziewcząt, jest wysokie.

Sytuacja równowagi Nasha nie jest optymalna dla facetów, ponieważ realizując wyłącznie własne egoistyczne interesy, każdy wybrałby blondynkę. Można zauważyć, że dążenie wyłącznie do egoistycznych interesów będzie równoznaczne z upadkiem interesów grupowych. Równowaga Nasha oznaczałaby, że każdy facet działa we własnym interesie, co jest zgodne z interesem całej grupy. Nie jest to optymalna opcja dla każdego osobiście, ale jest optymalna dla każdego w oparciu o ogólną strategię sukcesu.

Całe nasze życie jest grą

Podejmowanie decyzji w realne warunki bardzo przypomina grę, w której oczekujesz od innych uczestników pewnego racjonalnego zachowania. W biznesie, w pracy, w zespole, w firmie, a nawet w relacjach z płcią przeciwną. Od dużych transakcji po zwykłe sytuacje życiowe – wszystko podlega temu czy innemu prawu.

Oczywiście rozważane sytuacje w grze z przestępcami i barem to tylko doskonałe ilustracje pokazujące równowagę Nasha. Przykłady takich dylematów pojawiają się bardzo często na rynku realnym, a szczególnie dotyczy to przypadków, w których rynek kontroluje dwóch monopolistów.

Strategie mieszane

Często bierzemy udział nie w jednej, ale kilku grach na raz. Wybierając jedną z opcji w jednej grze, kierując się racjonalną strategią, ale kończy się to w innej grze. Po podjęciu kilku racjonalnych decyzji może się okazać, że nie jesteś zadowolony z wyniku. Co robić?

Rozważmy dwa rodzaje strategii:

  • Czysta strategia to zachowanie uczestnika wynikające z myślenia o możliwym zachowaniu innych uczestników.
  • Strategia mieszana lub strategia losowa to losowa naprzemienność czystych strategii lub wybór czystej strategii z określonym prawdopodobieństwem. Strategia ta nazywana jest również randomizowaną.

Biorąc pod uwagę to zachowanie, które otrzymujemy Nowy wygląd dla równowagi Nasha. Jeśli wcześniej powiedziano, że gracz wybiera strategię raz, to można sobie wyobrazić inne zachowanie. Można założyć, że gracze wybierają strategię losowo z pewnym prawdopodobieństwem. Gry, w których równowagi Nasha nie można znaleźć w strategiach czystych, zawsze mają je w strategiach mieszanych.

Równowaga Nasha w strategiach mieszanych nazywana jest równowagą mieszaną. Jest to równowaga, w której każdy uczestnik wybiera optymalną częstotliwość wyboru swoich strategii, pod warunkiem, że pozostali uczestnicy wybierają swoje strategie z określoną częstotliwością.

Kary i strategia mieszana

Przykład strategii mieszanej można podać w grze w piłkę nożną. Najlepszą ilustracją strategii mieszanej są być może rzuty karne. Mamy więc bramkarza, który może wskoczyć tylko w jeden róg i zawodnika, który wykona rzut karny.

Jeśli więc za pierwszym razem zawodnik wybierze strategię oddania strzału w lewy róg, a bramkarz również wpadnie w ten róg i złapie piłkę, to jak mogą potoczyć się wydarzenia za drugim razem? Jeśli zawodnik uderzy w przeciwny róg, jest to najprawdopodobniej zbyt oczywiste, ale trafienie w ten sam róg jest nie mniej oczywiste. Dlatego zarówno bramkarz, jak i wykonawca rzutu nie mają innego wyjścia, jak tylko zdać się na losowy wybór.

Zatem, na przemian losowy wybór z konkretną, czystą strategią, zawodnik i bramkarz starają się uzyskać maksymalny wynik.

W wyniku opanowania tego rozdziału student powinien:

wiedzieć

  • wyznaczanie równowagi Nasha (zarówno w strategiach czystych, jak i mieszanych);
  • podstawowe własności równowagi Nasha;
  • twierdzenia formułujące warunki istnienia równowagi Nasha w grach strategicznych;
  • definicja pojęcia „równowaga drżącej ręki”;

móc

Rozwiązać problem znalezienia równowagi Nasha w grach dwumacierzowych (z uwzględnieniem metody graficznej dla gier);

własny

  • najprostsze metody analizy właściwości gier bimacierzowych 2 x 2 z wykorzystaniem wyników ich rozwiązania graficznego;
  • system poglądów zarówno na temat możliwości, jak i obiektywnych problemów praktycznego zastosowania koncepcji równowagi Nasha;
  • aparat terminologiczny pozwalający na samodzielne zapoznawanie się z literaturą naukową i fachową wykorzystującą koncepcję równowagi Nasha i jej własności.

W tym rozdziale rozważymy główny przedmiot badań teorii gier niekooperacyjnych, zwany równowagą Nasha. Ta koncepcja został zaproponowany przez wybitnego amerykańskiego matematyka Johna Forbesa Nasha, najpierw w jego rozprawie doktorskiej, a następnie w serii artykułów publikowanych w latach 1950-1953. .

^ Sytuacja S* w grze Г = (I, () i О I, ((s)) i О I) równowagę Nasha (w czystych strategiach) nazwiemy równowagą Nasha (w czystych strategiach), jeśli dla dowolnego gracza ja О I

Inaczej mówiąc, sytuacja równowagi Nasha to sytuacja w grze, od której nieopłacalne jest indywidualne odejście żadnego z graczy (pod warunkiem, że pozostali uczestnicy gry będą trzymać się swoich strategii, tworząc równowagę Nasha).

Rozważmy mapowania, które dla każdego gracza i О I dla każdej możliwej subsytuacji О wiążą pewną strategię będącą jego najlepszą reakcją na daną subsytuację:

Mapowania, które zwracają najlepsze reakcje na podsytuacje, nazywane są także mapowaniami odpowiedzi gracza. Z nierówności (3.1) wynika, że ​​sytuację równowagi Nasha tworzą strategie, które są zwracane przez mapowanie odpowiedzi wszystkich graczy, tj. Sytuacja równowagi Nasha to sytuacja utworzona przez najlepsze odpowiedzi każdego gracza na najlepsze odpowiedzi pozostałych graczy:

Z kolei z warunku (3.3) wynikają następujące własności.

  • 1. Strategie ściśle zdominowane i strategie UFO nie mogą wejść w równowagę Nasha.
  • 2. Strategii tworzących równowagę Nasha nie da się wyeliminować w procesie usuwania strategii ściśle zdominowanych i racjonalizacji gry.

Jednocześnie należy podkreślić, że strategie słabo zdominowane nie posiadają wymienionych właściwości. Nie jest trudno skonstruować przykład równowagi Nasha, w której będzie obecna jedna lub więcej strategii słabo zdominowanych.

Aby rozważyć właściwości równowagi Nasha, wróćmy do gry w dylemat więźnia (patrz tabela 2.1).

Jak łatwo zauważyć, gra ta ma unikalny stan równowagi Nasha. Jest to sytuacja (C, C), w której obaj gracze przyznają się do winy i otrzymują po pięć lat więzienia. Podstawową cechą sytuacji (C, C) jest właśnie to, że indywidualne odejście od niej naprawdę nie jest korzystne dla nikogo. Jeśli któryś z więźniów spróbuje zmienić strategię z „przyznać się” na „milczeć”, to wtedy

w ten sposób tylko pogorszy swoją sytuację – zamiast pięciu lat kary otrzyma dziesięć – i poprawi sytuację drugiego zawodnika, który zostanie zwolniony.

Trzeba przyznać, że sytuacja równowagi w tym przykładzie jest wynikiem nieefektywnym dla więźniów. Rzeczywiście, w sytuacji (M, M) – obaj milczą – ich użyteczność jest większa (wyrok to rok w porównaniu z pięcioma). Jednakże sytuacja (M, M) ma tę wadę, że jest niestabilna. W tym przypadku korzystna jest dla każdego gracza zmiana strategii „cichej” na „przyznanie się”, pod warunkiem, że drugi gracz nadal będzie trzymał się strategii „cichej”. W tym przypadku kara dla zdrajcy wynosi zero, chociaż dla wielbiciela gwałtownie wzrasta: od jednego roku do dziesięciu.

Zatem dylemat więźnia dość wyraźnie odzwierciedla fakt, że

Równowaga Nasha niekoniecznie jest „najbardziej opłacalną” sytuacją dla graczy, jest to sytuacja stabilna.

Również na przykładzie dylematu więźnia można dość wyraźnie wykazać związek równowagi Nasha z tak podstawowym pojęciem ekonomii, jak optymalność Pareto. Przypomnijmy Ci to

rozkład nazywa się optymalnym, ale Pareto (Pareto-optymalnym), gdy użyteczność (dobrobyt) żadnego z uczestników tej dystrybucji nie może zostać zwiększona bez zmniejszenia użyteczności jakiegokolwiek innego uczestnika.

Łatwo zauważyć, że w dylemacie więźnia sytuacja równowagi Nasha jest jedyną nieoptymalną w sensie Pareto: użyteczność uczestników „bezboleśnie dla każdego z nich” można poprawić przechodząc od sytuacji (C, C) do sytuacji (M, M), przy czym ta ostatnia nie jest równowagą zdaniem Nasha ze względu na jej niestabilność. Z tego punktu widzenia dylemat więźnia jest klasyczny przykład, wykazując różnice pomiędzy pojęciami „równowagi Nasha” i „optymalizacji Pareto”.

Zademonstrujmy możliwości praktycznego wykorzystania koncepcji równowagi Nasha na przykładzie wykresów z dodatku literackiego.

  • Za wkład w teorię gier niekooperacyjnych J. Nash otrzymał w 1994 roku Nagrodę Nobla w dziedzinie ekonomii
  • Wprowadzony przez włoskiego ekonomistę i socjologa Vilfredo Pareto (1848-1923)

W prawdziwym życiu często pojawiają się pytania, dlaczego firmy współpracują na niektórych rynkach, a agresywnie konkurują na innych; z jakich środków powinna skorzystać firma, aby zapobiec inwazji potencjalnych konkurentów; w jaki sposób podejmowane są decyzje cenowe; gdy zmieniają się warunki popytu lub kosztów. Aby zbadać te problemy, naukowcy wykorzystują teorię gier.
Pierwszymi badaczami teorii gier byli amerykański matematyk J.-F. Neumanna i austroamerykańskiego ekonomisty O. Morgensterna („Teoria gier i zachowania ekonomiczne”, 1944). Rozszerzyli kategorie matematyczne na życie gospodarcze społeczeństwa, wprowadzając pojęcia strategii optymalnych, maksymalizacji oczekiwanej użyteczności, dominacji w grze (rynku) i umów koalicyjnych. Naukowcy ci mieli stymulujący wpływ na rozwój nauki społeczne ogólnie rzecz biorąc, statystyka matematyczna, myśl ekonomiczna, w szczególności w zakresie praktycznego wykorzystania teorii prawdopodobieństwa i teorii gier w ekonomii.
Naukowcy starali się sformułować podstawowe kryteria racjonalnego zachowania uczestnika rynku. Rozróżnili dwa rodzaje gier. Pierwsza - „suma zerowa” - przewiduje taki zysk, który powstaje z kosztów innych graczy, to znaczy łączna kwota korzyści i kosztów jest zawsze równa zeru. Innym rodzajem jest „gra o sumie plus”, w której poszczególni gracze rywalizują o wygrane w oparciu o swoje zakłady. Czasami wzmocnienie to powstaje w wyniku obecności „wyjścia” (termin z gra karciana w moście; tak nazywa się jednego z graczy, który stawiając zakłady nie bierze udziału w grze), całkowicie pasywny i często będący przedmiotem wyzysku. W obu przypadkach gra nieuchronnie wiąże się z ryzykiem, gdyż każdy z jej uczestników, jak uważał J.-F. Neumann i O. Morgenstern „starają się maksymalizować funkcję, której zmienne nie są kontrolowane”. Jeśli wszyscy gracze są jednakowo utalentowani, czynnikiem decydującym staje się przypadek. Jednak zdarza się to rzadko. Niemal zawsze najważniejszą rolę w grze odgrywa przebiegłość, za pomocą której stara się wyjawić plan wroga i zatuszować jego zamiary, a następnie zająć korzystne stanowiska i zmusić wroga do działania ze stratą. Ważną rolę odgrywa także „kontrprzebiegłość”.
Podczas rozgrywki wiele zależy od racjonalnego zachowania gracza, czyli przemyślanego wyboru i optymalnej strategii. Opracowanie sformalizowanego (w postaci modeli) opisu sytuacje konfliktowe w szczególności „formułę równowagi”, czyli stabilność decyzji przeciwników w grze, badał J.-F. Nasha
Nash John-Forbes (ur. 1928) – amerykański ekonomista, laureat nagroda Nobla(1994). Urodzony w Bluefield (Wirginia Zachodnia, USA). Studiował na Uniwersytecie Carnegie Mellon jako inżynier chemik, ale zainteresował się matematyką i przeniósł się na wydział matematyki. Uzyskał tytuł licencjata z matematyki i jednocześnie tytuł magistra matematyki.
Rozpoczął studia podyplomowe o specjalizacji matematycznej na Uniwersytecie Princeton, gdzie obronił pracę doktorską na temat „Gry niekooperacyjne” (1950). W następnym roku została opublikowana jako odrębny artykuł w czasopiśmie Annals of Mathematics. Będąc na ostatnim roku studiów, brałem udział w Praca badawcza RAND Corp., która sfinansowała szereg jego projektów badawczych z zakresu teorii gier, ekonomii matematycznej i ogólnej teorii racjonalnego zachowania w sytuacjach związanych z grami.
W latach 1951-1959 J.-F. Nash jest wykładowcą w Massachusetts Institute of Technology. Równolegle prowadzi działalność naukową. Udało mu się rozwiązać klasyczny problem związane z geometrią różniczkową.
Z powodu ciężkiej choroby przez 20 lat był niezdolny do pracy.
W latach 70. choroba ustąpiła. Nie udało mu się jednak osiągnąć produktywnych wyników naukowych na najwyższym poziomie.
J.-F. Nash kontynuuje swoje badania w matematyce. Ogółem opublikował 21 prac naukowych, z czego 16 ukazało się przed 1959 rokiem.
Jest członkiem Narodowej Akademii Nauk Stanów Zjednoczonych, Towarzystwa Ekonometrycznego i Amerykańskiej Akademii Sztuki i Nauki.
W teoria klasyczna gry, gry kooperacyjne i niekooperacyjne są interpretowane odmiennie. J.-F. Nash jako pierwszy wskazał różnicę między nimi i zdefiniował gry kooperacyjne jako gry umożliwiające swobodną wymianę informacji i wymuszanie warunków pomiędzy graczami, a gry niekooperacyjne jako takie, które nie pozwalają na swobodną wymianę informacji i wymuszanie warunków. Gra nie jest kooperacyjna, gdy współpraca między graczami jest w ogóle zabroniona. W artykułach „Punkty równowagi w grach N-numerowanych” i „Problem targowania się” (1951) precyzyjnie wyprowadził matematycznie reguły postępowania uczestników (graczy), którzy wygrywają zgodnie z obraną strategią. Każdy gracz stara się ograniczać stopień ryzyka stosując najbardziej dochodową strategię, czyli stale dostosowując się do zachowań tych, którzy również chcą osiągać jak najlepsze wyniki.
Po dokładnym przestudiowaniu różne gry, tworząc serię nowych gry matematyczne i obserwacja zachowań uczestników w różnych sytuacjach w grze, J.-F. Nash starał się zrozumieć, jak funkcjonują rynki, w jaki sposób firmy podejmują ryzykowne decyzje i dlaczego kupujący zachowują się w ten sposób. Rzeczywiście, w ekonomii, podobnie jak w grze, menedżerowie firm muszą brać pod uwagę nie tylko najnowsze, ale także poprzednie kroki konkurentów, a także sytuację na całym polu gospodarczym (gra, na przykład szachy) i inne czynniki .
Wiadomo, że podmiotami życia gospodarczego są aktywni uczestnicy, którzy na konkurencyjnym rynku podejmują ryzyko, które musi być uzasadnione. Dlatego każdy z nich, podobnie jak gracz, musi mieć własną strategię. Z tego właśnie wyszedł J.-F. Nasha, opracowując metodę, którą później nazwano „równowagą Nasha”.
Równowaga Nasha to zbiór strategii lub działań, zgodnie z którymi każdy uczestnik realizuje optymalną strategię, wyprzedzając działania przeciwników.
„Strategia” jako podstawowe pojęcie teorii gier J.-F. Nash wyjaśnia na podstawie „gry o sumie zerowej” („gry symetrycznej”), w której każdy uczestnik ma określoną liczbę strategii. Wygrane każdego gracza zależą od wybranej przez niego strategii, a także od strategii jego przeciwników. Na tej podstawie budowana jest macierz w celu znalezienia optymalnej strategii, która przy wielokrotnym powtarzaniu gry zapewnia określonemu graczowi maksymalną możliwą średnią wygraną (lub maksymalną możliwą średnią stratę). Ponieważ gracz ten nie wie, jaką strategię wybierze wróg, bardziej wskazane jest dla niego wybranie strategii zaprojektowanej pod kątem najbardziej niekorzystnego dla niego zachowania wroga (zasada „Gwarantowanego Wyniku”). Działając ostrożnie i biorąc pod uwagę silnego konkurenta, gracz ten wybierze minimalną możliwą wygraną dla każdej ze swoich strategii. A zatem przede wszystkim minimalnie zwycięskie strategie wybierze ten, który zapewni mu maksimum ze wszystkich minimalnych wygranych („maximin”).
Jego przeciwnik prawdopodobnie myśli tak samo. We wszystkich strategiach tego gracza znajdzie dla siebie największe straty, a następnie spośród tych maksymalnych strat wybierze minimum („minimax”). Jeśli maximin jest równy minimaxowi, decyzje graczy będą stabilne, a gra będzie miała równowagę. Stabilność (równowaga) decyzji (strategii) polega na tym, że dla obydwu uczestników gry odejście od obranej strategii będzie nieopłacalne. Gdy maksymin nie jest równy minimaksowi, wówczas decyzje (strategie) obu graczy, jeśli choć w pewnym stopniu odgadli wybór strategii wroga, będą niestabilne i nierównowagi.
Oznacza to, że równowaga Nasha to wynik, w którym strategia każdego gracza jest najlepsza spośród innych strategii przyjętych przez pozostałych uczestników gry. Definicja ta opiera się na fakcie, że każdy gracz zmieniając swoją rolę nie może osiągnąć największej korzyści (maksymalizacji funkcji użyteczności), jeśli pozostali uczestnicy będą twardo trzymać się własnej linii zachowań.
Jego „wzór równowagi” J.-F. Nash wzmocnił wskaźnik optymalnej ilości informacji. Wyprowadził to z analizy sytuacji, w których gracz jest w pełni poinformowany o swoich przeciwnikach i ma o nich niepełną informację. Przekładając ten postulat z języka matematycznego na język życia gospodarczego, naukowiec wprowadził (jako ważny element informacyjny wiedzy o warunkach „otoczenia zewnętrznego”) niekontrolowane zmienne relacji rynkowych.
Pojawienie się równowagi w nauce J.-F. Nasha odkryto w wyniku licznych badań, które miały przybliżyć go do realnej rzeczywistości gospodarczej. Aby poprawić równowagę J.-F. Nash kierował badaniami wielu naukowców. Wśród nich są J.-C. Harsanyi.
Harsanyi John-Charles (1920-2000) – amerykański ekonomista, laureat Nagrody Nobla (1994). Urodzony w Budapeszcie (Węgry), absolwent gimnazjum luterańskiego.
Uzyskał wyższe wykształcenie medyczne. W 1947 r. po obronie rozprawy doktorskiej rozpoczął pracę jako nauczyciel w uniwersyteckim Instytucie Socjologii. Ze względu na swoje antymarksistowskie poglądy w 1948 roku przeszedł na emeryturę, a następnie wyjechał do Australii. Tam pracował w fabryce i jednocześnie studiował na Uniwersytecie w Sydney, gdzie studiował język angielski i ekonomię. W 1953 uzyskał stopień magistra.
Od 1954 roku jest wykładowcą ekonomii na Uniwersytecie w Brisbane. Dwa lata później J.-C. Harsanyi został uhonorowany przez Fundację Rockefellera, co upoważniło go do napisania rozprawy doktorskiej na Uniwersytecie Stanforda przez kolejne dwa lata.
W 1958 r. J.-C. Harsanyi wraca do Australii. Czując jednak pewną izolację, gdyż teoria gier była wówczas w tym kraju praktycznie nieznana, przeniósł się do Stanów Zjednoczonych, gdzie pracował jako profesor ekonomii na Uniwersytecie w Detroit. W 1964 był profesorem w Walter Haas Economic Center na Uniwersytecie Kalifornijskim w Berkeley.
Pierwszy prace naukowe J.-C. Harsanyi opublikował na początku lat pięćdziesiątych XX wieku książkę na temat wykorzystania funkcji użyteczności Neumanna-Morgensterna w ekonomii i etyce dobrobytu. J.-C. Harsanyi jest autorem wielu prac z zakresu etyki utylitarnej, ekonomii dobrobytu oraz z obszaru z pogranicza ekonomii i filozofii moralności. W książce „Racjonalne zachowanie i negocjowanie równowagi w grach i sytuacjach społecznych” (1977) uzasadnia „ogólną teorię racjonalnego zachowania”, obejmującą „teorię indywidualne rozwiązanie", pytania etyka biznesu i teorii gier. Wśród jego książek znajdują się: Eseje o etyce, zachowanie społeczne i naukowe wyjaśnienie” (1976), „Prace nad teorią gier” (1982), „ Ogólna teoria wybór równowagi w grach” (1988 wraz z R.-J.-R. Seltenem), która ukazała się w języku rosyjskim w 2001 r., „Racjonalna interakcja” itp.
J.-C. Harsanyi jest doktorem honoris causa Uniwersytetu Northwestern i profesorem honoris causa Uniwersytetu Kalifornijskiego (USA).
Przedmiotem badań jest J.-C. Harsany byli trudne sytuacje, które występują w obecności asymetrycznej informacji. W grze z pełna informacja wszyscy gracze znają przewagę innych, a w grze z niepełnymi informacjami potrzebują tej wiedzy.
Ponieważ interpretacja równowagi Nasha opierała się na przewidywaniu, że gracze znają przewagę innych, nie wszystkie metody były dostępne do analizy gier z niepełnymi informacjami, mimo że gry te pełniej odzwierciedlają strategiczne relacje w świecie rzeczywistym.
Sytuację radykalnie zmieniły badania J.-C. Harsanyi („Gry z niepełnymi informacjami, w które grają gracze Baysian”). Naukowiec założył, że każdy gracz jest jednym z kilku „typów”, a każdy typ odpowiada zbiorowi możliwych korzyści dla gracza i prawdopodobnie klasyfikuje prawie wszystkich na typy graczy. Oznacza to, że każdy gracz w grze z niepełnymi informacjami wybiera strategię jednego z tych typów. Mając uzgodniony wymóg dotyczący możliwości dystrybucji zawodników, J.-C. Harsanyi pokazał, że dla każdej gry z niepełnymi informacjami istnieje równoważna gra z pełną informacją. Oznacza to, że przekształcił grę z niekompletnymi informacjami w grę z niedoskonałymi informacjami. W takim przypadku grę można regulować za pomocą standardowych modeli.
Przykładem niedoskonałej gry informacyjnej może być sytuacja, w której prywatne firmy i rynki finansowe nie wiedzą dokładnie, jaka jest przewaga banku centralnego w odniesieniu do dylematu inflacja-bezrobocie. W związku z tym polityka bankowa dotycząca przyszłości stopy procentowe. Interakcję przyszłych oczekiwań z polityką banku centralnego można analizować za pomocą metodologii zaproponowanej przez J.-C. Harsanyi. W najprostszej formie bank może albo skoncentrować się na walce z inflacją i w związku z tym przygotować się na wdrożenie restrykcyjnej polityki przy wysokich stopach procentowych, albo będzie walczyć z bezrobociem przy niskich stopach procentowych.
Równowaga Nasha została udoskonalona i ulepszona, szczególnie w odniesieniu do gier z niepełną informacją, przez R.-J.-R. Selten.
Selten Reinhard-Justus-Reginald (ur. 1930) to niemiecki ekonomista, laureat Nagrody Nobla (1994). Urodzony we Wrocławiu (obecnie Wrocław, Polska). W 1951 ukończył Melsungen Liceum. To tutaj zainteresowałem się matematyką i po raz pierwszy zetknąłem się z teorią gier. Studiował na Wydziale Matematyki Uniwersytetu we Frankfurcie nad Menem, który ukończył w 1957 roku przez dziesięć lat
R.-J.-R. Selten pracował tam jako asystent. Ten okres jego życia był pełen aktywnej pracy eksperymentalnej. W 1959 roku obronił pracę doktorską z matematyki. W latach 1969-1972. jest profesorem ekonomii na Wolnym Uniwersytecie w Berlinie Zachodnim. Następnie pracował na Uniwersytecie w Bielefeld, gdzie kontynuował badania eksperymentalne teoria gry.
Od 1984 r. R.-J.-R. Selten jest profesorem na Wydziale Ekonomii na Uniwersytecie Friedricha Wilhelma w Bonn. Organizując rok badawczy (od 1 października 1987 do 30 września 1988) nad teorią gier w naukach behawioralnych, udało mu się zebrać dużą grupa międzynarodowa ekonomiści, biolodzy, matematycy, politolodzy, psycholodzy i filozofowie. Ich praca ogólna stwierdził
w 4 książkach „Modele równowagi gier” (1991). R.-J.-R. Selten jest twórcą teorii gier niekooperacyjnych.
W 1995 r. R.-J.-R. Selten został wybrany wiceprezesem Europejskiego Stowarzyszenia Gospodarczego, aw 1997 r. – jego prezesem. Jest członkiem Amerykańskiego Stowarzyszenia Ekonomicznego i Towarzystwa Ekonometrycznego oraz członkiem wielu rad redakcyjnych. czasopism naukowych, jest honorowym członkiem zagranicznym Amerykańskiej Akademii Sztuki i Nauki, członkiem Narodowej Akademii Nauk Stanów Zjednoczonych, a także doktorem honoris causa uniwersytetów w Bielefeld, Breslavie, Grazu, Uniwersytecie we Frankfurcie nad Menem itp.
W artykule „Model oligopolu z inercją popytu” (1965)
R.-J.-R. Selten opracował „czystą strategię” z intuicyjnymi wyborami. Konsekwentnie komplikując i doprecyzowując zauważoną „równowagę” o dodatkowe warunki z poprzednich ustaleń dotyczących gry, naukowiec rozwinął ją pod kątem dynamiki i przybliżył do warunków prawdziwego życia. Udowodnił na kontrprzykładach, że nawet punkty równowagi mogą powodować irracjonalne zachowanie. Według naukowca dopiero specjalna klasa punktów równowagi (nazwał je „prawdziwymi” lub „idealnymi punktami równowagi”) faktycznie zapewnia racjonalne zachowanie w grze niekooperacyjnej.
Pojęcie „równowagi Nasha” rozciąga się na teorię gry dynamiczne. W tym przypadku każdy uczestnik wybiera strategię (czyli plan działania na każdy okres gry), która maksymalizuje jego wypłatę, biorąc pod uwagę strategie innych graczy. Głównym problemem dynamicznej równowagi Nescha jest to, że ostatni okres gracze mogą zachowywać się irracjonalnie. W momencie, gdy staje się jasne, że ten okres gry jest ostatnim, wybrane wcześniej działanie może okazać się irracjonalne (nie maksymalizuje korzyści). Ulepszona koncepcja równowagi zaproponowana w 1975 roku.
R.-J.-R. Selten, pozwala pozbyć się nieprzewidzianych założeń dotyczących strategii. Ta koncepcja „idealnej równowagi Nasha” lub doskonałej równowagi podgry zakłada, że ​​strategie wybrane przez graczy są równowagą Nasha w każdej podgrze (tj. w każdej jednookresowej grze głównej gry), niezależnie od tego, jakie działania zostały wykonane wcześniej .
Wprowadzenie równowagi Nasha było ważnym krokiem w mikroekonomii. Jego zastosowanie przyczyniło się do dogłębnego zrozumienia rozwoju i funkcjonowania rynków, uzasadnienia decyzje strategiczne akceptowane przez menedżerów różne firmy. Ważny jest wkład R.-J.-R. Selten, który udoskonalił koncepcję równowagi Nasha do analizy strategicznych interakcji w czasie i wykorzystał ją do analizy konkurencji w warunkach małej liczby uczestników. Oraz metodologia analizy gry z niekompletnymi informacjami J.-C. Harsanyi zapewnił ramy teoretyczne dla badań nad ekonomią informacji.
Równowagę Nasha można wykorzystać do badania procesu negocjacji politycznych i zachowań gospodarczych, w szczególności na rynkach oligopolistycznych (forma organizacji rynku, w której istnieje kilku producentów jednorodnego lub zróżnicowanego produktu). Był to R.-J.-R. Selten zidentyfikował potencjał wykorzystania modeli w polityce. Jego współpraca z amerykańskim politologiem A. Pelmuterem umożliwiła opracowanie tzw. scenariusza metody wsadowej – systematycznego sposobu tworzenia prostych modeli gry konkretnych konfliktów międzynarodowych, dzięki któremu możliwa jest ekspercka weryfikacja fakty empiryczne.
W ten sposób teoria gier rozszerzonych zapewniła ekonomii potężne narzędzia matematyczne, które pomogły ekonomistom uwolnić się od zależności od formalnego aparatu matematycznego fizyki. Równowaga Nasha to elastyczna metoda analizy różnych specyficznych problemów i sytuacji na rynkach.
Teorię gier wykorzystano później w badaniach Thomasa Schellinga i Roberta Ohmanna. Interesowało ich pytanie: „Dlaczego niektórym grupom ludzi, organizacjom i krajom udaje się współpracować, podczas gdy inne cierpią z powodu ciągłego konfliktu?”
Schelling Thomas Crombie (ur. 1921) to amerykański ekonomista, laureat Nagrody Nobla w 2005 r. „Za pogłębienie zrozumienia problemów konfliktu i współpracy poprzez analizę w ramach teorii gier”. Profesor na Uniwersytecie Maryland. Prezes Amerykańskiego Towarzystwa Ekonomicznego w 1991 r. Laureat Nagrody im. Franka Seidmana (1977). Ważniejsze dzieła: „Strategia konfliktu” (1960); Mikromotywy i makrozachowania, 1978; Wybór i konsekwencja (Wybór i konsekwencja, 1985).
Wykorzystywał teorię gier do podejmowania racjonalnych decyzji w warunkach niedostatecznej ilości informacji możliwe konsekwencje jako podstawę do unifikacji i badań nauk społecznych w swojej książce „Strategia konfliktu”, wydanej w latach 50. ubiegłego wieku w kontekście wyścigu zbrojeń.
W swojej książce Schelling pokazuje na przykład, że umiejętność odwetu może czasami być bardziej przydatna niż zdolność przeciwstawienia się atakowi lub że ewentualna nieznana kara jest często skuteczniejsza niż znana, nieunikniona kara.
Książka Schellinga badała możliwości rozwiązywania konfliktów strategicznych i sposoby uniknięcia wojny, ale jego wnioski mogły także wyjaśniać szeroki wachlarz zjawisk z zakresu ekonomii i konkurencyjności przedsiębiorstw.
R. Aumann z kolei poświęcił swoje badania badaniu teorii nieskończenie powtarzalnych gier, czyli temu, jak możliwe jest utrzymanie określonych rezultatów w związku przez pewien okres czasu. długi okres czas.
Aumann Israel Robert John (również Oman) (ur. 1930) – izraelski matematyk, profesor Uniwersytetu Hebrajskiego w Jerozolimie, laureat Nagrody Nobla z ekonomii w 2005 roku „za poszerzanie zrozumienia problemów konfliktu i współpracy poprzez analizę teorii gier”.
Oman otrzymał Nagrodę Harveya w 1983 roku. W 1994 roku nagrodzono profesora Omana Nagroda Państwowa Izrael w ekonomii z profesorem Michaelem Bruno.
R. Oman stał na czele Towarzystwa Teorii Gier, a na początku lat 90. był prezesem Izraelskiego Związku Matematyków. Ponadto był redaktorem naczelnym Journal of the European Mathematical Society. Aumann doradzał także amerykańskiej Agencji Kontroli Zbrojeń i Rozbrojenia. Studiował teorię gier i jej zastosowania przez około 40 lat. Ważniejsze dzieła: „Gry prawie ściśle konkurencyjne” (Gry prawie ściśle konkurencyjne, 1961); „Strategie mieszane i behawioralne w nieskończonych rozbudowanych grach” (1964).
Teoria gier jest nauką o strategii, bada, w jaki sposób różne konkurujące ze sobą grupy – biznesmeni lub inne społeczności – mogą współpracować, aby uzyskać idealny wynik.
Oman specjalizował się w „powtarzalnych grach”, analizując rozwój konfliktu w czasie. Badania Aumanna opierały się na założeniu, że współpracę w wielu sytuacjach łatwiej nawiązać w długotrwałych, stabilnych relacjach.
Teoria Aumanna wyjaśnia, dlaczego trudniej jest osiągnąć współpracę pomiędzy duża ilość uczestników, biorąc pod uwagę, jak częste, ciągłe i rzetelne są między nimi kontakty oraz na ile każdy uczestnik może przewidywać działania innych.
Badania mają na celu wyjaśnienie konfliktów gospodarczych, takich jak wojny cenowe i handlowe, ujawnienie mechanizmu negocjacji w różnych warunkach – od żądań podwyżek wynagrodzenie przed zawarciem międzynarodowych umów handlowych.

Wybór redaktorów
W ostatnich latach organy i oddziały rosyjskiego Ministerstwa Spraw Wewnętrznych pełniły misje służbowe i bojowe w trudnym środowisku operacyjnym. W której...

Członkowie Petersburskiego Towarzystwa Ornitologicznego przyjęli uchwałę w sprawie niedopuszczalności wywiezienia z południowego wybrzeża...

Zastępca Dumy Państwowej Rosji Aleksander Chinsztein opublikował na swoim Twitterze zdjęcia nowego „szefa kuchni Dumy Państwowej”. Zdaniem posła, w...

Strona główna Witamy na stronie, której celem jest uczynienie Cię tak zdrową i piękną, jak to tylko możliwe! Zdrowy styl życia w...
Syn bojownika o moralność Eleny Mizuliny mieszka i pracuje w kraju, w którym występują małżeństwa homoseksualne. Blogerzy i aktywiści zwrócili się do Nikołaja Mizulina...
Cel pracy: Za pomocą źródeł literackich i internetowych dowiedz się, czym są kryształy, czym zajmuje się nauka - krystalografia. Wiedzieć...
SKĄD POCHODZI MIŁOŚĆ LUDZI DO SŁONI Powszechne stosowanie soli ma swoje przyczyny. Po pierwsze, im więcej soli spożywasz, tym więcej chcesz...
Ministerstwo Finansów zamierza przedstawić rządowi propozycję rozszerzenia eksperymentu z opodatkowaniem osób samozatrudnionych na regiony o wysokim...
Aby skorzystać z podglądu prezentacji utwórz konto Google i zaloguj się:...