Matematyka el.
- Autor: Anna Leszkowska
- Odsłon: 1833
Z prof. Tomaszem Downarowiczem z Wydziału Matematyki Politechniki Wrocławskiej rozmawia Anna Leszkowska
- Panie Profesorze, wydaje się, że teorią gier, która tłumaczy optymalne zachowania ludzi w przypadku konfliktu interesów, można wyjaśnić każde zachowanie społeczne. Jednym z takich przypadków jest spotkanie towarzyskie np. z okazji urodzin, na które nie wypada przyjść z pustymi rękami. To klasyczny przypadek tzw. dylematu więźnia*, bo jeśli goście się wcześniej nie umówili, kto przyniesie tort, to albo go przyniesie każdy, albo nikt, albo jakaś część zaproszonych, co zwykle się dzieje.
Zgodnie z teorią gier, najlepszą strategią dla zaproszonego jest zatem przyjść bez tortu, licząc na to, że ktoś z zaproszonych go kupi. Czy aspołeczne zachowania są najkorzystniejsze?
- Poruszone przez panią zagadnienie jest wielowątkowe, a zachowania społeczne można analizować na wielu płaszczyznach. Według podejścia matematycznego, przykład z dylematem więźnia jest bardzo specyficzny, Ma on bowiem na celu pokazanie, że tzw. stan równowagi Nasha nie zawsze oznacza rozwiązanie najkorzystniejsze dla wszystkich graczy. Choć to brzmi paradoksalnie, w przykładzie tym, każdemu z więźniów opłaca się donosić, niezależnie od tego, co zrobi drugi. Mimo to, jeśli obaj będą donosić, poniosą większe kary niż gdyby obaj milczeli.
Pamiętać jednak trzeba, że ta gra jest wymyślona, a parametry tak dobrane, aby pokazać ten fenomen przewagi (indywidualnej dla każdego gracza) strategii „egoistycznej” nad korzystniejszą dla obu graczy strategią „współpracy”.
Te wszystkie gry mają jeden mankament, jeśli chodzi o modelowanie zjawisk społecznych, czy zjawisk zachodzących w rzeczywistości. W całej teorii gier przyjmuje się bowiem istnienie jakiejś dobrze zdefiniowanej jednoparametrycznej funkcji wartości (tzw. funkcji wypłaty). W przypadku dylematu więźnia chodzi o długość wyroku skazującego (0,5 roku, 5 lub 10 lat), przy czym przyjmujemy, iż im wyrok krótszy, tym korzystniejszy.
To jest bardzo uproszczona sytuacja, bo jeden parametr liczbowy jest wykładnią tego, czy ta strategia jest lepsza czy gorsza. W życiu, w zjawiskach społecznych tak nie jest, czego można dowieść na podanym przez panią przykładzie z tortem. Tutaj już wykraczamy poza matematykę.
Rozważmy sytuację, kiedy zaproszony na imieniny Ignacy zastanawia się, czy kupić tort w prezencie, czy nie i kalkuluje: jeśli nie przyniosę tortu, to pewnie ktoś inny przyniesie i dostanę jeden kawałek tortu nic nie wnosząc, czyli czysty zysk. Jeśli nikt nie przyniesie tortu, to przynajmniej nic nie stracę. Natomiast jeżeli kupię tort, to wydam sporo pieniędzy, ale też dostanę z niego jeden kawałek, ewentualnie dwa, jeśli jeszcze ktoś inny też przyniesie tort. W każdym razie tracę na tym. Dochodzi więc do wniosku, że najkorzystniej będzie nie kupić tortu.
Rozważanie tych strategii zakłada jednak bardzo uproszczony model, kiedy funkcją wartościującą jest wielkość konsumpcji tortu i ewentualny wydatek z tym związany. A przecież Ignacy nie musi iść na urodziny tylko z powodu apetytu na tort. Zjawiska społeczne zależą bowiem od znacznie większej liczby parametrów i związanych z nimi funkcji wartościujących. W dodatku wiele z nich jest liczbowo nieuchwytna.
Kiedy ludzie idą na imprezę, wielu z nich jednak przyniesie tort – co nimi w takim razie kieruje? Z pewnością nie kalkulacja związana z konsumpcją tortu - tutaj do głosu dochodzą inne wartości. Być może ktoś lubi piec torty i sprawia mu satysfakcję, gdy inni go zajadają ze smakiem – to jest wartość, której nie można przeliczyć na pieniądze. Ponadto, być może ten, który przyniesie tort zostanie zauważony przez najpiękniejszą dziewczynę na tej imprezie. Tego też na pieniądze ani kawałki tortu przeliczyć nie sposób!
Te motywacje działań można podzielić na kilka grup. Jedną będzie ta, która wynika z teorii gier i ta najczęściej dotyczy pieniędzy – ludzie wszystko przeliczają na pieniądze i zachowują się tak, aby jak najmniej wydać, a jak najwięcej zyskać.
Ale istnieje też druga sfera, w której zaczynają odgrywać rolę jakieś wartości niefinansowe, niematerialne, np. pozyskanie przyjaciół, szacunku w społeczeństwie, czy znalezienie sobie partnera życiowego, co trudno przełożyć na pieniądze. Stąd często opłaca się zmniejszyć swój zysk finansowy, świadomie coś stracić, aby zyskać szacunek z tego powodu, że np. postąpiło się uczciwie.
- Jak zatem takie sytuacje modelują matematycy? Czy można matematycznie przewidzieć takie zachowania?
- To jest problem, bo jak się przyjrzeć różnym modelom teorii gier, to są one oparte na tej dość prymitywnej funkcji wartościującej. Bez konkretnej funkcji wartościującej nie da się nic obliczyć. Nie można zaprząc matematyki do prowadzenia obliczeń na wartościach, które nie są sprecyzowane. Matematyka wymaga pewnego sformalizowania.
Trzeba też pamiętać, że w zachowaniach ludzi mają udział także emocje, np. chęć zemsty – mnóstwo czynników, motywacji niewymiernych. Część z nich wynika z pobudek szlachetnych, część z niskich, a zachowania ludzkie są ich wypadkową. Pełny ich opis jest chyba możliwy tylko w języku statystycznym. Badania zachowań społeczeństw są właśnie badaniami statystycznymi, gdzie analizuje się, jaki procent ludzi w danej sytuacji podejmie taką decyzję, a jaki procent – inną. I statystyka to jest taki dział matematyki, który nie wgryza się za bardzo w przyczyny, jeśli nie bardzo je można ustalić. Nie wiadomo np. co kierowało ludźmi, kiedy głosowali na tych, a nie na drugich, natomiast można zanalizować, jaki procent głosował i przy następnej podobnej sytuacji, analizując przeszłość, można przewidzieć, jak się ludzie zachowają tym razem.
Tak się przewiduje pogodę, która jest tak skomplikowanym układem dynamicznym, że nie ma szans dojść rozumowaniem przyczynowo-skutkowym do opisania jej ewolucji, a tym bardziej ją przewidzieć. Prognozy się opracowuje na podstawie programów analizujących przeszłość. Komputery gromadzą miliony danych z przeszłości z całego świata, informacje o temperaturze, ciśnieniu, sile wiatru, wilgotności, opadach itd. i kiedy trzeba przewidzieć pogodę na jutro, szuka się takiej sytuacji w przeszłości, kiedy układ pogodowy był podobny do dzisiejszego i patrzy się, co było kiedyś następnego dnia. Oczywiście, to jest tłumaczenie bardzo uproszczone, bo zaawansowane systemy prognozujące pogodę łączą metody statystyczne z najnowszymi osiągnięciami nauki, poznaniem wcześniej nieznanych czynników mających wpływ na rozwój pogody.
- Czy teoria gier sprawdza się w modelowaniu wszystkich zjawisk? Czy też są takie obszary, gdzie nie należy jej stosować?
- Teorię gier stosuje się tam, gdzie mamy do czynienia z graczami, a decyzje podejmowane są przez konkurujących ze sobą graczy – grupy, zespoły. Cały wic polega na tym, że żaden z tych graczy nie wie, co zrobią inni. Jednak nawet wówczas, kiedy mamy sytuację, w której wszystko się dzieje w sposób zdeterminowany, albo wręcz przeciwnie - zależy od czynników losowych, którymi nikt nie steruje - też można stosować teorię gier, bo czynnik losowy można traktować jako gracza, tyle że kompletnie nieprzewidywalnego, bo nie dążącego w sposób świadomy do uzyskania jak najwyższej wygranej.
- Skąd się bierze popularność teorii gier w wielu naukach dalekich od ścisłych: społecznych, biologicznych, ekonomicznych, wojskowych– wydawałoby się, że niemożliwych do jej stosowania?
- Jeśli tylko możemy opisać jakieś zjawisko funkcją wartościującą, to możemy stosować teorię gier, natomiast w zjawiskach społecznych będziemy mieć tylko przybliżenia, bo nie jesteśmy w stanie wszystkiego precyzyjnie wartościować. W ostateczności, do celów teoretycznych, można wartościować wszystko jedną miarą, na przykład przy pomocy jakichś sztucznie wprowadzonych punktów, w myśl zasady (z którą wcale nie trzeba się zgadzać), że „wszystko ma swoją cenę”. Przykładowo, jeśli nasz Ignacy idzie na imprezę, to może spekulować tak: jeżeli uda mi się zjeść dwa kawałki tortu to są to dwa punkty, a jeśli jeszcze Zosia się do mnie uśmiechnie, to dam sobie za to trzy punkty, a jeśli jeszcze poznam interesującego kolegę, z którym będę mógł pójść w góry, to mam dodatkowo kolejne dwa punkty.
Wszystko można więc przeliczyć na jakieś punkty i wtedy może się okazać, że kwestia smaku tortu jest porównywalna z zarobkiem w jakiejś firmie czy otrzymaniem dobrej pracy, bo wszystkie aspekty życia wrzuciliśmy do jednego worka i opisaliśmy na jednej skali liczbowej. Można tak robić i tak się czasem robi, jeżeli koniecznie chcemy zastosować teorię gier do opisu jakiegoś złożonego zjawiska. Opisujemy wówczas wszystkie wartości przy pomocy jednej funkcji liczbowej. Ale jest to zabieg bardzo subiektywny i może bardzo zniekształcać uzyskane wyniki.
- A rola doświadczenia w teorii gier?
- To jest trochę inne zagadnienie, bo w teorii gier poszukuje się strategii zwyciężającej, optymalnej, równowagi itd. I jeżeli dojdziemy do wniosku, że one istnieją, to się je po prostu stosuje. Natomiast brak doświadczenia u gracza będzie powodował, iż nie będzie on stosował optymalnej strategii i będzie przegrywać, albo przegapiać okazje. Oczywiście, może się zdarzyć, że przypadkowo wygra z graczem doświadczonym, jeśli ten uznał, że przeciwnik gra w sposób optymalny. Doświadczony gracz jednak, jeśli zorientuje się w skali umiejętności gracza, skoryguje swoją strategię gry i w kolejnym rozdaniu wygra.
Co do gier opisujących zachowania, stany, itp. – lubimy mieć narzędzia i wskazówki, które nas poprowadzą przez zawiły świat i dlatego teoria gier jest tak popularna, gdyż w pewnych sytuacjach udziela konkretnych odpowiedzi, daje nam jakiś przepis na postępowanie, który teoretycznie jest optymalny, jednak w praktyce może być różnie. Jako przykład możemy przytoczyć przepisy podatkowe: choć zrobimy sobie biznes plan i określimy strategię postępowania, to wszystko to na nic, jeśli w tzw. międzyczasie te przepisy się zmienią. Oczywiście, na wstępnym etapie możemy próbować takie zmiany przewidywać przy tworzeniu biznes planu, ale są to czynniki niezwykle trudne do przewidzenia. Człowiek zawsze dąży do upraszczania matematycznego modelu gry, w jaką wchodzi, albo nie jest świadomy tego, jak bardzo się ona może skomplikować.
- A czy są mechanizmy zmuszające graczy do zachowań społecznie użytecznych, nieegoistycznych, czyli rzadko stosowanych według teorii gier?
- Istnieją takie mechanizmy samoregulujące. Powiedzmy, że mamy społeczeństwo, w którym wszyscy są uczciwi, pracują, nikt nie kradnie, wszyscy żyją na średnim poziomie. Jeżeli w takim społeczeństwie znajdzie się jeden osobnik, który dojdzie do wniosku, że to są wszyscy frajerzy, a on może szybko się wzbogacić okradając pozostałych (bo nie ma systemu zabezpieczeń przed kradzieżą, nie było nigdy takiej sytuacji, wiec nikt o to nie zadbał), bardzo szybko się dorabia (a w niektórych systemach społecznych może nawet szybko dojść do władzy).
Jeśli taki osobnik jest jeden, a społeczeństwo duże, to ono tego nie odczuje i pozwoli mu istnieć. Ale zwykle zaraz znajdą się jego naśladowcy. I tu dochodzimy do mechanizmu samoregulacji: jeśli wszyscy zaczęliby kraść, a nikt by uczciwie nie pracował, to społeczeństwo nie przetrwałoby.
Ani strategia uczciwej pracy, ani strategia pasożyta społecznego nie jest tzw. strategią stabilną ewolucyjnie, czyli taką, że jeśli wszyscy gracze ją zastosują, to żadna inna strategia jej po pewnym czasie nie wyprze. Liczba złodziei w stosunku do całego społeczeństwa zatrzyma się na jakimś poziomie równowagi. To przypomina model z drapieżnikami i ofiarami – jeśli drapieżniki zjedzą za dużo ofiar, same zginą z głodu po pewnym czasie. Takie zjawiska opisuje się specjalnymi równaniami różniczkowymi, ale tu już wyszlibyśmy poza temat rozmowy.
- Czy matematyk patrząc na zjawiska społeczne i polityczne dzisiejszych czasów widzi w nich stosowanie teorii gier?
- Widzi, że na pewno jest stosowana, bo jeśli ktoś jest świadomy tego narzędzia, może używać go do własnych celów. Na pewno teorię gier stosują wielcy gracze, którzy rozgrywają finanse tej Ziemi, także politycy, którzy mają doradców posługujących się tym narzędziem.
Ciągle jednak trzeba pamiętać, że w tej teorii najistotniejsze jest to, jaką przyjmiemy funkcję wartościującą, czyli co uznamy za nadrzędną wartość. Bo może być przywódca, którego ambicją będzie dobrobyt obywateli jego państwa (i to na wiele pokoleń w przód) i taki, który ma na celu wyłącznie interes osobisty. I choć obaj mogą stosować teorię gier, to ich cele, a zatem i strategie będą różne. Trudno więc spodziewać się po teorii gier, że pomoże ona rozwiązać jakieś problemy globalne, bo wszystko zależy od ludzi i wartości, jakie oni sobie cenią.
Dziękuję za rozmowę.
* Dylemat więźnia - problem w teorii gier, oparty na dwuosobowej grze o niezerowej sumie, w której każdy z graczy może zyskać, zdradzając przeciwnika, ale obaj stracą, jeśli obaj będą zdradzać. Dylemat ten jest więc niekooperacyjną (o częściowym konflikcie) grą o sumie niezerowej, ponieważ strategia konfliktu przeważa nad strategią pokojową: najwięcej można zyskać zdradzając, a najwięcej stracić idąc na współpracę.
Dylemat więźnia został wymyślony przez dwóch pracowników RAND Corporation: Melvina Dreshera i Merrill Flood w 1950 roku. Albert W. Tucker sformalizował jego zasady i jako pierwszy użył nazwy dylemat więźnia (Poundstone, 1992). W klasycznej formie jest przedstawiany następująco:
Dwóch podejrzanych zostało zatrzymanych przez policję. Policja, nie mając wystarczających dowodów do postawienia zarzutów, rozdziela więźniów i przedstawia każdemu z nich tę samą ofertę: jeśli będzie zeznawać przeciwko drugiemu, a drugi będzie milczeć, to zeznający wyjdzie na wolność, a milczący dostanie dziesięcioletni wyrok. Jeśli obaj będą milczeć, obaj odsiedzą 6 miesięcy za inne przewinienia. Jeśli obaj będą zeznawać, obaj dostaną pięcioletnie wyroki. Każdy z nich musi podjąć decyzję niezależnie i żaden nie dowie się czy drugi milczy czy zeznaje, aż do momentu wydania wyroku. Jak powinni postąpić?
Jeśli założymy, że każdy z więźniów woli krótszy wyrok niż dłuższy i że żadnemu nie zależy na niskim wyroku drugiego, możemy opisać ten dylemat w terminach teorii gier. Więźniowie grają wtedy w grę, w której dopuszczalne strategie to: współpracuj (milcz) i zdradzaj (zeznawaj). Celem każdego gracza jest maksymalizacja swoich zysków, czyli uzyskanie jak najkrótszego wyroku.
W tej grze zdradzaj jest strategią ściśle dominującą: niezależnie od tego co robi przeciwnik, zawsze bardziej opłaca się zdradzać niż współpracować. Jeśli współwięzień milczy, zdradzanie skróci wyrok z sześciu miesięcy do zera. Jeśli współwięzień zeznaje, zdradzanie skróci wyrok z dziesięciu lat do pięciu. Każdy gracz racjonalny będzie zatem zdradzał i jedyną równowagą równowagą Nasha jest sytuacja, gdy obaj gracze zdradzają. W efekcie obaj zyskają mniej, niż gdyby obaj współpracowali. (za Wikipedią)