czwartek, 8 września 2011

Syberyjskie mrówki i teoria gier jako zarzewie anarchii w social media.

„To nie miłość do osoby sąsiada mego – którego często zupełnie nie znam – zmusza mnie chwycić wiadro i biec do jego domu, gdy zobaczę, że się pali; działa tu uczucie dużo szersze, jakkolwiek być może nie określone – uczucie czy instynkt ludzkiej solidarności, poczucie łączności społecznej.”
Piotr Kropotkin

Sytuacja wygląda następująco: szef działu sprzedaży prowadzi pod koniec miesiąca rozmowy z handlowcami. Dwóch z nich ewidentnie ma coś na sumieniu – tak przynajmniej podejrzewa ich przełożony. Doszły go słuchy, że zamiast dzielnie walczyć o wykonanie planu wspólnie okradali magazyn. Postanawia z nimi porozmawiać. Umawia spotkania z podejrzanymi w dwóch różnych pomieszczeniach i składa każdemu następującą propozycję:
- jeśli powiesz mi prawdę co tam narozrabialiście, a ten drugi będzie szedł w zaparte, to... tobie dam podwyżkę, a tamtego wyrzucę na zbity pysk,
- jeśli obaj przyznacie się do winy, to każdy z was dostanie naganę i potrącę wam połowę pensji.

Jest kryzys i sprzedawcom zależy na pracy. Pracują tu już dosyć długo – szefa dobrze znają i wiedzą, że gdyby żaden z nich nie puścił pary, to szef poza swoimi podejrzeniem nie ma właściwie dowodów i obaj mogliby spokojnie wrócić do roboty.
Co zrobią?



Sytuacja jak powyżej lub w strukturze podobna to problem znany w teorii gier pod nazwą „Dylemat Więźnia”. W oryginalnej historyjce A. Tuckera „graczami” są dwaj więźniowie osobno przesłuchiwani przez sędziego – problem decyzyjny pozostaje ten sam - co się bardziej opłaca: przyznać się czy nie przyznać?
I ta nurtująca wątpliwość: co zrobi ten drugi?

Opisaną na początku grę magazynową zapisać można np. tak:
Sprzedawca pierwszy to „X”, sprzedawca drugi to „Y”.
Strategia „przyznać się” to „P”, strategia „milczeć i się nie przyznawać” to „M”.
Umownie przyjmiemy, że podwyżka za przyznanie się (gdy drugi milczy) to „wypłata” równa +1, utrata pracy (w sytuacji: ja milczę a on się przyznał) to „wypłata” –2, nagana i potrącenie z pensji (obaj się przyznajemy) to –1 zaś uwolnienie się od zarzutów (w przypadku milczenia obu) to „wypłata” w postaci 0.
Możliwe wyniki przy wyborze poszczególnych strategii przez obu graczy ilustruje prosta macierz – jak poniżej:
Rzut oka pozwala stwierdzić, że optymalnym rozwiązaniem problemu – przynajmniej teoretycznie - jest milczenie obu graczy.
Jednak to tylko teoria – „gracze” siedzą w odrębnych pomieszczeniach, nie mogą się ze sobą komunikować więc zaczynają kombinować: co faktycznie zrobi ta druga strona? Czy wybierze „kooperację” (obaj milczymy jak grób), czy „zdezerteruje”?
Jeśli zwali wszystko na mnie, to dostanie podwyżkę (tzw. „wypłata pokusy”), a ja wylecę z roboty („wypłata frajera”). Jeśli zaś obaj postanowimy się przyznać, wynik będzie gorszy (nagana i mniejsze zarobki) niż gdybyśmy milczeli („wypłata niekooperacyjna”).

Przykład jest oczywiście zupełnie abstrakcyjny – sprzedawcy nigdy nie kradną towaru z magazynów, a żaden szef nie ma uprawnień by ich przesłuchiwać w tak nieludzki sposób. Przykład ten ilustruje jednak jedno z najbardziej pogmatwanych zagadnień związanych z zachowaniami społecznymi. Co nam się bardziej opłaca w sytuacjach gdy nie wiemy jak zachowają się inni (charakterystyczne dla gier o sumie niezerowej): kooperować nie ulegając pokusie indywidualnej „wygranej” czy może troszczyć się jedynie o indywidualny interes ostatecznie doprowadzając do wyniku mniej korzystnego dla wszystkich.

Efektywność racjonalnej kalkulacji przegrywa na ogół z emocjami i zbyt niskim zaufaniem. Tak oto licząc na wyższą „wypłatę” i wybierając pozornie korzystną strategię wszyscy wychodzą na mniejszych lub większych frajerów.

Jeśli domyślamy się, że marka konkurencyjna zamierza obniżyć ceny o 20%, to czy bardziej opłaca nam się zrobić to w pierwszej kolejności (może nawet obniżyć o 25%?) czy pozostawić ceny na aktualnym poziomie licząc na to, że konkurencja pójdzie po rozum do głowy i zrobi to samo?
Nasze niższe ceny przy ich obecnej drożyźnie przyciągną do nas więcej klientów, jeśli jednak tamci zrobią to, co my, to... zyskają na tym jedynie klienci (przynajmniej chwilowo).
Co później?


To czubek góry lodowej. Zabawa rozwija się z biegiem czasu. Przecież po kolejnych rozgrywkach (im więcej rozgrywek, tym ciekawiej) teoretycznie „uczymy się” poprzez doświadczenie – obserwujemy ruchy przeciwnika, liczymy „wypłaty” i możemy budować bardziej coraz bardziej zaawansowane scenariusze (tzw. iterowany dylemat więźnia).

Jeśli w pierwszej rozgrywce postanowiliśmy kooperować, a druga strona wykazała się podłością, to co zrobimy przy kolejnym rozdaniu – zaryzykujemy zerwanie kooperacji i „zemstę”, czy nadal pozostaniemy „frajerami”? Oko za oko czy nadstawianie drugiego policzka? Odwieczne dylematy moralne opisane tabelą wyników stają się coraz bardziej złożone.
Nie mówiąc o sytuacjach, kiedy pojawia się coraz większa ilość graczy...

Tęgie matematyczne głowy proponują różne strategie i ich kombinacje w zależności od okoliczności, doświadczenia i wiedzy graczy. Np.:

„Kooperuj wtedy i tylko wtedy, gdy jesteś przekonany, że twój przeciwnik będzie kooperował wtedy i tylko wtedy, gdy jest przekonany, że ty będziesz kooperował.” [1]

Porada bardzo zgrabna, ale każdy przyzna, że mało życiowa. Rozgrywanie problemu przy pomocy programów komputerowych zakładających odwoływanie się do tzw. metagier pozwoliło określić rozwiązania w rodzaju strategii WET ZA WET (eksperymenty R. Axelroda). Ich właściwości wydają się nieco bardziej zrozumiałe dla tzw. zdrowego rozsądku:
- wybieraj posunięcie przyjazne, zaczynaj od kooperacji i nie zrywaj jej jako pierwszy,
- kieruj się odwetem – każde wredne zagranie przeciwnika powinno zostać natychmiast ukarane, kooperację nagradzaj współpracą,
- nie bądź złośliwy, przebaczaj – jeśli musiałeś ukarać „przeciwnika” bądź gotów do dalszej kooperacji,
- nie staraj się być za sprytny i nie oszukuj, graj w sposób transparentny – niech dla drugiej strony twoje decyzje będą spójne i łatwe do przewidzenia [2]

Decyzja czy bardziej opłaca się być „jastrzębiem” czy „gołębiem” wynika z kombinacji wielu czynników – jednym z kluczowych jest czas pozwalający na gromadzenie zaufania. Wiele wskazuje na to, że czym dłuższy horyzont czasowy, czym więcej rozgrywek (interakcji), doświadczeń, tym większa szansa na upowszechnienie się zachowań o charakterze kooperacyjnym [3].
Czym zaś większa mobilność, przypadkowość kontaktów i czym bardziej bezosobowy jest ich charakter, tym bardziej prawdopodobne, że zamiast współpracy wybierane będą strategie „defekcji” (defection).
Ważne jest również „środowisko strategii” w jakim podejmowane są decyzje – np. na ile licznie reprezentowane są w danej populacji preferencje „graczy” co do poszczególnych strategii.

„Powodzenie danej strategii zależy od tego, wśród jakich innych strategii przypadkiem się znajdzie”. [4]

Podawanie się emocjom – np. takim jak złość na brak chęci do kooperacji ze strony innych i pojawiająca się za tym chęć szybkiego „ukarania” ich – wydają się w dłuższej perspektywie nikomu nie służyć.
Można jednak wyobrazić sobie sytuację, w której uprzejmość, wielkoduszność i szeroko pojęty altruizm powoli zaczynają dominować jako wiodące pobudki działania – strategia wet za wet utrwala się i staje wiodącym wzorcem skutecznego i korzystnego dla wszystkich działania.
Dopóki nie nastąpi inwazja jakiejś zmutowanej strategii wredności... [5]

„Ja myślę, że on myśli, że ja myślę, że...” itd. – myślą sobie jednocześnie gracze.
W końcu John Nash wyrysował piękny dowód własnego twierdzenia.



Obserwujący na Syberii mrówki i zupełnie nie znający osiągnięć teorii gier (która jeszcze nie powstała) Piotr Kropotkin pisał już dawno temu:

„Te gatunki zwierzęce, w których walka pomiędzy jednostkami została jak najbardziej ograniczona i u których przeciwnie, pomoc wzajemna rozwinęła się najsilniej, zawsze i wszędzie są najliczniejsze, najzdrowsze i najzdolniejsze do dalszego rozwoju. Gatunki te dzięki pomocy wzajemnej żyją najdłużej, osiągając najwyższy poziom umysłowy oraz rozwój przyzwyczajeń coraz bardziej społecznych, co zapewnia im zachowanie gatunku, jego rozpowszechnianie i jego postępowy rozwój. Przeciwnie, gatunki niespołeczne skazane są na zagładę.” [6]

Kropotkin uchodzi za jednego z ojców nowożytnego anarchizmu. Radykalne konsekwencje jego poglądów mogą być niebezpieczne dla takiej instytucji jak Państwo.
Może dlatego Państwa nie lubią nadmiernych przejawów niekontrolowanej „pomocy wzajemnej” obywateli? Grozi to przecież anarchią. Gdyby tak nagle wszyscy zechcieli sobie „wzajemnie pomagać” i kooperować to po co w ogóle ministerstwa, urzędnicy, podatki, kamery na ulicach itd? Może więc należałoby maksymalnie ograniczać możliwość współpracy i wzajemnej pomocy? Serwisy aukcyjne, banki czasu, różne allegra, linuksy, wikipedie i twitery powinny więc mieć się na baczności. Będą coraz baczniej obserwowane, kontrolowane i monitorowane ponieważ służą bezinteresownej kooperacji, a ta – jeśli przynosi owoce – rodzi pokusy anarchii.
A kto ci tak naprawdę w życiu pomoże, jeśli nie Państwo?



Tak na marginesie: poszukując strategii ewolucyjnie stabilnej (ESS) J. M. Smith wyszedł od testowania zbioru pięciu możliwych alternatyw:

1. Walcz łagodnie, wycofaj gdy przeciwnik będzie silniejszy lub będzie się stawał coraz bardziej agresywny.
2. Dotrzymuj pola ostro walczącemu rywalowi. Wycofuj się tylko w przypadku odniesionych ran.
3. Zaczynaj łagodnie. Zaostrz walkę kiedy zrobi to przeciwnik.
4. Zaczynaj łagodnie. Zaostrz walkę jeśli przeciwnik nadal będzie łagodny.
5. Dotrzymuj pola ostro walczącemu rywalowi. Wycofaj się nim cię zrani, jeśli on zrobi to samo. [6]


[1] „Teoria gier”, Philip D. Straffin; tłum. J. Haman, Wyd. Scholar, Wa-wa 2001, s. 100.
[2] tamże s. 102.
[3] zob. „Masa krytyczna”, Philip Ball; przekł. W. Turopolski, Insignis, Kraków 2007, s. 543.
[4] „Samolubny gen”, Richard Dawkins; przeł. M. Skoneczny; Prószyński i S-ka, W-wa 2007, s 270.
[5] zob. tamże s. 272.
[5] „Pomoc wzajemna jako czynnik rozwoju”, Piotr Kropotkin, przeł. J. Hempel, Spółdzielnia Wydawnicza Słowo, Łódź 1946, s. 227
[6] zob. „Fenotyp rozszerzony. Dalekosiężny gen”, Richard Dawkins, przeł. J. Gliwicz, Prószyński i S-ka, Warszawa 2003, s. 158.

Creative Commons License
Ten utwór jest dostępny na licencji Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska.

Brak komentarzy:

Prześlij komentarz

Kontakt: STANISZEWSKIkropkaMmałpaDŻIMEILkropkaKOM

Poprzednie wpisy: