Симулација на животната средина со табеларна пресметка

Од херои, кукавици и други

Проблем: Социјалните и економските интеракции се одвиваат во многу сложени и едвај транспарентни светови. Термини како лојалност, правичност, храброст, кукавичлук, агресија, соработка, себичност и loveубов кон ближниот играат голема, но тешко е да се процени улогата.

симулација

Цел: Мора да се разјасни кои основни обрасци го одредуваат нашето однесување, која е суштината на споменатите (не) доблести и каква употреба имаат во одредени контексти. Оваа лекција ги дава основите за детален третман на следните лекции.

Метод: Интеракциите се сведени на основни обрасци што можат да се најдат во едноставни игри. Некои од овие едноставни игри се играат и анализираат со основни средства.

Парадоксот на теоријата на игри

Двајца луѓе П. и П играјте според следниве правила: и двајцата креваат еден или два прста истовремено; ако вкупниот број на држени прсти е рамномерен, тогаш плаќа П во П., ако е чудно, се исплаќа П. во П; Вие секогаш плаќате онолку колку што ги држите прстите. Матрицата за исплата за плаќањата што П во П. има да направи, изгледа вака:

Очигледно - под услов играта да се повторува постојано - има смисла да се остави другиот играч во темница за тоа колку прсти ќе кренете. Ова може да се постигне, на пример, со држење еден и два прста што по случаен избор.

На прв поглед се чини дека играта е фер: ако се можни комбинации (1, 1), (1, 2), (2, 1), (2, 2) - броевите на прозорецот се во заграда Плеер за прсти П. и играчи П - се случуваат подеднакво често, очекувањата за профит на секој од играчите се нула. Сепак, играта не е фер, како што ќе се покаже за еден момент. (Фактот дека оваа навидум фер игра е неправедна се нарекува парадокс на теоријата на игри.)

За да ја пронајдеме неправдата, работиме мала симулација. Претпоставуваме дека секој играч има по еден мешана стратегија изберете Мешаната стратегија се одредува според веројатноста да се избере одреден потег. Биди q веројатноста за П држи еден прст (1 - q тогаш е веројатноста дека тој држи два прста). играч П. избира прст со веројатност стр.

Во табелата можете да ги видите избраните стратегии стр и q влезе Добивките што соодветниот играч ќе ги добие на долг рок (очекувана вредност на добивката) се појавуваат во полето за резултат. Бидејќи ова е игра со нула сума, едниот го губи она што го добива другиот. Во полињата за внесување можете да внесете броеви како 0,75, но исто така и дропки како 3/4 (или општи JavaScript формули). Бидејќи се работи за веројатност, има смисла само вредностите од 0 до 1.

Ако играчот Q ја избере стратегијата q = = q * = 7/12, играчот П може да прави што сака. На долг рок, тој ќе мора да прифати просечна загуба од 1/12 по натпревар.

Со Принцип минимакс Оптималната стратегија може да се изведе од теоријата на игри со нула сума (фон Нојман, 1944): За претпазливиот играч, најдобрата стратегија е онаа што ја минимизира неговата максимална загуба (што се случува со оптимална одбрана) (Szйkely, 1990, стр. 54 ff.) ) .

Играњето со прст е а Нула сума игра: Она што еден играч го освојува, другиот го губи и обратно. И, како што видовме, тоа зависи од тоа дали сте играч во линија (П) или играч во колона (П). Овде нема да се занимаваме со игри со нула сума.

Игра сокол-гулаб

Социјалното однесување е покомпатибилно со симетрични игри Моделирање: Во симетрични игри, исплатата на играчот зависи само од неговата стратегија и од противникот, а не од тоа дали тој е играч на редови или колони. Играта јастреб-гулаб е толку симетрична игра.

Да речеме, имаме популација која се состои целосно од гулаби. Кога и да се борат, никој не е повреден. Конфронтациите се состојат од долги ритуални турнири, можеби загледани натпревари кои застануваат само кога еден од ривалите ќе попушти. Победникот тогаш постигнува 50 поени за освојување на спорниот ресурс, но плаќа казна од -10 за губење време на долг загледан натпревар; па сè на се, тој добива 40 поени. Поразениот се казнува и со -10 казна за губење време. Во просек, секој гулаб може да очекува да победи во половина од борбите и половина да загуби. Вашата просечна премија по спор е просек од +40 и -10, тоа е +15. Затоа, се чини дека секој гулаб оди доста добро кај популацијата гулаби. "Понатамошната анализа води до следната матрица на игри за секој од играчите.