morbus
Частица Сигила на этом прайме.
31августа

Решение "дилеммы заключенного"

Продолжение. Начало здесь



В чем отличие "Дилеммы заключенного" от реальной жизни?

В игре участники не имеют возможности общаться. Им бы договориться, но без связи каждый подозревает другого. Хотя обоюдная выгода очевидна.

Если дать игрокам сыграть в "Дилемму" несколько раз, у них появляется связь. Например, один из "заключенных" сотрудничает. Другой может ответить тем же в следующем раунде. Доносящие друг на друга в начале, в конце игры могут перейти на сотрудничество. Сотрудничество не связано с моральными или другими стимулами - оно просто выгодно для каждого игрока.

Так и ведут себя люди в жизни: поддержка разумного уровня доверия между собой плодотворна, постоянный обман невыгоден. Степень сотрудничества зависит от человека и меняется в очень широких пределах, в зависимости от размеров выигрыша, характера игроков, соблазнов и искушений. Выяснив что партнер доверчив, можно время от времени изображать "случайную" ошибку. Если партнер окажется забывчивым или необидчивым, то эту операцию можно будет затем повторять, разумеется, не слишком часто, чтобы не вызвать подозрений. К сожалению, именно так очень часто и происходит в реальных деловых и бытовых отношениях.

Появляется закономерный вопрос: Как действовать, если соперник неизвестен? Какая стратегия выигрышна в игре и применима в жизни?

В конце 1970 Роберт Аксельрод придумал эксперимент: попросил специалистов выработать стратегии повторяющейся игры, собрал предложенные программы и провел между ними круговой турнир. Победитель определялся по максимальному числу очков во всех встречах.

Участвовало 14 программ, каждая с разными правилами выбора между сотрудничеством и обманом. "Всегда сотрудничать", "всгда обманывать", "сотрудничать, но обманывать в каждом третьем раунде"... Были и гораздо более сложные алгоритмы.

Победила несложная программа психолога Анатоля Рапопорта. Все её условия в названии: Tit for Tat, TFT ("зуб за зуб"). Единственное правило формулировалось так: "начинай с сотрудничества, а далее делай то, что делал твой оппонент в предыдущем раунде"

Игра против безусловного кооператора будет выгодна обеим программам. Против обманщика TFT проигрывает только в первом раунде - потери минимальны. Были программы, удачно выступившие против кооператоров или обманщиков, но именно TFT набрала максимум, выступая одинаково ровно против всех.

Когда Аксельрод организовал второй турнир, в нем приняли участие уже 62 программы: от психологов, программистов, любителей игр. Все знали о результатах первого турнира и многие модифицировали TFT, пытаясь сделать её эффективнее. Автор не поддался искушению и выложил ту же программу... она вновь победила!

Значит, это наилучшая стратегия?

Не совсем. Результат зависит от участников, и в игре с безусловным кооператором выигрышней будет обман. Но с неизвестным противником стратегия "зуб за зуб" лучшая.

Поговорки доказывают: предки знали это задолго до всяких теорий :-)

← ранее
Krug