Читать «Критическая масса, как одни явления порождают другие» онлайн - страница 371

Филипп Болл

Такие механизмы поведения весьма характерны для множества культур. В качестве примера Аксельрод указывает на обычай кровной мести, распространенный, например, в Албании и на Ближнем Востоке, когда вражда кланов и убийства продолжаются во многих поколениях даже тогда, когда исходные причины конфликта давно забыты. Ужасные примеры затухающей и вновь вспыхивающей ненависти и вражды можно наблюдать сейчас в Северной Ирландии, где десятилетиями продолжается жестокий конфликт между католиками и протестантами, а также на Ближнем Востоке, где постоянно рушатся любые попытки установления мира между Израилем и Палестиной.

Из этого ясно, что стратегия TFT вовсе не гарантирует установления гармонии и мира.

Более того, предлагаемая стратегия вовсе не является наилучшей для поведения в окружающем нас мире, где ошибки и недоразумения возникают практически всегда. Это стало очевидным после следующего турнира, организованного Аксельродом, в котором допускалась возможность ошибки игроков. То есть иногда игроки выбирали свой ход случайным образом, не следуя правилам собственной стратегии. Когда доля таких ошибок (уровень «шума») достигала 10%, стратегия TFT не становилась более победительницей. Причем результаты ее игры против аналогичной программы оказывались даже хуже, чем при игре с программами, основанными на смешанной стратегии, поскольку случайные ошибки загоняли TFT-игроков в бесконечные циклы возмездия.

Безнадежность возникшей ситуации вынудила экспериментаторов искать модификации модели. Одной из таких модификаций стала стратегия «Великодушная» TFT (GTFT), в которой прощается определенная часть обманов (прощение в данном случае означает продолжение политики сотрудничества в следующем раунде). В другом варианте, «Кающейся» TFT (CTFT), прощается обман, следующий за србственным обманом, — демонстрация смирения перед заслуженным наказанием. Стратегия GTFT побеждала всех своих противников при уровне «шума» до 1%, стратегия CTFT занимала при этом шестое место. При более высоком уровне «шумов» CTFT превосходила GTFT.

В стратегии «зуб за два зуба» (TFTT) решение о возмездии принималось лишь после двух последовательных обманов противника, что служило подтверждением плохих намерений, а не случайной ошибки. Эта модель была предложена биологом-эволюционистом Джоном Мейнардом Смитом, во втором турнире Аксельрода она заняла лишь 24-е место. Мейнард Смит не участвовал в первом турнире, но там его программа наверняка стала бы победительницей, потому что некоторые участвовавшие в том турнире программы нейтрализовали программу TFT бесконечной цепью взаимных возмездий (напомним, что эта ловушка может возникать даже в отсутствие ошибок). Это лишнее подтверждение того, что в этой игре не существует наилучшей стратегии.

Еще одна хорошо работающая при случайных ошибках, но менее великодушная стратегия была предложена в 1988 году (но разработана раньше, как мы увидим далее) двумя исследователями из Северной Каролины, Дэвидом Крейнсом (университет Дьюка) и Вивиан Крейне (Мередит-кол-ледж). Авторы назвали свою модель «Павлов», а ее стратегия сводится к абсолютному оппортунизму, или: победил — так держать, проиграл — все менять. Подобно основному варианту TFT действия программы зависят от того, что случилось в предыдущем раунде. Если результат был хорошим, то делается тот же ход, в противном случае — противоположный. Определение хороший в данном случае означает как награду за сотрудничество, так и удачный обман. Короче говоря, в модели «Павлов» поведение сохраняется, если за свои действия программа получает какое-то вознаграждение, и изменяется, если программа как-то наказывается. Название выглядит весьма удачным, так как все условия соответствуют знаменитым экспериментам русского физиолога Ивана Петровича Павлова по выработке условных рефлексов у собак.