Читать «Критическая масса, как одни явления порождают другие» онлайн - страница 362

Филипп Болл

Многие представленные на турнире программы были намного сложнее описанных выше, но победителем оказалась наиболее простая из них, разработанная психологом Анатолем Рапапортом из университета Торонто. Он назвал свою программу Tit for Tat (TFT), что соответствует русскому «зуб за зуб». Ее единственным правилом было следующее: начинай с сотрудничества, а далее делай то, что делал твой оппонент в предыдущем раунде.

Например, играя против безусловного кооператора, TFT сразу принимает его тактику, в результате чего игра заканчивается одинаково выгодно для обеих программ. В игре против безусловного обманщика TFT, конечно, проигрывает в первом раунде (проявив желание сотрудничать), но зато потом постоянно обманывает, так что проигрыш TFT в этой встрече остается небольшим — только очки, потерянные в первом раунде. При встречах с программами, применяющими смешанную стратегию сотрудничества и обмана, TFT отвечает в соответствии с поведением партнера в предыдущем раунде. Таким образом, можно сказать, что TFT пользуется плодами сотрудничества, когда это возможно, но не позволяет обманывать себя. С другой стороны, TFT сама не обманывает чужих ожиданий, в результате чего, кстати, она никогда не получает очков больше, чем ее противник. У всех остальных программ были свои достоинства и недостатки, так что некоторые из них очень удачно выступали против преимущественных кооператоров или, наоборот, против преимущественных обманщиков, но именно TFT в целом набрала максимальное число очков, выступая одинаково ровно против всех остальных стратегий. Можно сказать, что это была скромная и даже простодушная победа.

Первый компьютерный турнир оказался очень успешным и получил широкую известность, поэтому когд а Аксельрод организовал второй турнир по тем же правилам, в нем приняли участие уже 62 программы из 6 стран. Более того, в отличие от первого турнира, где участвовали профессиональные ученые, во втором турнире смогли соревноваться и программы, составленные любителями компьютерных игр, включая десятилетнего мальчика. Все они знали о результатах первого турнира, поэтому неудивительно, что многие из них пытались модифицировать и улучшить программу TFT, сделав ее более сложной и эффективной. Этому искушению не поддался только сам автор программы, Рапапорт выставил на турнир ту же программу, и она вновь стала победительницей!

Означает ли это, что TFT действительно представляет собой наилучшую стратегию при повторяющейся игре в «Дилемму заключенного»? Мне кажется, что говорить о наилучшей стратегии в этом случае вообще неверно, так как результат в значительной степени зависит от состава участников. Если ваши противники в большинстве своем являются безусловными кооператорами, то преимущественный или безусловный обман принесет лучший результат, чем стратегия TFT. Но основной вывод из проведенных Аксельродом компьютерных турниров все же гласит, что при игре с неизвестными противниками стратегия TFT является лучшей.