Альтруизм и эгоизм игровых агентов: Глубокое подкрепляющее обучение в модифицированных играх “Диктатор”

Абстракт:

Эта статья посвящена использованию глубокого обучения с подкреплением, в частности оптимизации политики близости, для обучения агентов игре в социальную дилемму, модифицированной игре “диктатор”, чтобы исследовать влияние эгоизма и альтруизма на правдоподобие игровых агентов. Мы представляем дизайн и реализацию обучающей среды, включая функции вознаграждения, основанные на результатах установленных эмпирических исследований, с тремя профилями агентов, сопоставленными с тремя стандартными функциями полезности постоянной эластичности замещения (CES), т. е. эгоистичными, совершенными заменителями и Леонтьевым, которые измеряют различные уровни эгоизма/альтруизма. Обученные модели проверяются и затем используются в образцовой игре, которая используется для оценки правдоподобности трех профилей агентов с использованием показателей правдоподобности агентов. Результаты показывают, что игроки считают альтруистическое поведение более правдоподобным и в меньшей степени считают эгоизмом. Анализ результатов показывает, что человекоподобное поведение, возникающее в результате применения искусственного интеллекта, развивается из воспринимаемого человеческого поведения, а не из наблюдаемого. Анализ также показывает, что эгоизм/альтруизм можно рассматривать как дополнительное измерение, подлежащее включению в показатели правдоподобия.
Опубликовано в: Транзакции IEEE по играм ( Том: 13, Выпуск: 3, сентябрь 2021)
Страницы: 229-238
Дата публикации: 27 апреля 2020 года
Информация ISSN:
Регистрационный номер: 21099084
Издатель: IEEE

Результаты эксперимента дают наводящие на размышления наблюдения в отношении правдоподобия различных агентов на основе их уровня эгоизма/альтруизма, а также существенных последствий для показателей правдоподобия, особенно в отношении самоощущения игроков. Два основных вывода из этого исследования заключаются в следующем.

  1. Определение человекоподобного поведения не должно основываться исключительно на человеческом наблюдении, но, скорее, оно должно также включать восприятие человеческого поведения.
  2. Альтруизм/эгоизм можно рассматривать как измерение показателей правдоподобия. Это влияет и зависит от понятности поведения, предсказуемости, согласованности поведения, изменений с опытом и социальных показателей.

Весь текст статьи см. по указанной выше ссылку

Leave a Reply

Your email address will not be published. Required fields are marked *