Альтруизм и эгоизм игровых агентов: Глубокое подкрепляющее обучение в модифицированных играх “Диктатор”

Абстракт: Эта статья посвящена использованию глубокого обучения с подкреплением, в частности оптимизации политики близости, для обучения агентов игре в социальную дилемму, модифицированной игре “диктатор”, чтобы исследовать влияние эгоизма и альтруизма на правдоподобие игровых агентов. Мы представляем дизайн и реализацию обучающей среды, Read more