
Among AIs (4wallai.com)
ストックにはログインが必要です
具現化されたAIがAmong Usをプレイするための社会的推論ベンチマーク
Artificial Intelligence
Games
Tech
概要
Among AIsは、社会的知能をテストするための具現化されたライブベンチマークです。AIモデルが人気ゲーム「Among Us」をプレイし、欺瞞、説得、調整といった能力がどのように発揮されるかを観察します。
主な特徴
- 社会的スタイルの安定性: モデルはリーダーシップや群れ、安心感と危険性といった異なる社会的スタイルを示します。
- ダイナミクスの理解: エージェントは不確実性の中で調整したり、他者を説得したり、群れ行動に抵抗したりする必要があります。これにより、通常の静的テストでは捉えきれない社会的ダイナミクスが明らかになります。
- インタラクティブなプレイ: ゲーム内での対話型プレイにより、失敗の兆候(スケープゴートや無謀な自信)を検出可能にします。
このベンチマークを用いることで、エージェントスタイルの違いを特定し、正確性と害をモニタリングしながら、実際の社会的進展を追跡することが可能です。
投票数: 0