게임이론 17, 진화의 효과를 시뮬레이션함으로써 계속

대부분의 사회 과학자들은 호혜주의에 대해 알아야 할 모든 것이 무기한 반복되는 죄수의 딜레마에 대한 전략 TIT-FOR-TAT에 요약되어 있다고 생각합니다. 그것은 플레이어에게 비둘기 게임을 시작한 다음 다른 플레이어가 지난 번에했던 것을 복사하도록합니다. Alice와 Bob이 둘 다 GRIM을 플레이한다면 내쉬 평형처럼 TIT-FOR-TAT을 플레이한다면 그것은 내쉬 평형입니다. 그러나 TIT-FOR-TAT는 가차없이 편차를 처벌하지 않습니다. 회개 한 죄인들은 다시 비둘기를하여 접은 자에게 돌아온 후에 용서받습니다. TIT-FOR-TAT의 인기는 사회 과학자들이 컴퓨터 프로그램을 제출하도록 초대 된 Bob Axelrod의 Olympiad에서 비롯됩니다.이 프로그램에서는 무기한 반복되는 죄수의 딜레마에서 서로 대결하게됩니다. 파일럿 라운드의 결과를 알게 된 후, 참가자는 게임에서 무한한 수의 가능한 전략 중 63 개를 구현 한 프로그램을 제출했습니다.
경쟁에서 가장 성공적인 전략은 TIT-FOR-TAT이었습니다. Axelrod는 63 가지 전략 모두에서 진화의 효과를 시뮬레이션함으로써 계속되었습니다. TIT-FOR-TAT가 진화 시뮬레이션이 끝난 시점에서 생존하는 모든 프로그램 중 가장 많았던 사실은 Axelrod의 질문을 제기했습니다. Axelrod는 TIT-FOR-TAT를 전면적 인 인간 협력을위한 적절한 패러다임으로 제안하기 시작했습니다. . 덕목을 묘사 할 때 그는 이렇게 말합니다. TIT-FOR-TAT의 튼튼한 성공에 대한 설명은 좋고, 보복적이고, 용서하고 분명하다는 것의 조합입니다. 그것의 niceness는 불필요한 문제로 들어가는 것을 방지합니다. 그것의 보복은 탈북이 시도 될 때마다 상대방이 계속 멸망하지 못하게합니다. 용서는 상호 협력을 회복시키는 데 도움이됩니다. 그리고 그것의 명료성은 그것을 다른 플레이어에게 알려 주어, 장기적인 협력을 이끌어냅니다. 그러나 Axelrod의 시뮬레이션에서 TIT-FOR-TAT을 가장 성공적인 전략으로 묘사하는 것은 백합을 도금하는 것이 었습니다. Olympiad를 위해 입력 된 전략 중 6 개는 진화 과정에서 살아 남았습니다. 따라서 진정한 승자는 살아있는 전략이 프로세스가 안정화되었을 때 존재했던 빈도로 재생되는 혼합 전략이었습니다. 이 6 가지 전략을 혼합 한 TIT-FOR-TAT의 빈도는 실제로 1/6 수준에 불과했습니다. TIT-FOR-TAT가 시뮬레이션에서 즐기는 제한된 성공은 엔트리의 초기 모집단이 다양 할 때 강력하지 않습니다. 용서가 안되는 GRIM은 TIT-FOR-TAT에 편승되지 않은 초기 출간 인구가있을 때 매우 잘합니다. Axelrod는 매가 처음 플레이 한 적이 결코 없기 때문에 좋은 전략을 세웠지 만, 그가 제안한 바와 같이 멋진 행동을 이끌어 낼 수있는 진화를 믿을 수는 없습니다. 착취 가치가있는 빨판의 일부가 지속적으로 시스템에 유입 될 때, 평균 전략은 TIT-FOR-TAT보다 우수합니다. 가장 단순한 그런 평균 전략은 TAT-FOR-TIT입니다. TAT-FOR-TIT은 매를 연주하여 시작하고 이후에 상대방이 매 시간마다 매를 쳤을 때만 행동을 전환합니다. 두 개의 TAT-FOR-TIT 전략은 무한히 반복되는 Prisoner ‘s Dilemma에서의 Nash 평형이며, 첫 번째 라운드 이후에만 협동이 이루어집니다. 명확성에 관해서는, 돌연변이 체가 자신의 사본을 인식 할 수 있도록 협력을 진전시키는 것만이 필요합니다. Axelrod의 목록에 남아있는 것은 모두 성공적인 전략이 보복되어야한다는 요구 사항입니다. 이것이 pairwise interactions에만 적용되기 때문에 이것은 아마도 가장 해를 끼친 주장 일 것입니다. 예를 들어, 호혜주의는 우정의 진화를 설명 할 수 없다고합니다. 침팬지의 공세 방어적인 동맹이 뻔뻔한 이야기로 설명 될 수 없다는 것은 사실입니다. 앨리스가 상처를 입거나 아프기 때문에 도움이 필요하다면, 동맹국은 미래에 동맹국으로는 유용하지 않을 것이기 때문에 동맹국에 도움이되는 인센티브가 없습니다. 따라서 그녀가 협조를 철회하게하는 위협은 아무 것도 없습니다. 그러나 다중 인물 상호 작용에서 사기꾼을 처벌하는 부상 당하지 않아도됩니다. 다른 분들은 밥이 앨리스를 자신의 운명에 버리면, 미래에 그와 동맹을 형성하는 것을 거부함으로써 자신의 신실 성을 처벌 할 것인지를 검토 할 것입니다. 어쨌든 친구들이 곤경에 처했을 때 친구들을 버리고 명성을 얻은 누군가와 동맹을 맺고 싶어는가입니다. TIT-FOR-TAT에 대한 열정은 사람들이 원 포지 포로의 딜레마에 협력하는 것이 이성적이라고 주장했던 것과 같은 이유에서 생존 할 수 있다고 생각합니다. 그들은 인간이 본질적으로 훌륭하다고 믿고 싶습니다. 그러나 Axelrod의 Olympiad와 많은 후기 진화 시뮬레이션에서 배워야 할 진정한 교훈은 훨씬 더 안심할 수 있습니다. Axelrod의 TIT-FOR-TAT에 대한 주장은 과장되어 왔지만, 진화가 협조적인 결과를 낳을 가능성이 있다는 그의 결론은 진실로 강력한 것으로 보입니다. 그러므로 저희는 우리가 서로 잘 지낼 수있는 방법을 설명하기 위해 우리 모두가 지킬 박사 인 것처럼 가장 할 필요가 없습니다. 미스터 히데스 (Hydes)의 사회조차도 마침내 무기한 반복되는 경기에서 효율적인 균형을 조정하는 법을 배울 수 있습니다.
사회적 관계의 게임 이론 모델은 권위, 비난, 예의, 의무, 부러움, 우정, 죄책감, 명예, 성실, 정의, 충성도, 겸손, 소유권, 자존심, 평판, 지위와 같은 개념에 대한 언급이 없기 때문에 환원 주의자로 비판받는 경우도 있습니다 , 신뢰, 미덕 등. 게임 이론은 로봇과 같은 사람들을 다루는 비인간적 인 학문이라고 추론합니다. 모든 성공적인 과학과 마찬가지로 게임 이론은 환원 적이지만 게임 이론가들이 권위 나 의무와 같은 개념이 인간 행동과 관련이 없다고 생각하는 것은 아닙니다. 반대로, 저희는 그러한 생각들이 사람들이 삶의 게임에서 놀고있는 평형을 이해하려고 할 때 발생하는 창 발적 현상이라고 믿는입니다. 예를 들어, 앨리스가 항상 제공하는 평형에 대한 민간 설명과 신뢰 미니 가메에서 항상 밥이 지불하는 것은 Bob이 앨리스를 속임수로 정직에 대한 평판을 잃을 여유가 없다는 것입니다. 미래에 그를. 실제로, Bob은 대개 새로운 사람이 될 것이지만 동일한 평형도 마찬가지로 효과가 있습니다. 아무도 돈을 지불하지 않아 평판이 좋지 않은 사람과 Alice가 더 이상 준비 할 수 없기 때문입니다. 그런 이야기를 부인할 때가 아니라 게임 이론은 때로는 왜 작동하는지, 때로는 실패하는 이유에 대한 견해를 제공합니다. 예를 들어 비평가들은 정직에 대한 평판이 중요하지 않은 원 샷 게임에서도 사람들이 여전히 돈을 지불하기 때문에 Trust Minigame에 대해 잘못된 것이라고 말합니다. 그러나 주유소가 점차적으로 가솔린을 미리 지불하는 것을 보았습니다. 아마도 한 번의 트러스트 미니 가메에서 서브 게임 – 완벽한 균형이 너무 자주 발생하여 게임을 더 이상 할 수 없기 때문일 것입니다. 데이비드 흄 (David Hume)은 교황, 대통령, 왕, 판사, 경찰 등의 권위는 단지 관습과 습관의 문제라고 말합니다. 앨리스는 왕에게 복종합니다. 왕이 복종하지 않으면 앨리스를 처벌하라고 명령합니다. 그런데 왜 앨리스를 처벌하라는 명령을 복종합니까? 간추려서, 누가 보호자를 보호합니까? 게임 이론은 민속 법칙의 버전이 내쉬 평형뿐만 아니라 서브 게임 – 완벽한 평형에 대해서도 보유하고 있음을 보여줌으로써이 고대의 질문에 답합니다. 그러한 평형이 사용되면 평형 경로를 벗어나는 서브 게임에 우리를 부과하는 비정상적인 행동을 처벌하는 것이 항상 최적입니다. 이탈자를 처벌하는 비용을 피하려고 자신을 이탈하면 다른 플레이어가 당신을 처벌하는 것이 최적 인 또 다른 서브 게임으로 우리를 데려 갈 것입니다. 그가 그렇게하지 못하면, 저희는 또 다른 서브 게임에 갑니다. 임마누엘 칸트 (Immanuel Kant)는 그러한 책임의 사슬을 생각하는 것이 무한한 퇴보를 시작하는 것이라고 생각하지만 민중의 정리는 책임의 사슬 (chain of responsibility)이 서로에 대해 구부러 질 수 있음을 보여줍니다. 한정된 수의 플레이어 만이 책임의 사슬은 반드시 칸트가 고려하지 않은 방식으로 닫혀 있어야합니다. 앨리스는 밥이 그렇지 않으면 처벌 할 것을 두려워하기 때문에 왕에게 복종합니다. Bob은 Carol이 그렇지 않으면 그를 처벌 할 것을 두려워하기 때문에 Bob은 Alice를 처벌하라는 명령을 따를 것입니다. 앨리스가 달리 처벌 할 것을 두려워하기 때문에 캐롤은 밥을 처벌하라는 명령에 복종 할 것입니다. 처음에는 자기 확인 신념의 나선형이 너무 단단해서 어떤 것도 견고하게지지하지 못하는 것처럼 보입니다. 신념이 원안에서 돌아 다니는 것은 사실이지만 민속 법칙은 신념에 의해 생성 된 행동이 서브 게임 – 완벽한 평형으로 함께 존재하기 때문에 그들의 취약성이 환상임을 보여줍니다.

Leave a Comment