게임이론 16, 무기한 반복되는 죄수의 딜레마에서 합리적 협력을 지지

GRIM 이외의 전략은 무기한 반복되는 죄수의 딜레마에서 합리적 협력을 지지 할 수 있습니까? 다른 반복 된 게임에서 합리적인 협력은 무엇입니까? 이러한 질문에 대한 게임 이론의 대답을 민중 정리라고 부르지 만 민속학 교수는 없습니다. Nash가 내쉬 균형에 대한 아이디어를 발표 한 후, Bob Aumann은 사업에 종사하는 모든 사람들이 이미 반복적 인 게임에 대한 함의를 알고있는 것으로 나타 났으므로 주제에 대한 그의 생각을 민중의 지혜로 간주해야한다고 결정했습니다. 데이비드 흄 (David Hume)은 1739 년 호혜주의가 어떻게 작용했는지에 관해 이미 설명했지만, 아우만은 그의 일에 대해 아무 것도 모른다 고 생각하지 않습니다. 생물 학자 Robert Trivers는 Aumann의 생각을 똑같이 알지 못했지만 20 년 후 상호 이타주의로 그들을 재창조했습니다. Axelrod의 Evolution of Cooperation이 1984 년에 발표되었을 때만이 아이디어는 결국 1492 년 콜럼버스의 항해 후에 미국이 발견되는 것을 중단 한 것과 같은 방식으로 마침내 재발견되지 않았습니다. 어린 아이 였을 때, 저는 왜 가게 주인들이 돈을 받고 물건을 가져 오는 지 궁금해합니다. 왜 그냥 주머니에 넣지 않는거야? 경제학자들은 이것을 보류 문제라고 부릅니다. 제가 가장 좋아하는 예가 앤트워프 다이아몬드 시장입니다. 상인은 심지어 영수증을 요구하지 않고도 검사를 위해 엄청나게 가치있는 다이아몬드를 넘겨줍니다. 왜 그들은 속임수를 쓰지 않는거야? 저는 1991 년 8 월 29 일 뉴욕 타임스에서 가장 깔끔한 설명을 발견했습니다. 그가 왜 자신의 발견을 팔아서 골동품 가게 주인의 정직에 의지 할 수 있는지 묻자, GRIM 전략에 익숙하지 않은 딜러는 ‘나는 그를 믿어. 이 사업을 신뢰하는 사람들을 알고 있습니다. Trust Minigame은 이러한 신뢰와 명성에 대한 질문을 강조하는 장난감 게임입니다. Alice가 Bob에게 서비스를 제공 할 때, 대가로 지불함으로써 보답 할 것을 믿는다면, 그들의 곤경은 기본적으로 그림 11의 Kidnap 게임에서와 동일합니다. Kidnap은 독특한 서브 게임 – 완벽한 평형을 가지고 있기 때문에, Trust Minigame에 대해서도 마찬가지입니다. 앨리스는 밥이 돈을 지불하지 않을 것이라고 예측하기 때문에 서비스를 제공하지 않습니다. 그러나 민속 법칙은 그림 20의 음영이 높은 영역에서의 모든 결과 집합은 무기가 반복되는 게임의 내쉬 평형 결과임을 나타냅니다. – 앨리스가 항상 제공 할 때 발생하는 보상 쌍 (2,1)과 밥 (Bob)이 항상 지불하는 경우입니다.
민속 법칙. 음영 처리 된 영역은 죄수의 딜레마와 신탁 미니 가메의 협동 보수 영역을 보여줍니다. 이것들은 프리 플레이 (pre-play) 거래가 집행 가능하다면 플레이어가 동의 할 수있는 보수 (payoff) 쌍의 집합입니다. 깊게 음영 처리 된 삼각형은 플레이어가 충분히 참을성이있을 때 두 게임의 반복 버전에서 평형 결과로서 민속 정리가 사용 가능한 것으로 보여주는 게임 당 지불 쌍을 보여줍니다. 민법 이론이 왜 작동 하는지를 이해하려면, One-shot Trust Minigame을 어떻게 플레이하는지 사전에 협상 할 수 있다면 Alice와 Bob에게 어떤 가능성이 열려 있는지 질문하는 것이 유용합니다. 하나의 가능성은 그림 11의 테이블에서 3 가지 보수 쌍 중 하나에 동의 할 수 있다는 것입니다. 이러한 보상 쌍은 그림 20에서 음영 처리 된 삼각형의 모서리에 있습니다. 삼각형의 나머지 점은 다음과 같은 방법으로 얻을 수 있습니다. 동전을 던지거나 돌아서 라. 예를 들어, Alice와 Bob이 그녀가 항상 전달할 것이라는 점에 동의하지만 시간의 절반 만 지불하면 쌍 (0, 2)과 (2, 1) 중간에 위치하게되는 결과 집합입니다. 앨리스와 밥이 동의 할 수있는 모든 가능한 타협으로 구성되어 있기 때문에 음영 처리 된 삼각형을 트러스트 미니 게임의 협동 보수 영역이라고합니다. 교섭 이야기의 문제점은 Alice와 Bob이 작성할 수있는 계약을 기꺼이 실시 할 수있는 일종의 외부 기관 없이는 작동하지 않는다는 것입니다. 그러한 외부 대행사가 없으면 Alice와 Bob 간의 계약은 자체 정책이어야합니다. 즉, 다른 플레이어도 그렇게한다면 플레이어가 계약을 유지하는 것이 최적이어야합니다. 따라서 Nash 평형 만이 가능한 거래가 가능합니다. 따라서 단발 트러스트 미니 게임에서 합리적인 플레이어의 유일한 가능성은 Bob이 지불하지 않기 때문에 Alice가 제공하지 않는 비효율적 인 결과입니다. 그러나 게임을 무기한으로 자주 반복하면 어떻게됩니까? 원 샷 게임의 내쉬 균형을 유지하기 위해 항상 반복되는 게임에서 내쉬 균형이 유지되지만 민속 법칙은 항상 더 많은 평형이 있다고 말합니다. 플레이어가 충분히 참을성이 있고 게임이 적어도 한 번 더 플레이 될 확률이 충분히 높으면 협동 보수 영역 내의 지불 보수 쌍이 내쉬 균형 값으로 사용할 수 있습니다. 기본적인 논쟁은 너무 쉬워서 Nash가 1951 년에 그의 균형 이론을 발표 한 후에 반복적으로 게임에 어떤 생각을 주었던 거의 모든 사람들이 발견하게 된 것은 놀랄 일이 아닙니다. 협동 보수 영역 내에서 잠재적 합의를 선택하십시오. 이를 내쉬 균형 결과로 만들기 위해서는 계약을 이행하기 위해 따라야 할 전략에서 벗어난 선수 만 처벌하면됩니다. 논쟁의 목적을 위해, GRIM 전략의 형벌 적 형벌을 사용하는 것이 가장 쉽습니다. GRIM 전략의 편차는 영원히 가장 가혹한 방식으로 처벌됩니다. 앨리스가 밥에게 줄 수있는 가장 심한 형벌은 무엇입니까? 그녀가 할 수있는 최악의 상황은 그를 미니 맥스의 보수로 잡아 두는 것입니다. 왜냐하면 그는 자신이 처벌 전략을 선택할 때 자신의 보수를 최대화하는 회신을함으로써 자신의 보수를 최소화하려는 시도에 응답 할 것이기 때문입니다. 죄수의 딜레마에서 두 플레이어의 미니 맥스 보수는 0입니다. 트러스트 미니 게임에서 앨리스의 미니 맥스 보상은 1이고 밥의 부호는 0입니다. 따라서 그림 20의 짙은 음영 영역은 무한 반복 버전에 대한 자체 위임 계약을 모두 보여줍니다. 죄수의 딜레마와 신임 미니 가메. 내쉬 평형 결과 (Nash equilibrium outcomes)는 다른 어떤 협약도지지 할 수 없습니다. 무엇이 잘못 될 수 있습니까? 쉽게 증명할 수는 있지만, 민속 법칙은 아마도 정치 철학에서 가장 중요한 통찰력을 구현한다고 생각합니다. 그것은 우리가 외부의 집행 기관 (실제 또는 발명품)을 필요로하지 않고 성공적으로 협력 할 수 있다고 말합니다. 반복되는 상황에서 저희는 경찰관으로서의 행동으로 모든 협력의 결실을 누릴 수 있습니다. 그러나 민속 법칙에는 큰 한계가있습니다. 평형으로부터의 편차가 다른 플레이어에 의해 관찰된다는 것을 가정합니다. 이것은 아마도 인간 문화가 처음 진화 한 작은 수렵 채집 인들의 경우에는 나쁜 가정이 아닙니다. 오늘날의 작은 마을에서와 마찬가지로 모든 사람들이 다른 사람의 사업을 알았을 것입니다. 그러나 이것은 분명히 현대 도시 생활에는 사실이 아닙니다. 대도시의 익명성에서는 사기 행각을 막을 정도로 종종 사기꾼을 탐지하고 처벌하는 것이 불가능합니다. 저희는 CCTV 카메라, 경찰관, 감사관, 세무 조사관 등을 통해 최선을 다하지만, 누구도이 방향에서의 우리의 노력이 어디서나 효율적이라고 주장하고 싶지 않습니다. 저는 게임 이론가들이 불완전한 모니터링 문제에 대한 모든 해답을 가지고 있다고 말할 수 있었으면 좋겠다고 생각하지만, 많은 똑똑한 사람들의 노력에도 불구하고 대게는 여전히 불분명합니다. 이것은 아마 게임 진영의 영역으로서 진보가 가장 큰 사회적 이점을 가질 것입니다.

Leave a Comment