게임이론 9, 도달한 전략적 형태의 관점

지배 전략 삭제 – 후진 유도를 수행하는 동안 노드에서 여러가지 선택 사항을 제시할 때마다 동일한 양의 순수 전략을 폐기하게 됩니다.

그 단계에서 도달한 전략적 형태의 관점에서 볼 때, 여러분이 포기하는 모든 전략은 최고의 결과를 요구하는 것을 제외하고는 정확히 같은 전략에 의해 지배됩니다.

두 전략이 항상 같은 성과를 내는 경우를 제외하면, 다른 참가자들이 어떤 전략을 사용하든 더 나은 성과를 거두지 못하면 한 전략이 다른 전략에 의해 지배됩니다. 따라서 Haw는 죄수의 딜레마에서 비둘기를 지배합니다. 따라서 저희는 게임의 전략적 형태에서 지배적인 전략을 연속적으로 삭제함으로써 게임에서 역 유도를 모방할 수 있습니다. 저희는 때로는 역 유도를 모방하지 않더라도 이 방법으로 전략적 형태를 단 하나의 결과로 줄일 수 있습니다. 결과는 항상 2인 제로 섬 게임에서 최대의 결과가 될 것입니다. 하지만 일반적으로 게임은 어떨까요?
큰 게임에서 지배적인 전략을 제거함으로써 얻을 수 있는 NashBalance는 또한 큰 게임의 NashBalance이기도 합니다. 그 이유는 게임에서 당신의 선택에 지배적인 전략을 더하는 것은 당신의 현재 최고의 대답을 더 나쁘게 만들 수 없기 때문입니다. 지배적인 전략을 삭제할 때 내시를 잃을 수도 있지만, 원래의 게임에 대한 모든 내시들을 없앨 수는 없습니다. 추측 게임 – 앨리스가 주식 시장에서 거래를 한다면, 그녀가 사는 주식의 가치가 오르기를 바라고 있습니다. 그들의 미래 가치는 다른 사람들이 그들에 대해 어떻게 믿느냐에 달려 있기 때문에 앨리스와 같은 투자자들은 정말로 다른 사람의 믿음에 근거하여 투자하고 있습니다. 밥이 앨리스 같은 투자자들을 이용할 계획이라면, 그는 다른 사람들이 믿는 것에 대한 그녀의 믿음을 고려할 필요가 있을 것입니다. 우리가 밥을 이용하고 싶다면, 저희는 밥이 앨리스가 다른 사람들이 믿는 것에 대해 어떻게 믿는지 물어볼 필요가 있을 것입니다. 존 메이너드 케인스는 어떻게 사람들이 이 문제에 대해 생각할수록 믿음에 대한 믿음의 사슬이 더 길어지는지를 설명하기 위해 그 시대의 신문들이 운영하는 미인 대회를 이용했습니다. 이 대회들의 목적은 대부분의 다른 사람들에 의해 선택된 소녀를 선택하는 것이었습니다. 게임 이론가들은 승자가 선택된 모든 숫자의 평균의 2/3에 가까운 숫자를 선택하는 더 간단한 추측 게임을 선호합니다. 선수가 1에서 10사이의 정수로 제한된다면, 평균은 최대 10이 될 수 있고 23×10=623이기 때문에 7이상의 숫자를 선택하는 것이 지배적인 전략입니다. 따라서 8,9,10이 아니라 7을 사용하여 항상 이길 확률을 높일 수 있습니다. 하지만 모두가 그것을 알고 있다면, 아무도 지배적인 전략을 구사하지 못할 것이고, 그 다음 저희는 선수들이 1에서 7 사이의 숫자를 선택하는 게임에 있습니다. 이 게임의 평균은 최대 7이고 23 × 7 = 423입니다. 그래서 5이상의 숫자를 선택하는 것은 지배적인 전략입니다. 이 논쟁이 어디로 가고 있는지는 분명할 것입니다. 만약 어떤 선수도 지배적인 전략을 사용하지 않을 것이라는 것이 상식이라면, 모든 선수들은 1번을 선택해야 합니다. 상식 – 모든 사람이 그것을 알고 있다면, 어떤 것은 상식입니다. 모든 사람은 그것을 알고 있고, 모든 사람이 그것을 알고 있다는 것을 압니다. 게임의 이성적인 분석에서 그 반대되는 말이 없다면, 그것은 항상 암시적으로 선수들의 경기와 합리성 둘 다 상식이라고 가정합니다. 그렇지 않으면 저희는 내쉬 평형상태가 무한한 형태의 퇴행으로 갈 수 있다는 생각을 할 수 없을 것입니다. 저는 한 때 “The Price is right”라는 퀴즈 쇼를 본 적이 있는데, 이 퀴즈쇼에서는 세 명의 참가자들이 골동품의 가치를 추측합니다. 실제 가치에 가장 근접한 사람이 승자입니다. 만약 마지막 참가자가 그 가치가 다른 두 가지 추측보다 더 크다고 생각한다면, 그는 분명히 1달러 이하까지 더 높은 추측을 해야 합니다. 이것이 일어나는 일이 아니기 때문에, 저희는 경쟁자들이 이성적이라는 일반적인 지식이라는 가정 하에 퀴즈쇼에 게임 이론을 적용하려고 하는 것은 어리석은 일일 것입니다. 그러므로 게임 이론의 진화적 해석이 그렇게 강력한 가정을 요구하지 않는 것은 다행입니다.
키드냅, 하위 게임 완료 – 대니얼 엘스버그는 1971년 뉴욕 타임즈에 펜타곤 페이퍼를 유출했을 때 닉슨 행정부가 베트남에서 한 전쟁 행위를 폭로한 것으로 가장 잘 알려져 있습니다. 그는 일찍이 키드냅 게임을 제안했습니다. 앨리스는 밥을 납치했습니다. 몸값이 지불되었고, 이제 문제는 그녀가 그를 풀어 줘야 할 것인가 아니면 죽일 것인가입니다. 앨리스는 밥이 자신의 정체를 밝히지 않을 거라고 확신할 수 있다면 밥을 놓아주고 싶어 할 것입니다. 밥은 침묵을 지키겠다고 약속했지만, 그녀는 그의 약속을 믿을 수 있을까요? 그림 11은 상응하는 보수 표와 함께 Kiap을 위한 게임 트리를 보여 줍니다. 가장 좋은 대답을 듣는 것은 앨리스가 밥이 풀려나면 그가 말할 것이라고 예측하기 때문에 밥을 죽이는 내시 균형이 오직 한가지 밖에 없다는 것을 보여 줍니다. 지배적인 전략을 삭제하는 것은 우리를 같은 NashBalance로 이끕니다. 밥의 전략은 최소한 침묵하는 것과 같습니다. 그래서 저희는 침묵을 삭제하는 것으로 시작합니다. 남아 있는 게임에서 앨리스의 전략적 살인은 최소한 석방되는 것과 같습니다. 그래서 저희는 내시 균형만 남았습니다. 이러한 방식으로 지배적인 전략을 삭제하는 것은 게임 트리에서 역 유도를 사용하는 것과 같습니다. 먼저 밥의 가장 좋은 선택을 나타내는 게임 트리의 가지를 두껍게 하라. 이제 밥의 열등한 선택이 거기에 있다는 것을 잊고 남은 게임에서 앨리스가 가장 잘 선택한 살인을 보여 주는 가지를 두껍게 하세요. 앨리스와 밥이 내시 평형(살인, 말하기)을 연기할 때 따라올 평형 경로를 이제 볼 수 있습니다. 이 경우 두꺼운 가지 하나가 나무의 뿌리를 잎에 연결하고, 큰 게임에서 균형 경로는 뿌리를 잎과 연결하는 두꺼운 가지의 전체 시퀀스가 됩니다. 키드냅과 같이 완벽한 정보를 얻을 수 있는 게임의 경우, 역 유도는 항상 전체 게임에서 NashBalance뿐만 아니라 모든 하위 게임에서도 사용되는 전략으로 이어집니다. 평형 경로 유무 ReinhardSelten은 부분적으로 이 계층의 평등을 소개한 것에 대해 JohnNash와 함께 노벨상을 공동 수상했습니다. 그는 처음에 그것들을 완벽하다고 불렀지만, 나중에 완벽이 무엇을 의미하는지에 대한 그의 생각을 바꾸었습니다. 그래서 이제 저희는 그것들을 완벽하다고 부릅니다. 반투과 – 정치인들은 가상의 질문들이 이치에 맞지 않는 것처럼 가장하는 것을 좋아합니다. 1992년 조지 부시 시니어는 실업 수당에 관한 완벽하고 합리적인 질문에 대답했을 때 말했습니다. 그러나 스 .프라는 게임은마치 그들이 정치의 생명체가 되어야 하는 것처럼 가상의 질문들이 왜 게임 이론의 생명체들인지를 보여 줍니다. 합리적인 선수들은 그들이 일탈할 경우 일어날 것이라고 예측하기 때문에 그들의 균형 전략을 고수합니다. 이 문장의 주제는 우리가 일어나지 않을, 즉 타협적인 사건에 대해 이야기하고 있기 때문에 나타났습니다. 현실적인 것과는 무관하지 않게, 그러한 타협적인 사건은 합리적인 결정이 내려질 때마다 항상 발생합니다. 왜 앨리스는 길을 건널 때 차 앞에 절대로 발을 들여놓지 않는 걸까요? 만약 그녀가 그렇게 하면, 그녀는 차에 치일 것이라는 징후가 있기 때문입니다. 앨리스는 왜 밥을 죽이는 걸까요? 왜냐하면 그녀는 그녀가 말하지 않으면 그가 그녀에게 말할 것이라고 믿기 때문입니다. 따라서 도달하지 못할 부분 군에서는 어떤 일이 벌어질지가 중요합니다. 그들이 도달하지 못하면 무슨 일이 일어날지 때문입니다! 경기를 바꾼다고요? 심리학자들은 유괴된 사람들에게 납치범들과 인간 관계를 형성하려고 노력하라고 충고합니다. 밥이 앨리스에게 조용히 남아 있거나 말하는 것에 대한 그의 보상이 번복될 수 있도록 충분히 설득할 수 있다면, 저희는 다른 게임을 하고 있을 것입니다. 그림 12에서 보듯이 Cosh3Packs는 순수한 전략에 있어서 두개의 내시와(살인, 말하기)그리고(석방, 침묵)을 가지고 있습니다. 균형(살인, 말하기)은 더 이상 완벽하지 않습니다. 왜냐하면 밥은 앨리스가 실제로 살인을 저질렀지만, 앨리스가 대신 석방을 선택한다면 도달할 수 있을 것이기때문입니다. 그러나 새로운 평형(방출, 침묵)은 노상이 완벽합니다. 따라서 앨리스가 이성적이고 밥이 이성적이라는 것을 안다면, 이 균형이 이루어질 것입니다. 만약 뇌물이 공개된 선호 이론에 따라 선택된다면, 밥은 앨리스가 석방될 것인지 아닌지를 말하기보다는 침묵을 지킬 것이라는 것이 이론입니다. 앨리스는 그것이 살인보다 더 큰 대가를 낳을 것이라는 것을 알기 때문에 석방을 연기할 것입니다. 도덕적으로는 합리성이 때때로 앨리스와 밥이 내시 균형을 연기해야 한다는 것 이상을 우리에게 말해 준다는 것입니다.

Leave a Comment