게임이론 19, 맥시민 전략이 여전히 폰 노이만의 모델과 유사

여러분의 최대 전략을 실행하는 것은 공정한 게임에서 0보다 낫지 않은 평균 이익을 낼 뿐만 아니라, 페인트가 마르는 것을 보는 것만큼 재미가 있을 것입니다. 예를 들어, 엘리스가 스트레이트 포커에서 밥과 경기할 때 8대 대접을 받는다면, 그녀의 최대 인사는 4번 재기하라는 것이지만, 밥이 그녀를 다시 기르면 접는 것입니다! 진짜 포커 테이블에서 돈을 벌기 위해서는 훨씬 더 진취적일 필요가 있습니다. 여러분은 적극적으로 상대방의 심리적 결함을 찾아 이용해야 합니다. 하지만 여러분이 아마릴로 슬림과 같은 인간 심리의 타고난 달인이 아니라면, 다른 사람들의 결점을 이용하려는 여러분의 순진한 시도는 결국 그들이 여러분의 것을 이용하는 것으로 끝날 것 같아요! 만약 당신이 똑바른 플러스와 풀하우스의 차이나 텍사스 홀드의 베팅 규칙들을 모를지라도 걱정하지 마라. 폰 노이만의 장난감 모델은 그러한 모든 복잡한 문제들을 추상화합니다. 앨리스와 밥은 각각 0과 1 사이의 숫자로 처리됩니다. 그래서 앨리스에게 0.667이 주어지면, 그녀는 대략 밥보다 더 높은 카드를 가지고 있다고 생각합니다. 그 거래에 앞서 각 선수는 1달러씩을 넣는입니다. 그 거래 후에, 한 차례의 내기 경기가 있는데, 그 기간 동안 밥은 그것을 접을 수 있습니다. 만약 그가 접으면, 앨리스는 누가 더 나은 손을 가졌든 간에 화분에 당첨됩니다. 밥이 접히지 않으면, 승부가 난 뒤 더 높은 카드를 가진 선수가 항아리를 잡는입니다. 쇼다운은 밥이 엘리스에게 그 화분에 대한 그의 전적인 기여를 그녀의 것과 동일하게 함으로써 그의 내기에 전화했을 때 일어났습니다. 폰 노이만의 모델은 도박 가능성을 심각하게 제한합니다. 앨리스는 먼저 (냄비에 0달러를 더함으로써) 확인하거나 (냄비에 1달러를 더함으로써) 올릴 수 있습니다. 만약 그녀가 확인한다면, 밥은 전화해야 합니다. 앨리스가 상승하면, 밥은 선택의 여지가 있습니다. 그는 접거나 부를 수 있습니다. 그림 23은 폰 노이만의 모델에서 선수들의 최대 범죄 전략을 보여주고 있습니다. 니켈과 데임 포커를 연기하는 모든 분들은 앨리스는 때때로 가난한 손으로 기르거나, 밥은 그녀가 좋은 손으로 기댈 때 절대 전화하지 않는 법을 배울 것이라는 것을 압니다. 아마추어들은 중거리 손으로 허세를 부려 타협을 시도하지만, 최대인격 전략은 그렇게 소심하지 않습니다. 포커에게 조차 좋은 반대에 부딪치고 싶다면, 정말 나쁜 손으로 허세를 많이 부려! 허세를 부리는 것은 그다지 좋지 않은 손으로 이길 수 있는 것이 아니라, 여러분이 손을 잘 잡았을 때 상대방이 중간 정도의 손으로 내기를 권하고 싶기 때문입니다. 맥시민은 폰 노이만의 포커 모델에서 플레이합니다. 왼쪽의 그래프는 앨리스 또는 밥이 높게 베팅해야하는 확률이 손에 달려 있음을 보여줍니다. (밥의 여러 가지 최적 전략 중 하나만 표시됩니다.) 오른쪽 그래프는 단순화 된 버전에서 최적의 플레이가 비슷한 성격을 가짐을 보여줍니다
다음 모델은 폰 노이만의 수치 카드를 킹, 퀸 및 하트 킹 만있는 데크로 대체하여 포커를 더욱 단순화합니다. 그러나 그림 23은 맥시민 전략이 여전히 폰 노이만의 모델과 유사 함을 보여줍니다. 그림 24의 게임 트리를 시작하는 기회 이동은 6 명의 동등한 주문 중 하나에 데크를 셔플 한 딜러를 나타냅니다. 그런 다음 맨 위 카드는 앨리스에게, 두 번째 카드는 밥에게 넘겨집니다. 게임 트리의 나머지 부분은 카드의 새로운 데크로 작동하는 폰 노이만의 베팅 규칙을 보여줍니다. 게임 트리가 너무 심해서 게임을 해결하는 데 필요한 모든 것을 알게되면 놀랄 것입니다. 우선 라이벌보다 분명히 좋은 지점을 두껍게함으로써 지배 전략을 삭제하십시오. 예를 들어, 앨리스는 퀸을 잡을 때 확인해야합니다. 왜냐하면 밥은 자신의 비트가있을 때만 전화하기 때문입니다. 그런 다음 두 가지 결정 만이 의심의 여지가 있습니다. 앨리스는 잭을 잡을 때 허세 부리는가? 여왕을 붙잡을 때 밥이 전화를합니까? 그림 25는 게임의 모든 순수한 전략을 보여 주지만, 그늘진 부분에 해당하지 않는 전략이 지배적이기 때문에 전략적 형태의 음영 부분 만 중요합니다. 이 그림에는 음영 처리 된 부분이 클로즈업으로 표시되어 있습니다. 앨리스와 밥이 상대방을 무관심하게하기 위해 사용해야 할 전략을 찾아내는 것으로이 게임의 혼합 된 내쉬 균형을 구할 수 있습니다. 앨리스는 1/3 확률로 RCR (잭을 잡을 때 올리기)을해야합니다. Bob은 확률 1/3로 CCF (여왕을 붙잡을 때 전화)를 해야합니다. 폰 노이만의 모델은 지배적 인 행동을 보이기 위해 선들이 두꺼워 진 후에, 앨리스가 잭을 잡고 밥이 여왕을 붙잡는 경우 만 남습니다 철학자 홉스 (Hobbes)에 따르면 인간은 신체의 힘, 열정, 경험, 이유 등으로 특징 지어집니다. 게임 이론에서 앨리스의 몸의 힘은 게임의 규칙에 따라 결정됩니다. 그녀의 열정은 그녀의 선호와 그녀의 경험에 대한 그녀의 경험으로 해석됩니다. 그녀의 이성은 그녀가 이성적으로 행동하도록 유도합니다. 폰 노이만의 포커 모델에 대한 지불 테이블은 앨리스를위한 전략 인 RCR은 왕을 붙잡을 때 키우고, 여왕을 붙잡을 때 검사하고, 잭을 잡을 때 키우는 것이 필요합니다. Bob을위한 CFF 전략은 왕을 붙잡고 여왕을 붙잡을 때 접고 잭을 잡을 때 접을 것을 요구합니다 이 4 가지 속성은 플레이어의 유형을 결정합니다. 누군가 다른 말을하지 않는 한, 합리적으로 게임을 분석하면 모든 플레이어의 유형이 당연한 것으로 간주됩니다. 이 매우 큰 가정은 때때로 정보가 게임에서 완료되었습니다고 말하면서 강조됩니다. 정보가 완전하다고 가정하는 것이 합리적일까요? 체스와 같은 게임은 문제가되지 않지만 치킨은 어떨까요? 앨리스가 Bob의 위험 회피 률을 충분히 잘 알아서 자신의 결과 값을 계산할 가능성이 있습니까? Bob은 자신의 보수에 대해 어떻게 믿을 것입니까? 앨리스는 밥이 자신의 보수에 대해 믿는 것에 대해 무엇을 믿을 것입니까?

Leave a Comment