[홀덤전략] GTO의 원리
페이지 정보
본문
익스플로잇과 GTO의 기본 틀
게임 이론 혹은 GTO(Game Theoretically Optimal)를 받아들이거나 거부해야 하는 엄격한 일련의 규칙으로 이해하는 것보다는, 포커에 대해 사고하고, 상대방의 액션을 예측하며, 여러분의 의사 결정 능력을 개선하기 위한 기본 틀로 이해하는 것이 가장 좋습니다. 그것의 목표는 상대의 실수에 대한 강한 가정을 피하고, 대신 상대가 어떻게 플레이하든지 상관없는 강력한 전략을 구축하는 것입니다. 이는 터프한 상대를 상대로 플레이할 때 특히 유용하지만, 실수를 예측하기 어려운 언노운 플레이어를 상대로 플레이할 때도 유용합니다.
게임 이론, 혹은 GTO(Game Theoretically Optimal)를 받아들이거나 거부해야 하는 엄격한 일련의 규칙으로 이해하는 것보다는 포커에 대해 사고하기 위한 기본 틀로 이해하는 것이 가장 좋습니다.
익스플로잇적 사고는 이러한 동일한 문제에 접근하는 다른 방법입니다. 익스플로잇적 접근 방식은 상대방이 저지를 특정 실수를 예측하고, 그러한 실수를 최대한 공략하는 전략을 세우는 것입니다. 이 접근 방식은 여러분이 성향을 잘 알고 있는 약한 플레이어를 상대할 때 가장 효과적입니다.
가위바위보 게임에서는 각 플레이어가 손을 사용하여 이 세 가지 중 하나를 냅니다. 바위는 가위를 이기고, 가위는 보를 이기고, 보는 바위를 이깁니다. 익스플로잇적인 접근 방식은 상대방이 무엇을 낼지 추측한 다음, 그에 따라 자신이 낼 것을 선택하는 것입니다. 게임 이론의 접근 방식은 각각 33% 확률로 랜덤하게 내는 것입니다. 이는 상대방이 여러분의 행동을 예측하는 것을 불가능하게 하며, 그것이 여러분이 상대방의 행동을 예측할 수 없을 때 기대할 수 있는 최선의 결과입니다.
포커에서는 이 두 가지 기본 틀이 상호 배타적이지 않습니다. 실제로, 게임 이론은 더 수익성 있는 익스플로잇을 구사하는 데 도움이 될 수 있습니다. 예를 들어, 여러분은 상대가 프리플랍에서 너무 많은 약한 핸드를 콜했지만, 플랍 이후에 그 모든 나쁜 핸드를 어떻게 플레이할지 명확하게 알지 못할 수도 있습니다. 게임 이론은 상대가 플랍 이후에 약한 핸드를 어떻게 플레이하든 상관없이, 여러분이 익스플로잇에 노출되지 않으면서 앞서 식별한 실수로부터 수익을 내는 데 도움이 됩니다.
게임 이론이 왜 유용할까요?
게임 이론은 불확실한 상황에서 의사결정을 내리기 위한 도구입니다. 상대방의 의도에 대한 실질적인 정보가 없는 경우, 게임 이론은 상대방이 가능한 한 최선을 다해 합리적으로 수익을 추구할 것이라고 가정합니다. 어떤 인간도 완벽하게 플레이할 수는 없지만, 대부분이 이를 위해 노력하고 있으므로, 이용할 수 있는 다른 정보가 없을 때 유용한 가정입니다.
게임 이론을 이해하는 첫 번째 단계는 익스플로잇적 사고의 틀 밖에서 생각하는 법을 배우는 것입니다. 이는 베테랑 플레이어에 어려울 수도 있는데, 오랜 시간 동안 배워왔거나 개발해온 전략에 얼마나 많은 가정이 적용되어 있는지 깨닫지 못할 수도 있기 때문입니다.
대부분의 경우 이러한 가정은 타당하며, 이에 따라 행동하면 게임 이론만 적용하는 것보다 더 나은 결과를 얻을 수 있습니다. 그러나, 그러한 것들이 가정임을 인식하여, 적용할 수 없는 경우에는 이에 의존하지 않는 것이 중요합니다.
실제 사례에서의 게임 이론
유효 스택 100BB의 캐쉬 게임에서, 여러분이 BTN에서 Jh-9d를 오픈했고 BB가 콜을 했다고 가정해 봅시다. 여러분은 Qd-6h-5s 플랍에서 c벳했고, 이어 Kh 턴에서 큰 베팅을 했습니다. 상대가 다시 콜했고 리버에는 2c가 나옵니다.
블래프 해야 할까요, 포기해야 할까요?
만약 BB가 여러분이 자주 플레이하는 상대 중 하나라면, 이 질문에 대한 쉬운 대답을 할 수 있을 것입니다. Karim은 큰 베팅에 결코 콜하지 않기 때문에, 그를 상대로는 쉬운 블러프입니다. Linda는 블러프 당하는 것을 싫어하고, 여러분의 카드가 무엇인지 보는 것을 좋아하므로, 그녀를 상대로는 블러프하려 하지 않을 것입니다.
상대를 모른다면, “폴드하려고 했다면 턴에 폴드했을 거야”, 혹은 “콜할 만큼 강했다면 턴에 레이즈했을 거야”와 같은 간단한 휴리스틱에 의존할 수도 있습니다.
이것들은 모두 익스플로잇적인 의사결정 과정입니다. 그것들은 상대방의 의도를 추측하고 그에 따라 플레이하는 것에 의존합니다. 추측이 맞다면 여러분이 이길 것입니다. 그러나 추측이 틀렸다면(Karim이 여러분의 블러프에 질렸거나 Linda가 더 이상 큰 손실을 감수하고 싶어하지 않는다면), 설령 상대 자신은 그것을 깨닫고 있지 못하더라도 여러분을 익스플로잇하게 될 것입니다.
익스플로잇 불가능한, 혹은 게임 이론적인 접근 방식은 상대가 여러분을 익스플로잇할 수 있는 쉬운 기회를 제공하지 않는 것입니다. 게임 이론은 상대가 어떤 플레이를 펼칠지 예측하기보다는, 여러분의 플레이를 예측 불가능하게 만들어 상대에게 최선의 플레이가 없도록 만드는 데 중점을 둡니다.
예측 불가능하다는 것이 무작위를 의미하는 것은 아닙니다. 여러분이 Qd-6h-5s-Kh-2c 보드에서 마지막 액션 순서인데 43을 들고 있다면, 베팅해야 합니다. 넛으로 첵 치는 것은 확실히 예측 불가능하지만, 수익성이 없습니다.
예측 불가능하다는 것이 무작위를 의미하는 것은 아닙니다.
마찬가지로 여러분에게 K8이 있다면, 첵 쳐야 합니다. 블러핑하기에는 너무 강하지만, 밸류벳 하기에는 충분히 강하지 않습니다. 여러분이 이 핸드로 예측 불가능할 필요는 없습니다: 그냥 첵 치고 쇼다운에서 여러분의 에퀴티를 챙기면 됩니다.
올바른 핸드를 올바른 빈도로 블러핑하는 것은 여러분을 예측할 수 없게 만들고 상대하기 어렵게 만듭니다.
상대는 여러분이 항상 가장 강한 핸드로 베팅하고, 항상 중간 핸드로 체크하며, 때로는 신중하게 선택한 블러프로 베팅할 것이라고 예측할 수 있지만, 이러한 정보가 그들이 확실한 최고의 플레이를 할 수 있게 해주지는 않습니다. 여러분이 베팅할 때, 그들은 여러분이 이번에 어떤 종류의 핸드를 가지고 있는지 알지 못합니다. 따라서, 그들이 여러분의 블러프를 이길 수 있지만 밸류벳에게는 지고 있는 핸드를 가지고 있을 때, 여러분을 아웃플레이할 수 있는 방법은 없습니다. 여러분의 전략은 그들에게 명백히 올바른 최고의 플레이를 제공하지 않습니다.
이 시나리오에서 BTN에 대한 GTO Wizard 솔루션은 다음과 같습니다.
몇몇 핸드는 베팅이나 체크 중 하나를 전적으로 선호하지만, Jh-9d와 같은 다른 핸드는 때때로 베팅하고 때로는 체크한다는 것을 확인할 수 있나요? 이는 상대방에 대해 어떠한 가정도 하지 않은 결과입니다. K8과 달리, J9에는 '올바른' 플레이가 존재하지 않습니다. 여러분이 할 수 있는 최선의 플레이는, 이 상황에서 여러분이 베팅할 다른 모든 핸드들과 조합했을 때, 상대에게 평범한 블러프 캐처로 좋은 옵션을 제공하지 않는 빈도로 블러프하는 것입니다.
다음은 GTO Wizard가 J9로 가끔 선택하라고 하는 84% 팟 베팅에 대한 상대의 대응입니다. K8과 같은 BB의 일부 탑 페어조차도 이 베팅에 직면했을 때 좋은 옵션이 없다는 점에 주목하세요. 콜, 폴드, 레이즈가 모두 똑같이 그다지 탐탁지 않습니다.
체스에는 '포킹(forking)'이라는 개념이 있습니다. 상대의 말 중 하나만 위협한다면, 상대는 단순히 그 말을 안전한 곳으로 옮기면 되기 때문에 어려운 결정을 내리지 않습니다. 포킹을 셋업할 때는, 여러분이 한 번에 상대의 여러 말을 위협하는 지점으로 이동하여 상대에게 매력적인 옵션이 없는 상황을 만듭니다. 하나의 말은 안전한 곳으로 옮길 수 있지만, 다른 말은 잃게 됩니다.
이 리버 베팅도 같은 종류의 일을 해냅니다. 상대가 K8을 폴드하면, 여러분의 블러프에 질 위험이 있습니다. 그들이 콜을 한다면, 그들은 여러분의 밸류벳에 보태줄 위험이 있습니다. 여러분이 상대에게 특정 행동을 취하도록 강요할 수는 없지만, 익스플로잇 불가능한 포커의 핵심 목표는 상대에게 매력적인 옵션을 갖지 못하도록 만들어 결정을 내리기 어렵게 만드는 방식으로 플레이하는 것입니다.
익스플로잇 불가능한 포커의 핵심 목표는 상대에게 매력적인 옵션을 갖지 못하도록 만들어 결정을 내리기 어렵게 만드는 방식으로 플레이하는 것입니다.
무차별(Indifference)
위의 GTO Wizard 차트에 나와 있는 혼합 전략들은 어려운 결정을 나타냅니다. 올바른 전략을 사용하면, 상대가 그러한 핸드들로 특히 수익성 있는 액션을 하는 것을 저지할 수 있습니다. 상대의 핸드가 좋다면, 여러분이 무엇을 하든 상대는 돈을 벌 수 있습니다. 하지만 여러분이 스마트하게 플레이한다면, 상대가 벌 수 있는 금액을 제한할 수 있습니다.
익스플로잇 불가능한 플레이는 옵션들의 EV가 동일한 경우에만 둘 이상의 옵션을 혼합합니다. 어떤 옵션도 다른 옵션보다 더 좋거나 나쁘지 않은 경우, 플레이어는 그 옵션들 사이에서 무차별합니다.
익스플로잇 불가능한 전략의 목표는 EV를 극대화하는 것입니다. 무차별은 그 목표를 달성하는 수단입니다. 상대가 어떤 특정한 실수를 할 것이라고 가정하지 않았을 때, 여러분이 할 수 있는 최선은 그들이 특히 좋은 플레이를 할 기회를 주지 않는 것입니다. 이 기사에서 무차별에 대한 자세한 내용을 확인해 보세요.
익스플로잇 불가능한 전략의 목표는 EV를 극대화하는 것입니다. 무차별은 그 목표를 달성하는 수단입니다.
혼합 전략(Mixed Strategy) vs 고정 전략(Fixed Strategy)
여러분이 모든 의사 결정 지점에서 상대를 모든 핸드들에 무차별하도록 만들 수는 없습니다. 때로는 최고의 플레이가 존재할수도 있고, 그럴 경우 게임 이론은 상대가 그것을 찾아낼 것이라고 가정합니다. 이러한 최고의 플레이는 차트에서 고정 전략, 즉 플레이어가 매번 취해야 하는 액션으로 나타납니다. 기억하세요: 예측 불가능이 무작위를 의미하지는 않습니다.
혼합 전략은 하나의 핸드로 때로는 한 가지 액션을 취하고, 때로는 다른 액션을 취함으로써 플레이를 "혼합"시킵니다. 여러분이 한 가지 선택을 전적으로 선호하지 않기 때문에, 이 핸드를 기만적으로 플레이하는 데는 비용이 들지 않습니다. 상대방의 전략에 대한 통찰이 없을 때는, 두 액션 모두(또는 세 개, 네 개, 다섯 개 모두) 동일한 EV를 가질 것으로 예상합니다.
빈도 실수(Frequency Mistakes)
혼합 전략은 선택이 임의적이라는 것을 의미하지 않습니다. 그보다는 올바른 플레이가 상대의 전략에 크게 좌우된다는 의미입니다.
상대가 익스플로잇 불가능한 전략을 완벽하게 구사하는 경우에만, 우리의 혼합 전략에서 모든 선택들의 EV가 동일합니다. 상대방이 조금이라도 벗어날 것으로도 예측할 수 있다면, 하나의 옵션의 EV가 더 높을 것이므로 그것을 지속적으로 선택해야 합니다.
위의 예에서, BB의 익스플로잇 불가능한 전략은 이 리버 베팅을 상대로 48.9%의 핸드를 폴드해야 합니다. 만약 그들이 49%의 핸드를 폴드한다면, J9로 블러핑하는 것이 체크하는 것보다 전적으로 더 좋은 선택이 될 것입니다. 그렇게 많이 더 좋아지는 것은 아니지만, 그럼에도 불구하고 매번 블러프하는 것을 통해 EV를 증가시킬 수 있습니다.
그렇게 함으로써, 여러분은 스스로 여러분의 익스플로잇 불가능한 GTO 전략에서 벗어나게 됩니다. 여러분은 상대의 실수에 대해 가정하면서, 익스플로잇적인 틀 안에서 플레이하게 되는 것입니다. 그 가정이 정확하다면, 여러분은 앞서 나갈 것입니다. 그것이 틀렸다면, 익스플로잇 불가능한 블러핑 빈도를 고수하는 것보다 상황이 더 나빠질 것입니다.
이것은 빈도 실수의 예입니다. J9는 블러프 하기에 나쁜 후보가 아닙니다. 여러분의 실수는 너무 자주 블러프 하는 것이었고, 이 실수는 익스플로잇 가능한 높은 빈도로 콜하는 상대에 대해서만 대가를 지불합니다. 상대가 대신에 익스플로잇 가능한 높은 빈도로 폴드한다면, 이 "실수"로 인해 더 많은 돈을 벌 수 있습니다.
이는 상대가 여러분의 전략을 알고 있거나 올바르게 추측한다면, K8처럼 마지널한 핸드로도 어려운 결정을 내리지 않게 된다는 점에서 실수입니다. 여러분이 너무 자주 블러프하고 있다는 것을 알고 있다면, 그들은 자신있게 콜할 수 있습니다.
이 실수는 단순히 습관적으로 너무 자주 콜하는 플레이어를 상대할 때도 돈을 잃습니다. 이 플레이어들은 여러분이 실수를 하고 있다는 사실조차 알지 못한 채, 여러분의 오버블러핑 실수로부터 이익을 얻습니다. 가위바위보 게임에서 항상 바위를 낸다면, 여러분은 여러분의 전략을 알고 있는 모든 플레이어에게 질 것이지만, 여러분이 바위를 내기 좋아하는 것처럼 단순히 보를 내기 좋아하는 플레이어에게도 지게 될 것입니다.
순수 실수(Pure Mistake)
순수 실수는 베팅하기에 적합하지 않은 핸드로 베팅하는 것(또는 체크하기에 적합하지 않은 핸드로 체크)을 말합니다. Qd-6h-5s-Kc-2c의 예시에서, K8은 블러핑하기에는 너무 강하지만 밸류벳 하기에는 충분히 강하지 않았습니다. 그것으로 베팅하면 상대방이 어려운 결정을 내리도록 만들 수 없습니다. 그들은 단순히 가장 나쁜 핸드들로 폴드하고 더 좋은 핸드들로 콜할 것입니다.
KK로 체크하는 것도 상대에게 어려운 결정을 내리도록 만들지 것입니다. 이는 폴드하고 블러프에 질지 콜하고 KK과 같이 강한 핸드에게 더 많은 돈을 잃을지에 대한 어려운 선택에 직면하게 될 상대의 많은 핸드들에게 값싼 쇼다운을 제공할 것입니다.
빈도 실수와 달리, 순수 실수는 상대방의 전략에 특별히 민감하지 않습니다. 이러한 실수들은 스스로 익스플로잇 가능한 행위를 하지 않는 상대에게도 돈을 잃습니다. KK로 체크하면, 상대방이 콜했을 베팅 금액을 놓치게 됩니다. K8로 베팅하면, 공짜로 쇼다운에 갈 수 있었음에도 더 나은 핸드에게 불필요한 돈을 잃게 됩니다.
순수 실수조차도 게임 이론의 틀 내에서만 실수입니다. 이러한 "실수"는 이론적으로 상대방이 올바른 종류의 실수를 저지른 경우, 익스플로잇 전략으로써 수익적일 수 있습니다. 예를 들어, 너무 많은 나쁜 핸드들로 리버 베팅에 콜하는 엄청난 콜링 스테이션을 상대할 때는, 설령 GTO Wizard가 순수 체크라고 표시한 K8로도 베팅하는 것이 수익적일 것입니다.
게임 이론은 여러분이 이 핸드로 체크할 것을 요구하지 않습니다. 그보다는, 여러분에게 익스플로잇적으로 플레이할 다른 이유가 없는 한 체크가 기본 플레이가 되어야 한다고 알려주는 것입니다.
혼합 전략은 여러분에게 선택권이 있다는 의미입니다; 기본 플레이가 존재하지 않습니다. 상대의 전략에 대한 특정한 통찰이 없다면, 모든 혼합 옵션들은 똑같이 좋습니다. 상대가 한 방향 혹은 다른 방향으로 벗어날 수 있다는 예감만으로도 한 가지 옵션을 다른 옵션보다 더 선호할 수 있습니다. 순수 전략에서 벗어나는 것은 상대의 더 큰 실수를 요구합니다.
혼합 전략은 여러분에게 선택권이 있다는 의미입니다; 기본 플레이가 존재하지 않습니다. 상대의 전략에 대한 특정한 통찰이 없다면 모든 혼합 옵션들은 똑같이 좋습니다.
결론
게임 이론은 도구입니다. 다른 도구와 마찬가지로 올바른 상황에서 올바른 방식으로 사용될 때 가치있습니다. 도구를 사용하려면, 도구의 작동 방식을 이해해야 합니다.
포커의 기초가 되는 게임 이론을 이해하지 못한다면, 게임을 전혀 이해하지 못한 것입니다. 기껏해야 시행착오를 통해 특정 유형의 상대에게만 통하는 전략을 개발할 뿐입니다. 흔히 접하는 상황에서는 편안함을 느낄 수도 있지만, 익숙하지 않은 상황에서는 어려움을 겪게 될 것입니다.
게임 이론을 사용한다고 해서, 이 기사에 나와 있는 것과 같은 차트에서 볼 수 있는 전략을 완벽하게 구현할 필요는 없습니다. 무차별의 개념을 이해하고, 단순히 상대가 어떻게 결정을 내릴지 추측하기보다는 상대에게 어려운 결정을 내리도록 만드는 관점에서 생각하는 방법을 배우는 것이, 익숙하지 않은 상황에서 더 잘 이해하고 좋은 퍼포먼스를 보이는 데 큰 도움이 될 것입니다.
Andrew Brokos에 대하여….
Andrew Brokos는 15년 넘게 프로 포커 플레이어, 코치 및 작가로 활동해 왔습니다. 그는 Thinking Poker Podcast의 공동 진행자이며, Play Optimal Poker 등 훌륭한 서적들의 저자이기도 합니다.
- 이전글[홀덤기초전략] 텍사스 홀덤 초보를 위한 기본이자 최고의 전략 23.12.06
- 다음글[홀덤기초] 캐쉬게임, 토너먼트 23.12.05
댓글목록
등록된 댓글이 없습니다.