도박사의 파산

Hwangjy9 (토론 | 기여)님의 2015년 7월 5일 (일) 21:38 판 (새 문서: {{학술}} == 개요 == '''도박사의 파산(Gambler's ruin)'''은 유한한 자금을 가진 도박사가 도박을 계속할 경우 파산할 수밖에 없음을 보여주...)
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)

틀:학술

개요

도박사의 파산(Gambler's ruin)은 유한한 자금을 가진 도박사가 도박을 계속할 경우 파산할 수밖에 없음을 보여주는 문제다. 아래 문제와 풀이를 잘 보고 도박의 늪에 빠지지 않도록 하자.

문제

사람 [math]\displaystyle{ A,B }[/math]가 각각 자금 [math]\displaystyle{ i, N-i }[/math]를 가지고 있고, 앞면이 나올 확률이 p인 동전을 던져서 앞면이 나오면 AB에게 자금 1을 받고, 반대로 뒷면이 나오면 BA에게 자금 1을 받는다. 동전 던지기를 반복했을 때 A가 자금 N을 독차지할 확률은 얼마일까?

풀이

A가 자금 N을 독차지하는 사건을 E로 두고, 자금 i를 가지고 있을 때 자금 N을 독차지할 확률을 [math]\displaystyle{ P_i }[/math]라 하자. 그러면

[math]\displaystyle{ P_i=P(E) }[/math]

이고, 첫 번째 게임에서 앞면이 나오는 사건을 F라 하면 전확률의 법칙(law of total probability)에 의해

[math]\displaystyle{ P(E)=P(E|F)P(F)+P(E|F^c)P(F^c) }[/math]

이다. 만약 F가 발생하면 A는 자금 [math]\displaystyle{ i+1 }[/math]을 가지고, 반대로 [math]\displaystyle{ F^c }[/math]가 발생하면 A는 자금 [math]\displaystyle{ i-1 }[/math]을 가진다. 따라서

[math]\displaystyle{ P(E|F)=P_{i+1} }[/math]
[math]\displaystyle{ P(E|F^c)=P_{i-1} }[/math]

이다. 따라서

[math]\displaystyle{ P_i=pP_{i+1}+(1-p)P_{i-1} }[/math]

이다. 그러면

[math]\displaystyle{ pP_i+(1-p)P_i=pP_{i+1}+(1-p)P_{i-1} }[/math]

이므로

[math]\displaystyle{ P_{i+1}-P_i=\frac{1-p}{p}(P_i-P_{i-1}) }[/math]

이다. 그러면

[math]\displaystyle{ \begin{align} P_2-P_1&=\frac{1-p}{p}(P_1-P_0)\\ P_3-P_2&=\left(\frac{1-p}{p}\right)^2(P_1-P_0)\\ &\vdots\\ P_i-P_{i-1}&=\left(\frac{1-p}{p}\right)^{i-1}(P_1-P_0) \end{align} }[/math]

이고 [math]\displaystyle{ P_0=0 }[/math]이므로 양변을 더하면

[math]\displaystyle{ P_i=\left(1+\frac{1-p}{p}+\left(\frac{1-p}{p}\right)^2+\cdots+\left(\frac{1-p}{p}\right)^{i-1}\right)P_1 }[/math]

이므로 등비수열의 합의 공식에 의해

[math]\displaystyle{ P_i=\begin{cases} \frac{1-\left(\frac{1-p}{p}\right)^i}{1-\frac{1-p}{p}}P_1,&p\ne\frac{1}{2}\\ iP_1,&p=\frac{1}{2} \end{cases} }[/math]

이다. 한편 [math]\displaystyle{ P_N=1 }[/math]이므로

[math]\displaystyle{ P_N=\begin{cases} \frac{1-\left(\frac{1-p}{p}\right)^N}{1-\frac{1-p}{p}}P_1,&p\ne\frac{1}{2}\\ NP_1,&p=\frac{1}{2} \end{cases} }[/math]

에서

[math]\displaystyle{ P_1=\begin{cases} \frac{1-\frac{1-p}{p}}{1-\left(\frac{1-p}{p}\right)^N},&p\ne\frac{1}{2}\\ \frac{1}{N},&p=\frac{1}{2} \end{cases} }[/math]

을 얻는다. 따라서

[math]\displaystyle{ P_i=\begin{cases} \frac{1-\left(\frac{1-p}{p}\right)^i}{1-\left(\frac{1-p}{p}\right)^N},&p\ne\frac{1}{2}\\ \frac{i}{N},&p=\frac{1}{2} \end{cases} }[/math]

을 얻는다.

전략 세우기