위키독:무한 원숭이 정리

Caeruleum (토론 | 기여)님의 2024년 3월 16일 (토) 14:23 판 (일상과학 WiKi - wikidok>dailysciences | 무한 원숭이 정리(http://ko.experiments.wikidok.net/무한 원숭이 정리))
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)

파일:/api/File/Real/58f554af30e465e921275f4d

무한 원숭이 정리.

The Infinite Monkey Theorem

개요[원본 편집]

무한이라는 극악한 개념과 확률/통계가 만나는 지점에서 탄생한 골때리는 사고 실험.

이 실험에는 많은 버전이 있지만 흔히 이렇게 요약된다.

틀:안내바

컴퓨터가 아니라 타자기인 이유는 이것을 처음 생각한 때가 20세기 초였기 때문이다. 이때는 컴퓨터의 키보드가 존재하지 않았던 시절이다.

이 재미난 생각은 많은 패러디를 낳았다. 예를 들어 밑의 만화에도 무한 원숭이 정리가 제대로 나온다.

만화의 출처는 루리웹 창작만화 게시판

파일:/api/File/Real/58f5584430e465e921275f56

역사[원본 편집]

파일:/api/File/Real/58f5691a30e465e921275f8a

펠릭스 에두아르 쥐스탱 에밀 보렐

Félix Édouard Justin Émile Borel

1871.1.7 ~ 1956.2.3.

만화의 첫 문장에도 나왔다시피 이러한 생각을 처음한 사람은 프랑스의 수학자 에밀 보렐(Émile Borel). 이 사람의 아이디어는 1913년 논문인 〈Mécanique Statistique et Irréversibilité〉에 실렸다.




보렐은 조합론(combinatorics)이라는 현대의 수학이론을 개발한 사람이다. 보렐은 100만 마리의 원숭이가 각자 초당 10글자씩 무작위로 타이핑하는 모습을 상상했다. 그는 이 원숭이들이 전 세계의 대규모 도서관에 소장된 모든 책을 타이핑해낼 가능성이 있다고 말했다. 그러고는 원숭이들이 그 일을 해낼 확률은 무한소에 가까운 작은 값이라며 무시했다.




실제로 이런 일을 시도한다면 원숭이들은 말도 안 되는 헛소리들을 타이핑할 것이다. 구글에서 '타이핑하는 원숭이(monkeys typing)'을 검색해보면 당신의 컴퓨터를 끌어들여 타이핑하는 원숭이를 시뮬레이션하는 웹사이트를 찾을 수 있다. 이 사이트에는 원숭이가 셰익스피어의 다양한 희곡의 시작 비트를 타이핑하는 데 몇 년이나 걸릴지에 대한 예측이 나열되어 있는데, 현재까지의 최고 기록은 원숭이가 4,830억 년에 걸쳐 셰익스피어의 희곡 『사랑의 헛수고(Love's Labour's Lost)』의 첫 17글자를 타이핑한 것이다. 원숭이가 타자기로 타이핑하면 아무 의미 없는 무작위적인 글자들만 나열되는 게 당연한 결과다.


이게 어떤 의미인지 알려면 우주의 현재 나이가 대략 137억년이라는 것을 생각해보자.

물론 그의 논문에서 ‘원숭이’란 실제의 원숭이를 뜻하는 것은 아니다. 대신, 아주 긴 임의의 문자로 이루어진 문자열을 만들어 내는 방식을 좀 더 상상하기 쉽도록 만들어 주는 도구로써 원숭이를 상상한 것이지만 아무래도 타이핑하는 원숭이라는 생각은 꽤나 우스꽝스럽기 때문에 널리 퍼질 수 있었던 것이다.

보렐의 100만 마리 원숭이는 1970년을 지나면서 무한한 원숭이로 바뀌었고 셰익스피어 또한 추가되어 햄릿을 쓰는 무한한 원숭이의 개념이 자리잡았다.

2003년에는 술라웨시 마카크 종의 원숭이에게 실제로 타자기를 주며 타이핑을 시켰는데 결과는 알파벳 S가 대부분을 차지하는 5장의 종이였다고 한다.(...)

계산[원본 편집]

파일:/api/File/Real/58f55c1330e465e921275f5f

수학자들은 또한 이 확률을 계산해냈다. 이 확률의 계산법은 수학자가 아니더라도 쉽게 할만큼 의외로 간단하다.

이 계산에서 타자기의 키는 50개 있다고 가정한다. 그리고 예를 들어 monkey라는 단어를 쳐야된다고 가정하자. 이렇게 되면 원숭이는 50개의 타자기의 키 중에 최초로 m이라는 특정한 키를 쳐야만한다. 이럴 확률은 50개 중 1개이므로 당연히 [[File:http://latex.codecogs.com/gif.latex?\frac%7B1%7D%7B50%7D%7C\frac{1}{50}]]이 된다. 그리고 두번째에는 o를 쳐야되는데 이 역시 [[File:http://latex.codecogs.com/gif.latex?\frac%7B1%7D%7B50%7D%7C\frac{1}{50}]].

이때 확률/통계에서 쓰는 말로 두 사건은 독립적이라고 한다. 첫번째 사건(m키를 누르는 일)과 두번째 사건(o키를 누르는 일)은 서로 영향을 주지 않기 때문이다. 그리고 독립적인 사건이 한꺼번에 일어날 확률은 둘을 곱해주는 것이다. 이런식으로 하다보면 원숭이가 monkey라는 단어를 한 번도 틀리지 않고 칠 확률은 [[File:http://latex.codecogs.com/gif.latex?\frac%7B1%7D%7B50%7D%7C\frac{1}{50}]]을 6번 곱한 [[File:http://latex.codecogs.com/gif.latex?\frac%7B1%7D%7B50%5E%7B6%7D%7D%7C\frac{1}{50^{6}}]]이 된다.

506이 잘 와 닿지 않는다면 [[File:http://latex.codecogs.com/gif.latex?\frac%7B1%7D%7B15,625,000,000%7D%7C\frac{1}{15,625,000,000}]]이라고 적어보자. 읽어본다면 156억2500만 분의 1이라는 확률이다. 단 6개의 글자로 이루어진 단어를 치는데 이런 확률이 나온다. (그런데 재밌게도 원숭이가 156억 2500만 마리가 있다면 확률적으로 monkey를 제대로 치는 원숭이가 적어도 한 마리는 있다는 계산이기도 하다. 무한의 위엄에 비하면 100억 단위 정도는 껌값 축에도 못 낀다.)

일단 6개의 단어를 맞게 칠 확률은 구했다. 이제 여기서 조금 더 나아가서 monkey를 입력하지 못할 확률도 구해야 한다. 그 확률은 당연히 [[File:http://latex.codecogs.com/gif.latex?1-\frac%7B1%7D%7B50%5E%7B6%7D%7D%7C1-\frac{1}{50^{6}}]]. 모든 확률은 그 합이 1이 되어야만 하기 때문이다. 이를 일반화하여 공식으로 나타내면

[[File:http://latex.codecogs.com/gif.latex?X_%7Bn%7D=(1-\frac%7B1%7D%7B50%5E%7Bm%7D%7D)%5E%7Bn%7D%7CX_{n}=(1-\frac{1}{50^{m}})^{n}]]

이 된다.

여기서

m은 원하는 소설의 글자수.(햄릿으로 따지면 대략 20만자 정도된다.506이 100억 단위인데 50200,000은 생각만해도 아찔한 숫자가 된다.)

n은 원숭이의 수

Xn은 원숭이가 목표하는 단어를 입력하지 못할 확률

이 된다.

대부분의 경우 m을 6으로 놓고 6번 타자기를 쳤을 때 맞는 6글자를 치지 못할 확률을 계산을 하지만 그것은 6글자를 쳐야할 경우이고 소설 하나를 치려면 m이 6보다 커야한다. 6글자를 치나 소설 하나를 치나 어쨌든 n이 커질수록 Xn은 작아진다. 흔히 하는 증명의 경우처럼 m을 6으로 두면 n이 100만일때는 Xn이 99.99%가 되고 n이 백억이라면 53%, 천억일때는 0.17%로 점점 줄어들게 된다. 즉 원숭이가 많으면 많을수록Xn값(=원숭이가 목표하는 단어를 입력하지 못할 확률)은 0에 가까워지는 결과가 나온다.

이 말은 바꿔말하면 무한한 원숭이와 무한한 시간이 있다면 햄릿은 물론 아예 창작까지도 가능하다는 무서운(?) 결과로 우리를 이끈다는 것이다. 물론 무한한 원숭이가 현실에 존재할 수 없으니 이는 수학적으로는 가능하다 정도로만 알고 있으면 되겠다.