시리즈:수포자도 쉽게 알 수 있는 수학/확률과 통계

Sokcuri (토론 | 기여)님의 2015년 6월 8일 (월) 20:24 판

문서의 내용이 너무 쉬워서 머리속에 쏙쏙 들어옵니다.

이 문서에는 독자적으로 연구한 내용이 들어갑니다. 다른 사람의 의견을 존중하면서 무례하지 않도록 작성해 주시고, 의견 충돌 시 토론 문서에서 토론해 주세요.

수포자도 쉽게 알 수 있는 수학

경우의 수

용어 정리

합의 법칙

곱의 법칙

순열

중복 순열
원순열
염주순열

조합

중복 조합
이항정리

확률

  • 확률에서 가장 큰 오해는, 확률 자체가 우리가 관측한 값으로 계산을 하는 것이지, 우리가 관측한 값을 토대로 예측을 하는 것이 아니다. 이 오해를 풀지 못하면 아래 통계에서도 엄청나게 고생을 한다. 이거 하나만 이해해도 확률에서 배울 내용의 50%는 배운거라고 할 수 있다.
    • 가장 대표적인 예로, 주사위에서 숫자 1이 나올 확률은 6분의 1이다. 하지만 주사위 10번을 던졌는데 그중 1이 한번도 안나왔다고 해서 다음번에 숫자 1이 나올 확률이 급상승 하는 것은 절대 아니다!! 사기도박을 의심해야한다. 오함마 가져와야지
    • 그러면 왜 1이 안나왔는지에 대한 분석을 해야하는데, 그걸 분석하는 것이 바로 통계다이게 정확한 통계의 정의는 아니다. 물론 확률과 통계가 수학에 기초를 둔 만큼, 이 증명과정을 역으로 써서 예측을 할 수는 있으나, 그게 꼭 맞는다는 보장을 하려면 실제 결과가 나오고 그 관측값을 토대로 증명을 해야하기 때문에 절대 쉬운일이 아니다.그게 가능하면 모두다 로또 1등이고 주식 대박이다

용어 설명

수학적 확률과 통계적 확률

여러 가지 사건

확률의 기본 성질

확률의 덧셈정리

여사건의 확률

조건부 확률

확률의 곱셈정리

독립사건과 종속사건

독립시행

통계

  • 대학생 과정의 통계에서 가장 중요한 건 내가 어떤 학문의 통계를 하느냐이다. 통계식을 최종적으로 정리하는 과정에서 사용되는 상수들은 각 학문의 영역마다 다른데, 당장 생물학만 하더라도 생물 개체를 실험하는 경우는 생물실험통계를, 생화학적인 부분을 입증할 때에는 화학실험통계를, 생태계를 조사할 때에는 사회통계를 끌어다쓴다.그래서 생물학 관련과들은 수학공부는 좀 덜해도 통계공부하기 지옥이다.
  • 바꿔 말하자면, 고등학생과정에서 배우는 통계는 좀 잡소리가 많지만 이런 통계의 공통분모만을 간단하게 배우는 것이다. 실제 계산을 하는 것보다는 외우는게 많으며, PK/SKY급 학교가 아닌이상 대부분 통계 첫 시간에 이런 내용을 다시 가르치는 것이 일반적이기 때문에, 고등학교 통계를 모른다고 해서 학사 스케줄이 꼬일정도의 문제가 되진 않는다.물론 그걸 하루 수업으로 압축했다는 사실은 꼭 기억해야한다. 일주일안에 따라잡아야한다.
  • 이공계열 대학생 과정에서의 통계만 이야기를 하자면, 실제의 통계 계산은 대부분 프로그램에 맏긴다. 하지만 처음에는 대부분 통계 용어의 정의를 하는데, 이 정의는 따로 답이 없다. 그냥 이런게 있다고 외우는 수밖에 없다. 사실 이걸 증명하는 것까지 하면 좋지만, 대부분의 통계프로그램은 그 통계증명이 된 상황이다. 우리가 그걸 실제로 할 필요는 없다. 하지만 그 용어의 정의를 인식하지 못하면 통계프로그램을 쓸 수조차 없다.
  • 고등학교 다닌지 오래돼서 정확한지는 모르겠지만고등학교 통계에서 결국 가르치는 건 이런 통계학에서 써먹는 기초적인 정의를 가르치는 것이다. 실제로 계산은 큰 의미가 없으니 일단 단어의 정의정도는 꼭 외워두자. 여유가 되면 그 평균이나 표준편차의 계산정도는 외워두는 것이 매우 큰 도움이 된다.
  • 가장 중요한 내용. 통계는 주관적인 학문이다. 보통 수학의 범주안에 넣지만, 실제로는 어떤 공식을 적용하여도 결과가 나오고, 그게 맞는지 틀리는지는 또 통계로 증명을 해야하는데 그게 또 완성되기 매우 쉽다. 공식을 잘못 넣으면 계산 자체가 안되고, 증명도 완성 안되는 다른 수학과는 다르게 통계는 뭘 넣어도 결과가 나오고 증명이 되기 때문에 어떤식으로 접근하여 분석의 신뢰도를 적당하게 올리느냐(이건 통계에서 일반적으로 쓰이는 신뢰범위와는 다르다)가 가장 중요하다. 실제로 가장 많이 일어나는 것이, 임의로 분석의 신뢰도를 내려서 논문을 쓰는 경우가 많고, 이 경우 아무리 좋은 실험을 했다 한들 믿을수 없는 실험이 된다. 이상적인 통계환경에서는 이 분석의 신뢰도가 정해져 있지만, 현실은 그렇지 않기 때문에 어느정도까지 신뢰도를 잡을것이냐가 통계의 핵심이 된다. 이걸 이해한다면 통계가 들어가는 논문을 쓸 자격이 있다는 말이 된다.(...)

이 항목을 쓴 사람은 이과에서 수능 7등급받고 생물학 전공으로 튀다가 통계로 엿먹어본 사람이다.

용어 정리

이산확률분포

이항분포

연속확률분포

정규분포
통계적 추정

각주