🎯 이산형 확률 분포(probability distribution)
- 확률 변수 X가 취할 수 있는 모든 값과 그 값을 나타날 확률을 표현한 함수
- 베르누이 분포, 이항분포, 포아송분포, 기하분포, 음이항분포, 초기하분포
1. 이산형 균등 분포(discrete uniform distribution)
- 확률 변수 X가 유한개이고, 모든 확률 변수에 대하여 균일한 확률을 갖는 분포
ex) 주사위를 던졌을 때 나오는 숫자
$ f_{x}(x) = P(X=x) = \frac{1}{N} $ $where$ $x = 1,2,\cdot\cdot\cdot,N$
이산형 균등분포의 기대값 : $\frac{n+1}{2}$ 분산 : $\frac{n^{2}-1}{12}$
기대값 : $E[X] = \sum xf(x) = \frac{1}{n}\sum x = \frac{1}{n}*\frac{n(n+1)}{2}$
분산 : $Var[X] = E(X^2) - (E[X])^2 = \frac {(N+1)(2N+1)}{6} - (\frac{N+1}{2})^2 = \frac{(N+1)(N-1)}{12}$
$ E(X^2) = \sum x^2f(x) = \frac1{n}\sum x^2 = \frac{(N+1)(2N+1)}{6} $
2. 베르누이 분포(Bernoulli trial)
- 각 시행의 결과가 성공, 실패 두 가지 결과만 존재하는 시행
- 성공이 ‘1’, 실패가 ‘0’의 값을 가질 때, 확률 변수 X의 분포
ex) 파란 공 7개, 빨간 공 3개 들어 있는 주머니에서 하나 뽑을 때, 파란 공 뽑을 확률
$X = \begin{cases}1 성공\\0 실패\end{cases},$ X ~ Bernouli(p)
$f_{x}(x) = p^x(1-p)^{1-p}, x=0,1$
베르누이 평균 : P, 분산 : p(1-p)
기대값 :$E[X] = 1\cdot p+0\cdot(1-p)=p $
분산 : $ Var[X] = E(X-p)^2 = (0-p)^2\cdot(1-p)+(1-p)^2\cdotp=p(1-p)$
3. 이항 분포(Binomial distribution)
- 연속적인 베르누이 시행을 거처 나타나는 확률 분포
- 서로 독립인 베르누이 시행을 n번 반복해서 실행 했을 때, 성공한 횟수 X의 확률 분포
ex) 패널티 킥 80% 성공률의 선수가 10번 찰 때 성공 횟수와 확률
$f_{x}(x) = P(X=x) = \left(\begin{array}{c}n\\ x\end{array}\right)p^p(1-p)^{n-x}=\frac{n!}{x!(n-x)!},x=0,1,\cdot\cdot\cdot,n$
이항분포의 기대값 : np, 분산 : np(1-p)
기대값 : $E[X] = \sum_{r=0}^nr\cdot\ _{n}\mathrm{C}_{r}p^rq^{n-r},(q=1-p)$
$ = np(p+q)^n-1 = np$
$E[X^2] = \sum_{r=0}^nr^2\cdot_{n}\mathrm{C}_{r}p^rq^{n-r},(q=1-p)$
$= n(n-1)p^2 + np $
분산 : $ Var[X] = E(X^2) - E[X])^2$
$= n(n-1)p^2 + np - (np)^2 = n^2p^2-np^2+np-n^2p^2$
$=np(1-p)$
4. 포아송 분포(Poisson distribution)
- 어느 희귀한 사건이 어떤 일정한 시간대에 특정한 사건이 발생할 확률 분포
ex) 야구장에서 파울볼을 잡을 횟수, 1년간 지구에 1미터 이상의 운석이 떨어지는 수 등
1) 포아송 분포의 조건
a) 어떤 단위 구간(ex)1일)동안 이를 더 짧은 작은 단위의 구간(ex)1시간)로 나눌 수 있고
이러한 더 짧은 단위 구간 중 어떤사건이 발생할 확률은 전체 척도 중에서 항상 일정
b) 두개 이상의 사건이 동시에 발생할 확률은 0에 가까움
c) 어떤 단위구간의 사건의 발생은 다른 단위구간의 발생으로부터 독립적임
d) 특정 구간에서의 사건 발생확률은 그 구간의 크기에 비례함
e) 포아송 분포 확률 변수의 기댓값과 분산은 모두 λ임
$f_{x}(x)=p(X=x)=\frac{e^{-\lambda}\lambda^x}{x!},x=0,1,2,\cdot\cdot\cdot$
$ X$~$ poisson(\lambda) $
2) 이항분포의 포아송 근사
확률 변수 X가 X ~ B(n,p)이고, n이 충분히 크고, p가 아주 작을 때, X의 분포는 평균이 $\lambda = np $ 인 포아송 분포로 근사시킬 수있다. 보통 n이 클때, np<5를 만족하게 p가 작으면 근사 정도가 좋다고 함 X ~ Poisson(np)
5. 기하분포(Geometric distribution)
- 어떤 실험에서 처음 성공이 발생하기 까지 시도한 횟수 X의 분포, 이때 각 시도는 베르누이 시행을 따름
ex) 필드골 성공확률 30%의 선수가 5번째 슛팅에서 골 넣을 확률
$f_{x}(x) = P(X=x) = (1-p)^{x-1}p, x = 1,2,\cdot\cdot\cdot$
$X$~$Geometric(p)$
기하 분포의 기대값 : $\frac{1}{p}$, 분산 : $ \frac{1-p}{p^2}$
6. 음이항 분포(Negative binominal distribution)
- 어떤 실험에서 성공 확률이 p일 때, r번의 실패가 나올 때까지 발생한 성공 횟수 X의 확률 분포
ex) 자유투 성공 90% 확률의 농구선수가 3 번째 실패가 나올 때까지 성공 시킨 자유투가 10개일 확률
$f_{x}(x)=p(X=x)=\left(\begin{array}{c}x+r-1\\ x\end{array}\right)p^x(1-p)^r, x=1,2,\cdot\cdot\cdot$
$X$~$NB(r,p)$
기하 분포의 기대값 : $r\frac{1-p}{p}$, 분산 : $r \frac{1-p}{p^2}$
'통계 & 수학 > 통계학' 카테고리의 다른 글
[통계] 모집단과 표본 분포 (0) | 2022.05.18 |
---|---|
[통계] 확률분포 - 연속형 확률 분포 (0) | 2022.05.17 |
[통계] 확률 변수 (0) | 2022.05.17 |
[통계] 확률 (0) | 2022.05.17 |
[통계] 데이터의 이해 (0) | 2022.05.17 |