통계

    [통계] 모집단과 표본 분포

    [통계] 모집단과 표본 분포

    🎯 모집단과 표본 1. 표본추출(Sampling) - 모집단으로 부터 표본을 추출 하는 것, 표본으로부터 그 특성을 찾아내고 모집단의 특성을 추론 1) 복원추출(Sampling with replacement) - 모집단에서 데이터를 추출 할 때 하나를 추출하고 다시 넣고 추출하는 방법으로 동일한 표본이 추출 될 수 있음 2) 비복원추출(Sampling without replacement) - 모집단에서 데이터를 추출 할 때 하나를 추출하고 다시 넣지 않고 추출하는 방법 3) Random Sampling - 모집단에서 데이터를 추출할 때 주의할 점은 편향되지 않아야 함, 각 개체가 모두 동일한 확률로 추출하는 방법 2. 불균형 데이터의 문제(Imbalanced Data) - 데이터가 불균형 데이터 일 경우..

    [통계] 확률분포 - 연속형 확률 분포

    [통계] 확률분포 - 연속형 확률 분포

    🎯 연속형 확률 분포 - 균일분포, 정규분포, 감마분포, 지수분포, 카이제곱분포, 베타분포 1​. 확률 밀도 함수(Probability density fuction:pdf) - 연속형 확률 변수 X에 대해서 함수 q 가 아래의 조건을 만족 (1) 모든 X에 대하여 $f(x)\geq 0$ (2) $P(x\in(-\infty,\infty))=\int_{-\infty}^{\infty}f(x)d(x)=1$ (3) $P(a \leq X\leq b)=\int_{a}^{b}f(x) dx$ 1) 확률 밀도 함수의 성질 (1) $P(X=a)=P(a \leq X \leq b)=\int_{a}^{b}f(x)dx=0$ (2) $P(a \leq X\leq b)P(a \leq X < b)=P(a < X \leq b)=P(a

    [통계] 확률분포 - 이산형 확률분포

    [통계] 확률분포 - 이산형 확률분포

    🎯 이산형 확률 분포(probability distribution) - 확률 변수 X가 취할 수 있는 모든 값과 그 값을 나타날 확률을 표현한 함수 - 베르누이 분포, 이항분포, 포아송분포, 기하분포, 음이항분포, 초기하분포 1. 이산형 균등 분포(discrete uniform distribution) - 확률 변수 X가 유한개이고, 모든 확률 변수에 대하여 균일한 확률을 갖는 분포 ex) 주사위를 던졌을 때 나오는 숫자 $ f_{x}(x) = P(X=x) = \frac{1}{N} $ $where$ $x = 1,2,\cdot\cdot\cdot,N$ 이산형 균등분포의 기대값 : $\frac{n+1}{2}$ 분산 : $\frac{n^{2}-1}{12}$ 기대값 : $E[X] = \sum xf(x) = \f..

    [통계] 확률 변수

    [통계] 확률 변수

    🔍 확률 변수(random variable) - 표본공간에서 각 사건에 실수를 대응시키는 함수를 확률 변수 - 확률 변수의 값은 하나의 사건에 대하여 하나의 값을 가지며, 실험의 결과에 의하여 변함 - 일반적으로 확률 변수는 대문자로 표현하며, 확률변수의 특정값을 소문자로 표현 - 확률변수는 X, Y등 대문자로 표현하며, 확률 변수의 특정값은 x, y등 소문자로 표현 1) 이산 확률 변수(discrete random variable) : 셀 수 있는 값들로 구성되거나 일정 범위로 나타나는 경우 2) 연속 확률 변수(continuous random variable) : 연속형 또는 무한대와 같이 셀 수 없는 경우 1. 확률 변수의 평균(기대값) 2. 확률 변수의 분산 3. 기대값의 성질(a,b가 상수, X..

    [통계] 확률

    [통계] 확률

    🔍 확률 - 모든 경우의 수에 대한 특정 사건이 발생하는 비율 1. 표본 공간(Sample Space) - 표본 공간이란 어떤 실험에서 나올 수 있는 모든 가능한 결과들의 집합 - 동전 던지기의 경우 S = {앞면, 뒷면} , 주사위던지기 S = {1,2,3,4,5,6} - P(A) = A/S P(A) : 사건 A가 일어날 확률 / (S) : 표본 공간 2. 통계적 확률 정의 1) 상대도수 - 어떤 시행을 N번 반복했을 때, 사건 A에 해당하는 결과가 r번 일어난 경우 r/N 2) 통계적 확률(경험적 확률) - N이 무한히 커지면 상대도수는 일정한수로 수렴 $\lim\frac{r}{N} $ 3. 확률의 성질 1) 합사건(union) : 사건 A 또는 사건 B가 일어날 확률 2) 곱사건(intersecti..

    [통계] 데이터의 이해

    [통계] 데이터의 이해

    🔍 통계학이란? 산술적 방법을 기초로 하여, 주로 다량의 데이터를 관찰하고 정리 및 분석하는 방법을 연구하는 수학의 한 분야 1) 기술 통계학(descriptive statistics) - 데이터를 수집하고 수집된 데이터를 쉽게 이해하고 설명할 수 있도록 정리 요약 설명 2) 추론 통계학(inferential statistics) - 모집단으로 부터 추출한 표본 데이터를 분석하여 모집단의 여러가지 특성을 추측하는 방법론 📈 데이터와 그래프 1. 변수(Variable) - 조사 목적에 따라 관측된 자료의 값 - 해당 변수에 대하여 관측된 값들이 바로 자료(Data)가 됨 1) 질적 변수 - 관측된 데이터가 성별, 주소지(시군구), 업종 등과 같이 몇 개의 범주로 구분하여 표현할 수 있는 데이터를 의미 - ..