📌 적합도 검정
1. 범주형 자료(categorical data)
- 관측된 결과를 어떤 속성에 따라 몇 개의 범주로 분류시켜 도수로 주어진 데이터
1) 범주형 자료 분석(categorical data analysis)
- 범주형자료에대한통계적추론방법
- 범주형 자료 분석은 카이제곱 검정으로 추론함
ex) 대선에서 각 정당의 연령대별 지지율이 지난 대선의 지지율과 동일한가?
ex) 성별에 따라서 선호하는 핸드폰 회사가 동일한가?
2) t-test와 카이제곱 검정의 차이
(1) t-test : 연속형 변수의 차이에 대한 검정
(2) 카이제곱 검정 : 명목형 변수에 대한 검정
2. 적합도 검정(goodness of fit test)
- 관측된값들이추론하는분포를따르고있는지검정,한개의요인을대상으로검정
ex) 멘델의 유전 법칙에 부합하는지 검사하기 위해 테스트할 때, 완두콩의 잡종 비율이 A:B:C = 1:1:2 였다고 가정해 보자. 100개의 콩을 조사한 결과 A가 25 B가 20 C가 55개 였다면 앞선 가정이 맞는지 유의수준 0.05에서 검정해보자
$\chi^2 = \sum \frac{(O_i-E_t)^2}{E_i} $, 자유도 = 범주의 개수 - 1
- 관찰 빈도($O$ : observed frequency) : 데이터로부터 수집된 값
- 기대 빈도($E$ : expected frequency) : 기대값과 비슷한 개념
ex) 기대빈도는 예를 들어 남녀 1000명의 데이터에서 각 성별의 기대 빈도는 500명임
ex) 주사위 120번을 던졌을 때 각 눈이 나오는 기대빈도는 20번임
3. 독립성 검정(test of independence)
- 관측된 값을 두 개의 요인으로 분할하고 각 요인이 다른 요인에 영향을 끼치는지(독립)를 검정
ex) 지지하는 정당과 사는 지역(A,B,C구)은 관련이 있는지 알아보기 위해서 1000명을 뽑아서 조사한 자료가 있을 때, 지지 정당과 사는 지역이 독립인지 유의수준 0.05에서 검정해보자
$\sum_{i=1}^r\sum_{j=1}^c\frac{(O_{ij}-{\widehat E_{ij}})}{\widehat E_{ij}} \sim x^2_{(r-1)(c-1)}$, 자유도 = $(r-1)(c-1)$
(열의 수- 1)*(행의 수 - 1)
4. 동질성 검정(test of homogeneity)
- 서로 다른 3개 이상의 모집단으로 관측된 값들이 범주내에서 동일한 비율을 나타내는지 검정
ex) 남녀의 핸드폰 선호가 동일한지 조시하기 위해서 남자 100명, 여자 200명을 조사하였다. 유의 수준 0.05에서 동일한지 조사하여라
'통계 & 수학 > 통계학' 카테고리의 다른 글
[통계] 단순 회귀분석 (0) | 2022.05.19 |
---|---|
[통계] 상관분석 (0) | 2022.05.19 |
[통계] 가설 검정 (0) | 2022.05.18 |
[통계] 추정 (0) | 2022.05.18 |
[통계] 모집단과 표본 분포 (0) | 2022.05.18 |