deda
Deda의 데이터 디자인
deda
전체 방문자
오늘
어제
  • 분류 전체보기 (121)
    • Python (27)
      • Python 기초 (17)
      • Python 데이터분석 (10)
    • SQL (9)
    • Coding test (54)
      • Python 기초문제 (45)
      • LeetCode (9)
    • BigData (2)
    • ZeroBase (3)
    • UX (0)
    • Business Review (1)
    • 통계 & 수학 (17)
      • 통계학 (14)
      • 수학 (3)
    • 스터디 (6)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • 미니콘다
  • 등비수열
  • 릿코드
  • 코딩
  • SQL
  • 최소공배수
  • matplotlib
  • pandas
  • 부트캠프
  • 함수
  • 소인수분해
  • 데이터분석가
  • 파이썬
  • 데이터사이언티스트
  • 계산기
  • 마이데이터
  • 팩토리얼
  • 데이터엔지니어
  • 프로그래밍
  • 네카라쿠배
  • 빅데이터
  • 통계
  • BMI
  • 계차수열
  • 모듈
  • 기초수학
  • 제로베이스
  • 데이터분석
  • 군수열
  • 등차수열

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
deda

Deda의 데이터 디자인

[통계] 범주형 자료 분석
통계 & 수학/통계학

[통계] 범주형 자료 분석

2022. 5. 18. 23:54

 

 

📌 적합도 검정

1. 범주형 자료(categorical data)

- 관측된 결과를 어떤 속성에 따라 몇 개의 범주로 분류시켜 도수로 주어진 데이터 

 

 1) 범주형 자료 분석(categorical data analysis) 

 -  범주형자료에대한통계적추론방법

 -  범주형 자료 분석은 카이제곱 검정으로 추론함

    ex) 대선에서 각 정당의 연령대별 지지율이 지난 대선의 지지율과 동일한가?

    ex) 성별에 따라서 선호하는 핸드폰 회사가 동일한가? 

 

 2) t-test와 카이제곱 검정의 차이

  (1) t-test : 연속형 변수의 차이에 대한 검정

  (2) 카이제곱 검정 : 명목형 변수에 대한 검정 


 

2. 적합도 검정(goodness of fit test)

- 관측된값들이추론하는분포를따르고있는지검정,한개의요인을대상으로검정
   ex) 멘델의 유전 법칙에 부합하는지 검사하기 위해 테스트할 때, 완두콩의 잡종 비율이 A:B:C = 1:1:2 였다고 가정해 보자. 100개의 콩을 조사한 결과 A가 25 B가 20 C가 55개 였다면 앞선 가정이 맞는지 유의수준 0.05에서 검정해보자 

 

$\chi^2 = \sum \frac{(O_i-E_t)^2}{E_i} $,     자유도 = 범주의 개수 - 1

 

-  관찰 빈도($O$ : observed frequency) : 데이터로부터 수집된 값

-  기대 빈도($E$ : expected frequency) : 기대값과 비슷한 개념

    ex) 기대빈도는 예를 들어 남녀 1000명의 데이터에서 각 성별의 기대 빈도는 500명임

    ex) 주사위 120번을 던졌을 때 각 눈이 나오는 기대빈도는 20번임


 

3. 독립성 검정(test of independence) 

-  관측된 값을 두 개의 요인으로 분할하고 각 요인이 다른 요인에 영향을 끼치는지(독립)를 검정

    ex) 지지하는 정당과 사는 지역(A,B,C구)은 관련이 있는지 알아보기 위해서 1000명을 뽑아서 조사한 자료가 있을 때, 지지 정당과 사는 지역이 독립인지 유의수준 0.05에서 검정해보자

 

$\sum_{i=1}^r\sum_{j=1}^c\frac{(O_{ij}-{\widehat E_{ij}})}{\widehat E_{ij}} \sim x^2_{(r-1)(c-1)}$,     자유도 = $(r-1)(c-1)$ 

 

(열의 수-  1)*(행의 수 - 1)


 

4. 동질성 검정(test of homogeneity) 

-  서로 다른 3개 이상의 모집단으로 관측된 값들이 범주내에서 동일한 비율을 나타내는지 검정

    ex) 남녀의 핸드폰 선호가 동일한지 조시하기 위해서 남자 100명, 여자 200명을 조사하였다. 유의 수준 0.05에서 동일한지 조사하여라 

 

'통계 & 수학 > 통계학' 카테고리의 다른 글

[통계] 단순 회귀분석  (0) 2022.05.19
[통계] 상관분석  (0) 2022.05.19
[통계] 가설 검정  (0) 2022.05.18
[통계] 추정  (0) 2022.05.18
[통계] 모집단과 표본 분포  (0) 2022.05.18
    '통계 & 수학/통계학' 카테고리의 다른 글
    • [통계] 단순 회귀분석
    • [통계] 상관분석
    • [통계] 가설 검정
    • [통계] 추정
    deda
    deda
    데이터 분석 / 파이썬 / UX / 정량리서치

    티스토리툴바