deda
Deda의 데이터 디자인
deda
전체 방문자
오늘
어제
  • 분류 전체보기 (121)
    • Python (27)
      • Python 기초 (17)
      • Python 데이터분석 (10)
    • SQL (9)
    • Coding test (54)
      • Python 기초문제 (45)
      • LeetCode (9)
    • BigData (2)
    • ZeroBase (3)
    • UX (0)
    • Business Review (1)
    • 통계 & 수학 (17)
      • 통계학 (14)
      • 수학 (3)
    • 스터디 (6)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • 릿코드
  • 모듈
  • 네카라쿠배
  • 제로베이스
  • 파이썬
  • 기초수학
  • BMI
  • 팩토리얼
  • 빅데이터
  • 데이터엔지니어
  • 데이터사이언티스트
  • 부트캠프
  • 계산기
  • 소인수분해
  • 등차수열
  • 통계
  • 코딩
  • 프로그래밍
  • matplotlib
  • pandas
  • 군수열
  • 계차수열
  • 함수
  • SQL
  • 등비수열
  • 미니콘다
  • 데이터분석가
  • 데이터분석
  • 마이데이터
  • 최소공배수

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
deda

Deda의 데이터 디자인

[통계] 상관분석
통계 & 수학/통계학

[통계] 상관분석

2022. 5. 19. 00:16

 

🎯상관 분석

1. 상관 관계(correlation coefficient)

- 두 변량 사이에 한쪽이 증가하면, 다른 쪽도 증가(또는 감소) 하는 관계

- 두 변수 간의 함수 관계가 선형적인 관계가 있는지 파악할 수 있는 측도 

- 상관관계가 있다고 해서 인과관계인 것은 아님

 

$$\rho= Corr(X,Y) = \frac{cov(X,Y)}{\sqrt{Var(X)}\sqrt{var(Y)}}$$

 

 1) 상관계수 $ -1 \leq \rho \leq 1$

 2) 상관계수가 1에 가까울 수록 양의 상관 관계가 강함

 3) 상관계수가 -1에 가까울 수록 음의 상관 관계가 강함

 4) 상관계수가 0에 가까울 수록 두 변수 간의 상관 관계가 존재하지 않음

 5) 상관계수가 0이라는 것은 두 변수 간에 선형관계가 존재하지 않는다는 것임 

 

2. 표본상관관계(sample correlation coefficient)

- 데이터가 $(x_1,y_1),(x_2,y_2),\cdot\cdot\cdot,(x_i,y_i),$ 과 같이 $i$개의 쌍으로 주어졌을 때,

 

$$r = \frac{\sum(x_i-\overline x)(y_i-\overline y)}{\sqrt{(x_i-\overline x)^2}\sqrt{(y_i-\overline y)^2}}=\frac{S_{xy}}{\sqrt{Sxx}\sqrt{Syy}}$$

 

 

 1) 가설 검정

$H_0 : \rho =0$      $vs$      $H_1 : \rho \neq 0 $

 

 

 2) 검정 통계량

$ T=\sqrt{n-2} \frac{r}{\sqrt{1-r^2}} $

'통계 & 수학 > 통계학' 카테고리의 다른 글

[통계] 다중 회귀분석  (0) 2022.05.19
[통계] 단순 회귀분석  (0) 2022.05.19
[통계] 범주형 자료 분석  (0) 2022.05.18
[통계] 가설 검정  (0) 2022.05.18
[통계] 추정  (0) 2022.05.18
    '통계 & 수학/통계학' 카테고리의 다른 글
    • [통계] 다중 회귀분석
    • [통계] 단순 회귀분석
    • [통계] 범주형 자료 분석
    • [통계] 가설 검정
    deda
    deda
    데이터 분석 / 파이썬 / UX / 정량리서치

    티스토리툴바