본문 바로가기
Data Science

상관분석

by Doromi 2025. 1. 13.
728x90
반응형

상관분석

: 연속형 두 변수 간의 직선형 관계정도를 검정하는 통계 분석 방법(선형성이 있는가?)

 

산점도

: 두 개의 숫자형 데이터를 직교 좌표계에 표시하여 두 변수 간의 관계를 나타내는 방법
하지만, 인과관계는 알 수 없다.

 

상관계수(Correlation Coefficient)

:선형성이 얼마나 강한가를 나타내는 측도, 1-에서 1사이의 범위

절대값이 1에 가까울수록 강한 상관관계를 의미(0이면 두개의 변수 사이에 선형적인 관계가 존재하지 않는다)

 

피어슨 상관계수(Pearson correlation)

: 두 변수간 선형관계의 방향과 강도가 어느 정도인지 측정

루트 안의 값은 오차 제곱의 합을 곱한 것이다.

분자의 값은 공분산.

★ 대입시험 점수와 대학 졸업 학점 간의 상관관계(연속형 데이터 간의 상관관계)

 

스피어만 상관계수(Spearman correlation)

:서열척도인 두 변수들의 상관관계를 측정, 변수값들의 순위를 이용함

★ 고입 시험 등수와 대입시험 등수 간의 관계

 

켄달 상관계수(Kendall correlation)

★ 두 심사위원이 부여한 등수 간의 관계

 

Correlation ≠ Causation 

상관계수는 원인-결과로 해석되면 안된다.

상관계수로 기울기를 알 수 없다. 

 

 

728x90
반응형

'Data Science' 카테고리의 다른 글

선형회귀분석_통계파트  (0) 2025.01.17
선형 회귀분석  (0) 2025.01.14
추정  (0) 2025.01.12
주요확률분포  (0) 2025.01.11
확률 & 베이즈 정리  (0) 2025.01.09