Data Science

상관분석

Doromi 2025. 1. 13. 23:24
728x90
반응형

상관분석

: 연속형 두 변수 간의 직선형 관계정도를 검정하는 통계 분석 방법(선형성이 있는가?)

 

산점도

: 두 개의 숫자형 데이터를 직교 좌표계에 표시하여 두 변수 간의 관계를 나타내는 방법
하지만, 인과관계는 알 수 없다.

 

상관계수(Correlation Coefficient)

:선형성이 얼마나 강한가를 나타내는 측도, 1-에서 1사이의 범위

절대값이 1에 가까울수록 강한 상관관계를 의미(0이면 두개의 변수 사이에 선형적인 관계가 존재하지 않는다)

 

피어슨 상관계수(Pearson correlation)

: 두 변수간 선형관계의 방향과 강도가 어느 정도인지 측정

루트 안의 값은 오차 제곱의 합을 곱한 것이다.

분자의 값은 공분산.

★ 대입시험 점수와 대학 졸업 학점 간의 상관관계(연속형 데이터 간의 상관관계)

 

스피어만 상관계수(Spearman correlation)

:서열척도인 두 변수들의 상관관계를 측정, 변수값들의 순위를 이용함

★ 고입 시험 등수와 대입시험 등수 간의 관계

 

켄달 상관계수(Kendall correlation)

★ 두 심사위원이 부여한 등수 간의 관계

 

Correlation ≠ Causation 

상관계수는 원인-결과로 해석되면 안된다.

상관계수로 기울기를 알 수 없다. 

 

 

728x90
반응형