728x90
반응형
상관분석
: 연속형 두 변수 간의 직선형 관계정도를 검정하는 통계 분석 방법(선형성이 있는가?)
산점도
: 두 개의 숫자형 데이터를 직교 좌표계에 표시하여 두 변수 간의 관계를 나타내는 방법
하지만, 인과관계는 알 수 없다.
상관계수(Correlation Coefficient)
:선형성이 얼마나 강한가를 나타내는 측도, 1-에서 1사이의 범위
절대값이 1에 가까울수록 강한 상관관계를 의미(0이면 두개의 변수 사이에 선형적인 관계가 존재하지 않는다)
피어슨 상관계수(Pearson correlation)
: 두 변수간 선형관계의 방향과 강도가 어느 정도인지 측정
루트 안의 값은 오차 제곱의 합을 곱한 것이다.
분자의 값은 공분산.
★ 대입시험 점수와 대학 졸업 학점 간의 상관관계(연속형 데이터 간의 상관관계)
스피어만 상관계수(Spearman correlation)
:서열척도인 두 변수들의 상관관계를 측정, 변수값들의 순위를 이용함
★ 고입 시험 등수와 대입시험 등수 간의 관계
켄달 상관계수(Kendall correlation)
★ 두 심사위원이 부여한 등수 간의 관계
Correlation ≠ Causation
상관계수는 원인-결과로 해석되면 안된다.
상관계수로 기울기를 알 수 없다.
728x90
반응형
'Data Science' 카테고리의 다른 글
선형회귀분석_통계파트 (0) | 2025.01.17 |
---|---|
선형 회귀분석 (0) | 2025.01.14 |
추정 (0) | 2025.01.12 |
주요확률분포 (0) | 2025.01.11 |
확률 & 베이즈 정리 (0) | 2025.01.09 |