본문 바로가기
Data Science

추정

by Doromi 2025. 1. 12.
728x90
반응형

추정 (Estimation)

: 표본을 통하여 모집단의 특성이 어떠한 가에 대해 추측하는 과정

통계적 추론은 모집단에 대한 미지의 것을 알아내려고 통계학을 이용하여 추측하는 과정으로, 추정과 가설검정으로 나눌 수 있음

추정량 - 표본정보에 의존하는 확률변수로서 모수를 추정하는데 사용되는 표본 통계량

추정치 - 추정량을 평가하여 얻게 되는 특정한 수치

 

점추정

-모집단의 특성을 단일한 값으로 추정하는 방법(고정된 값)

-모르는 모수를 가장 잘 대표할 수 있는 표본을 추출하고 필요한 계산을 하여 얻는 하나의 수치

-적률 방법과 최대우도 추정 방법이 있으며 두 방법 모두 표본평균이 모평균의 점추정량이 됨

-표본이 모집단의 특성을 잘 표현하지 못할 경우에는 통계량과 모수 간의 오차가 클 수 있음

 

구간추정

-모수의 참값이 표함되리라고 기대하는 추정치를 일정한 범위로 나타내는 것

-모수가 있을 것이라고 예상되는 구간과 그 구간에 실제 모수가 있을 예상 확률을 구함

★ 구간 설정 : 구간이 좁으면 모수를 좀 더 정확하게 추정하는 것

★ 신뢰도 설정 : 설정된 구간에 실제 모수가 존재할 확률

 

대수의 법칙(Law of Large Numbers)

: 표본 수가 많을 수록 통계량의 오차는 0에 접근한다.

중심극한정리(Central Limit Throrem)

:동일한 확률분포를 가진 독립 확률 변수 n개의 평균의 분포는 n이 적당히 크다면 정규분포에 가까워진다.

 

신뢰구간(confidence Interval)

:모수가 특정 확률로 포함될 것이라고 주장하는 범위

신뢰구간 공식

t• 는 표준오차, x bar는 표본 평균이다.

P(하한 < μ <상한) = 0.95P(t1<t0<t2)=0.95

 

★ 모분산을 알 경우 또는 n>=30

보통 k의 값은

신뢰도 95%의 경우, k=1.96

신뢰도 99%의 경우, k=2.58

★ 모분산을 모를 경우(n<30, 샘플의 갯수가 적을 때)

모 표준편차가 주어지지 않으면, 표본의 표본표준편차 s가 주어진다.

 

표준 오차(Standard Error)

표준편차:원시 자료의 퍼짐 정도에 대한 측도

표준오차:표본평균의 퍼짐 정도(표본평균의 표준편차)

 

-당도의 표준 편차가 0.5이고 표본 크기가 100이라면,

0.5/√100 = 0.05


★표본의 크기 구할 때,

-당도의 표준편차는 0.5이고, 표준오차를 0.1로 정한다면,

0.1 = 0.5/ √x , 25개의 표본이 필요

728x90
반응형

'Data Science' 카테고리의 다른 글

선형 회귀분석  (0) 2025.01.14
상관분석  (0) 2025.01.13
주요확률분포  (0) 2025.01.11
확률 & 베이즈 정리  (0) 2025.01.09
시각화  (0) 2025.01.09