추정 (Estimation)
: 표본을 통하여 모집단의 특성이 어떠한 가에 대해 추측하는 과정
통계적 추론은 모집단에 대한 미지의 것을 알아내려고 통계학을 이용하여 추측하는 과정으로, 추정과 가설검정으로 나눌 수 있음
추정량 - 표본정보에 의존하는 확률변수로서 모수를 추정하는데 사용되는 표본 통계량
추정치 - 추정량을 평가하여 얻게 되는 특정한 수치
점추정
-모집단의 특성을 단일한 값으로 추정하는 방법(고정된 값)
-모르는 모수를 가장 잘 대표할 수 있는 표본을 추출하고 필요한 계산을 하여 얻는 하나의 수치
-적률 방법과 최대우도 추정 방법이 있으며 두 방법 모두 표본평균이 모평균의 점추정량이 됨
-표본이 모집단의 특성을 잘 표현하지 못할 경우에는 통계량과 모수 간의 오차가 클 수 있음
구간추정
-모수의 참값이 표함되리라고 기대하는 추정치를 일정한 범위로 나타내는 것
-모수가 있을 것이라고 예상되는 구간과 그 구간에 실제 모수가 있을 예상 확률을 구함
★ 구간 설정 : 구간이 좁으면 모수를 좀 더 정확하게 추정하는 것
★ 신뢰도 설정 : 설정된 구간에 실제 모수가 존재할 확률
대수의 법칙(Law of Large Numbers)
: 표본 수가 많을 수록 통계량의 오차는 0에 접근한다.
중심극한정리(Central Limit Throrem)
:동일한 확률분포를 가진 독립 확률 변수 n개의 평균의 분포는 n이 적당히 크다면 정규분포에 가까워진다.
신뢰구간(confidence Interval)
:모수가 특정 확률로 포함될 것이라고 주장하는 범위
t• 는 표준오차, x bar는 표본 평균이다.
P(하한 < μ <상한) = 0.95P(t1<t0<t2)=0.95
★ 모분산을 알 경우 또는 n>=30
보통 k의 값은
신뢰도 95%의 경우, k=1.96
신뢰도 99%의 경우, k=2.58
★ 모분산을 모를 경우(n<30, 샘플의 갯수가 적을 때)
모 표준편차가 주어지지 않으면, 표본의 표본표준편차 s가 주어진다.
표준 오차(Standard Error)
표준편차:원시 자료의 퍼짐 정도에 대한 측도
표준오차:표본평균의 퍼짐 정도(표본평균의 표준편차)
-당도의 표준 편차가 0.5이고 표본 크기가 100이라면,
0.5/√100 = 0.05
★표본의 크기 구할 때,
-당도의 표준편차는 0.5이고, 표준오차를 0.1로 정한다면,
0.1 = 0.5/ √x , 25개의 표본이 필요
'Data Science' 카테고리의 다른 글
선형 회귀분석 (0) | 2025.01.14 |
---|---|
상관분석 (0) | 2025.01.13 |
주요확률분포 (0) | 2025.01.11 |
확률 & 베이즈 정리 (0) | 2025.01.09 |
시각화 (0) | 2025.01.09 |