출처: https://3months.tistory.com/307 [Deep Play]

스물여덟번째 이야기 - 소표본에서의 Mu의 추론

2019. 9. 4. 01:35통계학이론/통계학개론

안녕하세요 리그레션입니다 오늘은 소표본에서의 모평균 추론에 관해 다뤄보겠습니다. 날씨가 이제 선선해지려고 하니 다행입니다. 더위로 두통이 있었는데 이제 좀 살 것 같네요. 여러분도 몸조심하시기 바랍니다. 

 

T=(Xbar-Mu)/(S/루트 n)의 분포를 이용하여 정규 모집단의 모평균 뮤에 대한 신뢰구간을 구할 수 있습니다. 구체적으로 말하자면, 자유도 n-1인 t-분포의 상위 100a/2백 분 위수 t_a/2(n-1)을 이용하여 뮤의 100(1-a)% 신뢰구간을 구할 수 있습니다. 

 

T=(Xbar-Mu)/(S/루트 n)는 자유도 n-1인 t분포를 따르므로 P [-t_a/2 < T=(Xbar-Mu)/(S/루트 n) < t_a/2] = 1-a 신뢰구간을 구하기 위하여, 위 확률식의 대괄호 안을 뮤에 대하여 정리해보면 확률 구간은 (Xbar-t_a/2 곱하기 S/루트 nXbar+t_a/2 곱하기 S/루트 n) 이 됩니다.

 

이 모평균 뮤의 참값을 포함할 확률이 1-a인데, 미지인 시그마가 표본 표준편차인 s로 대체되었고 표준규 분포의 백분위수인 Z_a/2 대신 ㅅ-분포의 백분위수인 t_a/2가 사용되었다는 점만 차이가 납니다. 대표본과요.

 

여기서 다시 한번 신뢰구간의 의미를 살펴봐야 할 것 같은데요, 정규 모집단으로부터 크기 n인 확률 표본들을 반복적으로 추출하고 각 표본에 대하여 구간은 (Xbar-t_a/2 곱하기 S/루트 n,Xbar+t_a/2 곱하기 S/루트 n)이겠죠.

 

따라서 표본을 반복적으로 추출할 경우 각 구간들은 서로 다른 중심과 길이를 갖게 됩니다. 그러나, 관측된 표본으로부터 계산된 구간이 100(1-a)% 신뢰구간이라는 의미는 표본들을 반복적으로 아주 많이 추출한다면 각 표본으로부터 구해진 구간들 중 약 100(1-a)% 가 모평균 뮤의 참값을 포함할 것이라는 겁니다.

 

앞에서 언급했듯이 정규분포의 평균 뮤에 대한 신뢰구간의 길이는 시그마를 알 때는 2 곱하기 Z_a/2 시그마/루트 n인 반면, 시그마를 모를 때는 2 곱하기 t_a/2 시그마/루트 n입니다. 표본의 크기가 작고 그 결과 자유도 n-1이 작을 때는 시그마를 s로 추정함으로써 생겨나는 변동 때문에 t분포의 백분위수 t_a/2는 표준 정규분포의 백분위수 z_a/2보다 많이 커지게 됩니다. 예를 들면, 자유도가 4인 경우, t_0.025는 2.776, z_0.025는 1.96으로 상당히 차이가 나게 됩니다. 따라서 표본의 크기가 아주 작을 때는 시그마를 모르면 시그마를 알 때보다 덜 정밀한 추론을 하게 됩니다. n이 커지면 s가 시그마에 가까워지고 t와 z의 차이는 줄어들게 됩니다.

 

감사합니다. 리그레션이었습니다.