출처: https://3months.tistory.com/307 [Deep Play]

스물한번째 이야기 - 모평균의 신뢰구간

2019. 8. 25. 01:25통계학이론/통계학개론

안녕하세요 리그레션입니다. 오늘은 모평균의 신뢰구간을 다뤄보려 합니다.

 

점추 정에서 표준오차를 함께 구하기는 하지만 주된 관심은 모수를 추정하기 위하여 사용되는 하나의 수 값에 있습니다. 그러나, 하나의 수 값으로 모수를 정하는 대신에 모수의 참값이 포함될 것으로 기대되는 구간을 구하는 것이 더 바람직할 때가 많답니다. 이때 가장 이상적인 것은 표본을 추출하고 이 표본을 이용하여 모수의 참값이 언제나 포함되는 구간을 구하는 것이겠죠? 하지만 이는 표본이 뽑힐 때마다 달라서 불가능하고 그 대신 계산된 구간이 모수의 참값을 포함할 확률을 저희는 명시하고 어느 정도 신뢰할 수 있는지를 보게 됩니다. 이 확률을 신뢰 수준이라고 부르고 통상 0.9, 0.95, 0.99를 택합니다. 제일 많이 쓰이는 것은 0.95입니다.

 

이해가 잘 안 가시나요? 우선 모집단의 분포가 정규분포라고 가정하고 표준편차를 알고 있는 경우라고 생각해봅니다. 이때 모평균의 신뢰구간을 구하려고 할 때를 생각해보고, 표준편차를 모르는 경우에 모평균을 구한다고 가정해봅니다. 모집단이 정규분포를 따르면 표본의 분포 역시 정규분포가 됩니다. 표본 평균은 뮤, 표준편차는 시그마/루트 n이고 표준 정규분포에 의하면 정규 확률변수가 평균으로부터 1.96 곱하기 표준편차 내에 있을 확률이 0.95가 됩니다. 즉

이렇게 나타 낼 수 있겠지요.

이 양쪽에 있는 숫자를 끝으로 미지의 모수 뮤를 포함할 확률은 0.95가 됩니다. 그리고 이를 뮤의 95% 신뢰구간이라고 칭합니다.

 

언제나 신뢰 수준을 95%로 택할 필요는 없고, 조사자가 원하는 임의의 신뢰수준을 택할 수 있습니다. 만일 100(1-a)% 신뢰구간을 구하고 싶다면, 신뢰구간을 구하는 식에서 1.96 대신에 표준 정규분포의 산 위 a/2인 점 Za/2를 사용하면 됩니다. 이상의 내용을 요약해 보면, 모집단이 정규분포를 따르고 표준편차 시그마의 값이 알려진 경우에 한해서 뮤의 100(1-a)% 신뢰구간은 

이 됩니다.

 

신뢰구간은 표본으로 얻은 정보를 전달하는 가장 유용한 방법이므로 특별히 몇 가지 특징을 강조하고자 알려드립니다. 먼저 뮤의 95% 신뢰구간에 대하여 이 특징을 정리해드리겠습니다. 

 

첫째, 신뢰구간은 모수 뮤의 참값을 포함하기 위하여 구해진 확률 구간입니다.

 

둘째, 확률이란 말은 반복적으로 ㅁ낳은 표본을 추출하여 구한 구간(한 번만 뽑아서가 아닙니다)들 중 약 95%가 뮤를 포함한다는 의미로 해석되어야 합니다.

 

셋째, 일단 관측된 표본으로부터 Xbar 가 아닌 xbar가 계산되고 나면 구간식에서도 라지 X 대신 스몰 x를 써서 구간을 나타낼 수 있습니다. 이렇게 확률변수가 아닌 관측값으로 계산된 구간에 대하여서는 뮤를 포함할 확률을 언급하는 것이 더 이상 의미가 없습니다.

 

이상 리그레션이었습니다. 감사합니다. 좋은 하루 보내세요.