출처: https://3months.tistory.com/307 [Deep Play]

스무번째 이야기 - 표본크기의 결정

2019. 8. 22. 01:25통계학이론/통계학개론

안녕하세요 리그레션입니다. 오늘은 표본의 크기를 결정하는 것에 대해 논의하려고 합니다. 오늘 포스팅해서 알려드릴 내용은 굉장히 쉽고 간단합니다. 집중해주세요.

 

표본의 크기를 얼마만 한 크기로 할 것인가 하는 문제는 표본조사의 계획을 짜는 단계에서 아주 중요한 부분을 차지합니다. 표본추출에는 대부분 많은 경비와 시간이 소요되므로 원하는 정밀도를 얻기 위하여 필요한 표본의 크기를 사전에 결정할 필요가 있습니다.

 

먼저 표본의 크기를 결정하기 위해서는 'd=원하는 오차한계'와 '1-a=오차한계에 관계된 확률'을 명확히 해야 합니다.

 

앞선 포스트에서 설명드린 100(1-a)% 오차한계의 식을 이용하면, Za/2 곱하기 시그마 / 루트 n 한 것이 d가 나오겠죠.

그러므로 표본의 크기는 n에 관하여 이 식을 풀면

이렇게 구할 수 있습니다. 물론 표본크기는 정수여야 하므로 위의 식에서 n이 될 수 있는 최소의 정수를 n으로 결정합니다. 30.5가 우변으로 나온다면 31로 설정하는 방식이지요. 이렇게 결정된 표본크기가 정규 근사를 위한 표본크기인 n>30(혹은 40)이 되면 원하는 정밀도를 얻을 수 있는 것으로 간주하게 됩니다. 모 표준편차인 시그마를 모르는 경우엔 적은 수의 예비 표본을 이용해서 추정을 하고 n의 계산 공식에서 시그마 대신 넣으면 됩니다.

 

막상 통계비전공자들이 이렇게 표본의 크기를 얼마로 해야 비용적으로도, 인력이 낭비되지 않는 선에서 신뢰성이 높은 통계자료를 구할 수 있나요?라고 질문을 한다면 저는 이 식을 보여주고 일단 이 식대로 하시고, 증명이나 더 높은 신뢰성을 요구하고 싶으시면 다른 방법을 알려드릴게요 라고 대답합니다. 일상에서 간단한 표본조사를 하는 경우엔 이것만으로도 충분하다고 생각합니다. 감사합니다. 리그레션이었습니다.