STATISTICS(28)
-
스물두번째이야기 - 대표본에서의 Mu의 신뢰구간
안녕하세요 리그레션입니다. 스물한 번째 이야기, 앞에서 신뢰구간의 기본적인 개념들을 설명드렸는데요, 오늘은 대표 본에서의 Mu의 신뢰구간에 대해 다뤄보고자 합니다. 다시 말하면, 이제 좀 더 현실적인 상황을 설명해 볼게요. 보통 현실에선 99% 모 표준편차를 모르는 상태에서 신뢰구간을 구합니다. 모집단의 분포가 정규분포라는 가정을 없애기 위해서 표본 크기 n이 커야 하겠죠. 이 경우, 앞서 배웠던 중심 극한 정리에 의하면 모집단의 분포에 관계없이 Xbar의 분포는 정규분포에 가깝습니다. 따라서 구간 이 Mu를 포함할 확률이 약 1-a이지만 이 구간은 미지의 모수인 Sigma를 포함하고 있으므로 신뢰구간이 될 수 없습니다. 그러나, n이 클 때는 이야기가 다릅니다. 시그마/루트 n을 s/루트 n으로 바꾸어..
2019.08.26 -
스물한번째 이야기 - 모평균의 신뢰구간
안녕하세요 리그레션입니다. 오늘은 모평균의 신뢰구간을 다뤄보려 합니다. 점추 정에서 표준오차를 함께 구하기는 하지만 주된 관심은 모수를 추정하기 위하여 사용되는 하나의 수 값에 있습니다. 그러나, 하나의 수 값으로 모수를 정하는 대신에 모수의 참값이 포함될 것으로 기대되는 구간을 구하는 것이 더 바람직할 때가 많답니다. 이때 가장 이상적인 것은 표본을 추출하고 이 표본을 이용하여 모수의 참값이 언제나 포함되는 구간을 구하는 것이겠죠? 하지만 이는 표본이 뽑힐 때마다 달라서 불가능하고 그 대신 계산된 구간이 모수의 참값을 포함할 확률을 저희는 명시하고 어느 정도 신뢰할 수 있는지를 보게 됩니다. 이 확률을 신뢰 수준이라고 부르고 통상 0.9, 0.95, 0.99를 택합니다. 제일 많이 쓰이는 것은 0.95..
2019.08.25 -
스무번째 이야기 - 표본크기의 결정
안녕하세요 리그레션입니다. 오늘은 표본의 크기를 결정하는 것에 대해 논의하려고 합니다. 오늘 포스팅해서 알려드릴 내용은 굉장히 쉽고 간단합니다. 집중해주세요. 표본의 크기를 얼마만 한 크기로 할 것인가 하는 문제는 표본조사의 계획을 짜는 단계에서 아주 중요한 부분을 차지합니다. 표본추출에는 대부분 많은 경비와 시간이 소요되므로 원하는 정밀도를 얻기 위하여 필요한 표본의 크기를 사전에 결정할 필요가 있습니다. 먼저 표본의 크기를 결정하기 위해서는 'd=원하는 오차한계'와 '1-a=오차한계에 관계된 확률'을 명확히 해야 합니다. 앞선 포스트에서 설명드린 100(1-a)% 오차한계의 식을 이용하면, Za/2 곱하기 시그마 / 루트 n 한 것이 d가 나오겠죠. 그러므로 표본의 크기는 n에 관하여 이 식을 풀면 ..
2019.08.22 -
열아홉번째 이야기 - 모평균의 점추정
안녕하세요~ 리그레션입니다. 오늘은 모평균의 점추 정에 대해서 다룰 건데요, 앞선 포스트에서 약간 언급했던 내용도 있을 테니 부담 없이 들어주셨으면 좋겠습니다. 그럼 시작할게요. 점추 정의 목적은 표본자료를 이용하여 미지의 모수에 가까울 것으로 기대되는 하나의 수 값을 구하는 것입니다. 이 경우 표본자료로부터 계산된 통계량의 값이 모수에 가능한 가깝게 되도록 통계량을 결정해야 좋은 것이겠죠. 모수를 추정하기 위해 사용된 통계량을 점추 정량(point estimator) 혹은 간단히 추정량이라고 부르는데요, 이 추정량의 표준편차를 표준오차(standard error)라고 합니다. S.E.라고도 표기를 합니다. 앞서 게시했던 포스트에서 공부했던 결과를 다시 한번 살펴볼까요? 특히 3번째 줄의 성질을 살펴보면..
2019.08.17 -
열여덟번째 이야기 - 중심극한정리
안녕하세요! 리그레션입니다. 오늘은 중심 극한 정리에 관한 내용을 다뤄보려 합니다. 모집단이 정규분포를 따르지 않으면 어떻게 할까요? 이런 경우엔, 표본 평균의 분포는 모집단의 분포가 무엇이냐에 따라 달라집니다. 중심 극한 정리(central limit theorem)라고 불리는 정리는 표본의 크기가 크면 모집단의 분포에 상관없이 표본 분포의 분포는 근사적으로 정규분포를 따른다는 정리입니다. 가르치는 사람들, 책마다 다르기는 하지만 표본의 크기가 특정 숫자로 되어있습니다. 저의 경우엔 그 숫자를 30으로 정의하는데요, 표본 n의 크기가 30 이상이면 이 정규 근사는 대부분의 경우에 잘 들어맞습니다. 40으로 하는 사람도 있습니다. 다시 정의해 볼까요? 중심 극한 정리는 매우 중요한 정리입니다. 모집단의 ..
2019.08.14 -
열일곱번째 이야기 - 정규분포와 표준 정규분포
안녕하세요 리그레션입니다. 오늘은 정규분포와 표준 정규분포에 관한 이야기를 할 건데요, 아마 역대 가장 의미 있는 포스트가 될 것 같네요 ㅠㅠ 그만큼 매우 중요한 개념이니 이해해주세요^^. 정규분포(normal distribution)는 종모양의 곡선으로 이미 잘 알려져 있습니다. 먼저 역사적으로 피에르 라플라스와 칼 가우스에 의해 발견되었고, 특히 가우스는 오차의 정규 법칙이라고 불렸던 측정오차의 확률 분포로부터 정규분포를 수리적으로 유도해내는 데에 성공했습니다. 덕분에 정규분포는 여러 학문에 걸쳐 없어서는 안 될 존재로 자리매김했죠. 하지만 부정적 측면에서는, 초기의 통계학은 한때 정규분포를 지나치게 숭배했습니다. 모든 현실은 자료가 종모양의 정규곡선을 나타내어야 한다고 믿었고, 그렇지 않으면 자료 ..
2019.08.10