2019. 8. 5. 01:00ㆍ통계학이론/통계학개론
안녕하세요~ 리그레션입니다. 오늘은 모수(Parameter)와 통계량(Statistics)에 대한
정의를 설명해드리려고 합니다.
모수란 모집단 전체를 설명하는 측도입니다. 표본 통계량과 구분하기 위해 모수는 대부분 그리스 문자로 나타냅니다. 예를 들어, 모평균은 그리스 문자 뮤(μ)로 나타내며 모집단 표준 편차는 그리스 문자 시그마(σ)로 나타냅니다. 앞선 포스트에서 제가 언급했었죠~ 이게 사실은 모수의 한 종류였습니다.
다시 말하면, 모수(Parameter)는‘모집단의 대푯값’입니다. 즉 모집단의 평균, 모집단의 분산, 모집단의 표준편차, 모집단의 중앙값 등등 앞서 설명 들어 드렸던 모두 모수라는 이름으로 묶일 수 있습니다.
반면 통계량(Statistics)은 ‘표본의 대푯값’입니다. 표본의 평균, 표본의 분산, 표본의 표준편차 등등 모두 통계량이라고 합니다. 아마도 까먹으셨을 것 같아서 ㅠㅠ 다시 수식과 함께 적어드리겠습니다.
이때, 모평균은 모든 Xi 들을 더해주면 되고, 표본 평균은 표본에 포함된 것들만 더해주면 됩니다.
두 가지의 차이는 모 분산의 편차는 각 데이터에서 ‘모평균’을 기준으로 계산된 것이고, 표본 분산의 편차는 각 데이터에서 ‘표본 평균’을 기준으로 해 계산된 것이라는 것입니다.
절대로 잊지 말아야 할 부분이 있었죠? 바로 표본분산의 경우 n이 아닌 n-1로 나눈다는 것입니다. 앞선 포스팅에 언급이 되었었죠? ㅎㅎ 그 이유는 기초통계학을 다룰 때 증명과 함께 설명드리겠습니다~.
다음은 베르누이 시행에 대해서 알아볼까요?
만약 실험의 결과가 두 가지만 있다고 가정해 볼까요? 성공/실패, 양호/불량, 찬성/반대를 예시로 들 수 있네요.
모집단이 두 가지로 결과로 이루어지는 이분법적인 표본추출상황은 추가적으로 특정 조건을 만족하면서 반복될 시에 스위스의 수학자 야곱 메르 누이의 이름에서 따온 베르누이 시행(Bernoulli trials)이라고 부릅니다. 특징은 다음과 같습니다.
1) 각 시행은 두 가지 경우 중 한가지에 해당합니다.
2) 각 시행이 성공할 확률을 p라 두고 실패할 확률은 1-p밖에 무조건 나오지 않습니다.
3) 각 시행들은 독립적이다.(각 시행의 결과가 다른 시행에 영향을 미치지 않습니다.)
가장 간단한 베르누이 시행은 동전 던지기입니다. 이 경우엔 성공 또는 실패가 각각 2분의 1이 p가 되겠죠.
결과가 이분법적일 경우, 표본추출법에 대해 알려드리겠습니다.
1) 복원표본추출법(sampling with replacement) : 15개의 제품 중 5개가 불량품인 뽑기에서 예를 들어 드리면 우선 이 추출법은 베르누이 실행입니다. 즉 p가 뽑을 때마다 일정합니다. 15분의 5로 말이죠. 1개를 뽑은 뒤에 뽑았던 것을 다시 넣고 15분의 5로 다시 뽑는 겁니다.
2) 비 복원 추출법(sampling without replacement) : 만약 위의 실험에서 뽑았던 것이 양품이든 불량품이든 간에 다시 뽑는 집단에 넣지 않고 뽑는 것을 비 복원 추출법이라고 하빈다. 즉 P가 일정하지가 않습니다. 처음에 양품을 뽑았다면, 15분의 5 다음은 14분의 5 확률이겠죠? 이것은 제가 위에서 말했던 독립성이 없어지는 예시(종속적이라고 합니다)입니다. 처음에 양품을 뽑았으니, 다음 차례에 불량품을 뽑을 확률이 올라간 거죠.
어쩌다 보니 이번 포스트에선 앞선 포스트에서 많이 배웠던 것들을 복습하는 시간이 되었네요. 쉬엄쉬엄 하세요 ㅎㅎ 이상 리그레션이었습니다. 감사합니다.
'통계학이론 > 통계학개론' 카테고리의 다른 글
열다섯번째 이야기 - 모비율의 가설검정(기각역, 검정통계량,유의수준, 귀무가설,제 1,2종 오류) (0) | 2019.08.07 |
---|---|
열네번째 이야기 - 이항분포 (0) | 2019.08.06 |
열두번째 이야기 - 분산과 표준편차 (0) | 2019.08.04 |
열한번째 이야기 - 확률변수와 기댓값 (0) | 2019.08.04 |
열번째 이야기 - 확률표본과 임의선택 (0) | 2019.08.02 |