출처: https://3months.tistory.com/307 [Deep Play]

열한번째 이야기 - 확률변수와 기댓값

2019. 8. 4. 01:00통계학이론/통계학개론

안녕하세요 리그레션입니다! 와우 어느새 열한 번째 이야기까지 왔네요^^ 하루 1포 스팅을 원칙으로 하고 있는데 어느새 이렇게 많이 썼다는 게 실감이 안 납니다 ㅎㅎ 이 포스트를 꾸준히 읽어주시는 여러분들도 꾸준히 공부하시길 바랍니다.

 

오늘은 확률변수(Random variable)에 대해 알아볼 건데요! 매우 중요한 개념입니다.

 

확률변수 X는 실험의 결과들에 수치를 대응시킨 것을 말합니다.

 

수학적 용어로, 확률변수 X란 표본 공간상에서 정의되며, 실수 값에 대응하는 함수입니다.

 

예를 들어 동전을 세 번 던지는 실험을 들어 볼까요? 앞면이 나오는 횟수를 X라고 하겠습니다.

H, T를 각각 앞뒷면으로 두겠습니다.

 

X = 근원사상 : 사상(시행의결과 생겨난 내용, 현상을 말합니다)의 하나하나를 말한다. 이 이상 나누는 것이 불가능한 사상을 말한다.
X : 근원사상 X값
HHH 3
HHT 2
HTH 2
HTT 1
THH 2
THT 1
TTH 1
TTT 0

실험에서 개개의 결과는 오직 하나의 X값이 대응됩니다.

 

이 결과로 다음과 같은 결과를 얻을 수 있는데요,

 

X값      각 X값에 대응하는 사상

X=0      {TTT}

X=1      {HTT, THT, TTH}

X=2      {HHT, HTH, THH}

X=3      {HHH}

확률 변수 X가 취할 수 있는 값들은 표본 공간에 관계없이 확률변수의 형태로부터 바로 결정됩니다.

즉 세번의 동전 던지기 실험에선 표본 공간을 따로 생각하지 않고도 X = 0, 1, 2, 3 임을 쉽게 알 수 있습니다.

하지만 각 사상에 대응되는 이런 값들에 확률 값을 부여하기 위해선 때론 표본 공간을 고려하는 것이 도움이 될 수 있습니다.

 

확률변수가 유한값을 혹은 자연수와 일대일 대응이 되는 무한히 많은 값을 가질 때 이산 확률 변수라고 하고,

 

연속적인 양의 측도나 모든 값들이 구간에 있으면, 연속 확률 변수라 고합니다.

 

저번 시간에 배웠던 확률분포의 평균은 확률 변수 X에 대한 모평균이며, 그리스 문자로 뮤를 씁니다.

 

확률변수 X의 평균은 기댓값이라고도 하며 E(X)로 씁니다. 말 그대로 이 값이 나올 거야~라고 기대가 되는 값이지요.

 

즉 평균 뮤와 기댓값은 같은 값을 가지고 있습니다. 표본을 뽑은 목적이 애초에 모집단 추론을 위한 것이므로 모집단의 평균과 표본의 평균(기댓값)은 같기를 기대하는 거죠^^

 

기댓값에 대한 이야기를 좀 더 하겠습니다. 하나의 주사위를 20번 던져서 다음의 자료를 얻었다고 하면요,

4 3 4 2 5 1 6 6 5 2 2 6 5 4 6 2 1 6 2 4

 

이 관측값들의 평균은 관측치들의 합/표본크기로 구할 수 있는데요, 76 나누기 20 은 3.8이 나오네요

 

다른 방법으로 평균을 계산할 수 있습니다. 먼저 각 값의 도수와 상대 도수를 이용해서 

 

1 곱하기(2/20) +2 곱하기(5/20) +3 곱하기(1/20) +4 곱하기(4/20) +5 곱하기(3/20) +6 곱하기(5/20) = 3.8

이네요. 그래서 다음과 같은 공식을 얻을 수 있습니다.

표본 평균 = (값 곱하기 상대 도수)의 합

어떠세요? 보통 통계학 문제를 푸는 사람들이 평균은 그냥 다른 말로 기댓값인 걸로 알고 있습니다만;; 문제를 푸는 상황에선 이것이 크게 문제가 되지 않는 것은 사실입니다. 그러나 기댓값은 확률변수의 평균이라는 사실만 기억하면 간단하답니다. 감사합니다 리그레션이었습니다~ 여러분 파이팅 하세요^^.