본문 바로가기

Data Science

확률변수 (random variable)

확률변수(random variable) : 특정 확률 분포와 연관되어 있는 변수를 의미한다.

확률변수의 기대값(expected value) : 모든 확률변수의 확률을 해당 확률변수의 값으로 가중평균한 값

 

간단하게 동전의 앞면이 나오면 1 동전의 뒷면이 나오면 0인 확률변수를 예시로 들 수 있다.

값이 0인 확률변수의 확률은 0.5 이며 값이 1인 확률변수의 확률 또한 0.5 이다.

기댓값은 $1/2(= 0 * 1/2 + 1 * 1/2)$ 이다.

 

 

또 다른 예로, range(10) 에서 나온 값을 생각해볼 수 있다. 이 경우는, 0부터 9까지 모든 변수의 값에 대한 확률은 0.1 이다.

여기서 확률 변수의 기댓값은 4.5 이다.

 

 

확률변수 또한 보통 사건처럼 조건부 확률을 구할 수 있다.

만약 $X$ 라는 확률변수의 딸의 수를 나타낸다면 $X$ 가 0일 확률은 $1/4$, 1일 확률은 $1/2$ 그리고 2일 확률은 $1/4$ 이 된다.

 

참조

밑바닥부터 시작하는 데이터 과학