확률변수(random variable) : 특정 확률 분포와 연관되어 있는 변수를 의미한다.
확률변수의 기대값(expected value) : 모든 확률변수의 확률을 해당 확률변수의 값으로 가중평균한 값
간단하게 동전의 앞면이 나오면 1 동전의 뒷면이 나오면 0인 확률변수를 예시로 들 수 있다.
값이 0인 확률변수의 확률은 0.5 이며 값이 1인 확률변수의 확률 또한 0.5 이다.
기댓값은 $1/2(= 0 * 1/2 + 1 * 1/2)$ 이다.
또 다른 예로, range(10) 에서 나온 값을 생각해볼 수 있다. 이 경우는, 0부터 9까지 모든 변수의 값에 대한 확률은 0.1 이다.
여기서 확률 변수의 기댓값은 4.5 이다.
확률변수 또한 보통 사건처럼 조건부 확률을 구할 수 있다.
만약 $X$ 라는 확률변수의 딸의 수를 나타낸다면 $X$ 가 0일 확률은 $1/4$, 1일 확률은 $1/2$ 그리고 2일 확률은 $1/4$ 이 된다.
참조
밑바닥부터 시작하는 데이터 과학
'Data Science' 카테고리의 다른 글
[데이터 과학] 베이즈 정리 (Bayes's Theorem) (0) | 2021.01.10 |
---|---|
[데이터 과학] 종속성과 독립성, 조건부 확률 (0) | 2021.01.08 |
[데이터 과학] 통계 (Statistics) (0) | 2021.01.03 |
벡터(Vector) 란? (0) | 2020.12.31 |