본문 바로가기

Data Science

[데이터 과학] 베이즈 정리 (Bayes's Theorem)

조건부 확률을 반대로 뒤집는 이론

 

가령, 사건 F 가 발생했다는 가정하에 사건 E 가 발생할 확률이 필요하다고 해보자. 하지만 사건 E 가 발생했다는 가정하에 사건 F 가 발생할 확률만 주어졌다고 하면 조건부 확률의 정의를 두 번 사용하면 다음과 같이 식을 정리할 수 있다.

 

* 여기서 P(E,F) 는 독립사건을 의미할수도, 종속사건을 의미할 수도 있기 때문에, 사건 E 가 발생했다는 가정하에 사건 F 가 발생할 확률의 표현식으로 풀어써줄 수 있는것이다.

 

 

그리고, 사건 F 를 사건 F 와 사건 E 가 모두 발생하는 경우 와 사건 F 는 발생하지만 사건 E 는 발생하지 않는 경우 에는 두 사건을 상호배타적인 사건으로 나눌 수 있다.

 

이를 이용하면 베이즈 정리는 다시 다음과 같이 정리할 수 있다.

 

 

예를 들어, 10000명 중에 1명이 걸리는 질병이 있다고 상상해 보자.

이때 질병이 있는 경우 양성 질병이 없는 경우 음성 이라고 판단하는 검사가 99% 의 경우에 대해 정확한 판단을 내린다고 해보자.

그렇다면 양성 판정을 받았다는 것은 무엇을 의미하는 것일까? 사건 T 는 양성 판정을 나타내고, 사건 D 는 질병에 걸린 경우를 나타낸다고 해보자.

 

양성 판정인 경우, 실제로 병에 걸렸을 확률은 다음과 같다.

 

 

즉, 양성 판정을 받은 사람 중 실제로 질병에 걸린 사람은 1%도 안 된다는 것을 의미한다.

'Data Science' 카테고리의 다른 글

확률변수 (random variable)  (0) 2021.01.21
[데이터 과학] 종속성과 독립성, 조건부 확률  (0) 2021.01.08
[데이터 과학] 통계 (Statistics)  (0) 2021.01.03
벡터(Vector) 란?  (0) 2020.12.31