베이즈 정리
베이즈 정리란 조건부 확률과 각각의 확률 정보를 사용하여 순서가 뒤바뀐 조건부 확률을 쉽게 구할 수 있는 정리를 말한다. 수식으로는 다음과 같다.
\(P(A|B) = \frac{P(B|A)\times P(A)}{P(B)}\)
주로 A가 추측, B가 사실을 확률로 두어 추측 확률인 A를 더욱 정확한 확률로 치환하는 방식이다. 이때, 추측 확률은 동일한 확률을 가져야 하는 데, 이는 이유 불충분의 원리로, 하나의 사건을 기대할만한 어떤 이유가 없는 경우에는 가능한 모든 사건에 동일한 확률을 할당해야 하는 원칙이다.
예를 들어 100명의 집합이 있다고 가정하자,
우선 A는 공부를 했는지에 대한 여부라고 가정하고,(이 경우 A가 굳이 50%여야할 이유는 없으나 그냥 50%로 가정)
B는 원하는 학점을 받을 확률로 가정하자
(이 부분은 추가적인 조사로 알아낸 사실이라고 가정) 그 후 조사를 통하여 공부를 하였고, 원하는 학점을 받은 확률을 40%(\(P(B|A)=0.4\)) 공부를 하지 않았지만 원하는 학점을 받은 확률을 30%(\(P(B|A^c)=0.3\))라고 가정했을 때,
우리는 두가지의 추가적인 정보를 알 수 있다. (\(P(B^c|A)=0.6\)) (\(P(B^c|A^c)=0.7\))
위의 4가지의 확률을 토대로 다음을 구할 수 있다.
공부를 한 50명 중 40%인 20명은 원하는 학점을 받는다. 공부를 한 50명 중 60%인 30명은 원하는 학점을 받지 못한다. 공부를 안한 50명 중 30%인 15명은 원하는 학점을 받는다. 공부를 안한 50명 중 70%인 35명은 원하는 학점을 받지 못한다.
이 정보들을 통하여 \(P(A|B)\)공부를 하였기에 원하는 학점을 받은 경우가 아닌 역으로 \(P(B|A)\)원하는 학점을 받은 사람이 공부를 하였는지에 대한 확률을 구할 수 있다.
우선 원하는 학점을 받았을 확률은 위에서 가정하였듯 50%(\(P(A)=0.5\))라고 하겠다. 그 다음 원하는 학점을 받았을 확률은 35%(\(P(B)=\frac{20+15}{100}\))
위의 정보를 모두 조합하여 확률의 정확도를 업데이트 하면
\(P(A|B) = \frac{P(B|A)\times P(A)}{P(B)}=\frac{0.4\times 0.5}{0.35}= 0.57\)
즉 원하는 학점을 받았을 확률을 50%에서 57%로 업데이트 하는 것이다.