Manduss life

[Bayes 통계학] 조건부 확률/베이즈 정리를 통한 정보 갱신/인과관계 추론 본문

전산/Math

[Bayes 통계학] 조건부 확률/베이즈 정리를 통한 정보 갱신/인과관계 추론

만두쓰 2023. 1. 11. 21:51

조건부 확률

$$P(A\cap B)= P(B)P(A|B)$$

$$P(B|A) = \frac{P(A \cap B)}{P(A)} = P(B) \frac{P(A|B)}{P(A)}$$ 

"|" 가 나올 시 분수(가로 찍.. ㅎ)가 나온다 라고 외우자 ! 

Q. COVID-99의 발병률이 10%로 알려져 있다. COVID-99에 실제로 걸렸을 때 검진될 확률은 99%, 실제로 걸리지 않았을 때 오검진될 확률이 1%라고 할 때, 어떤 사람이 질병에 걸렸다고 검진결과가 나왔을 때 정말로 COVID-99에 감염되었을 확률은?

A. $\theta$가 실제 병에 걸린다는 명제. $D$가 양성이라는 진단을 받은 명제이다. 
$P(\theta) $ = 0.1, $P(D|\theta)$ = 0.99 이다. 
$P(D)$가 문제인데, 이는 $P(D) = \sum_{\theta}P(D|\theta)P(\theta)$ = 0.99 x 0.1 + 0.01 x 0.9로 계산이 가능하다. 

 

조건부 확률의 시각화 

  • True Positive(Recall) : 실제 양성을 양성이라고 진단하는 확률. 탐지해야할 대상을 얼마나 잘 탐지하는지의 평가 척도, $P(D|\theta)$
  • False Positive(False alarm) : 음성을 양성이라고 진단하는 확률. $P(D|-\theta)$
  • False Negative : 양성을 음성이라고 진단하는 확률.
  • True Negative : 음성을 음성이라고 진단하는 확률.
  • Precision : 양성이라고 진단했을 때 실제 양성일 확률. 탐지 결과가 얼마나 정확한지를 나타내는 척도.
  • $ \textrm{Precision} \; = \; \frac{\textrm{TP}}{\textrm{TP + FP}}$
    TP = True Positive, FP = False Positive(False alarm)

 

베이즈 정리를 통한 정보 갱신

  • 이전에 계산된 사후확률을 사전확률로 계산하여 갱신된 사후확률을 구하는 것.

 

조건부 확률과 인과관계

  • 조건부 확률은 인과관계를 추론할 때 함부로 사용해서는 안된다.
  • 인과관계는 데이터 분포의 변화에 강건한 예측모형을 만들 때 필요하다.
  • 조건부 확률를 사용할 시, 데이터 분포의 변화(ex.데이터가 유입된 환경)가 있을 시 정확도가 떨어진다. 

 

인과관계 추론 시 중첩요인 

  • 인과관계 추론 시 중첩요인을 제거해야 정확한 결과를 얻을 수 있다. 
  • 아래 그림에서 Z가 중첩요인이 된다. 
  • ex) T - 키, R - 지능 지수, Z - 연령, 연령이 커짐에 따라 키도 커지기 때문에 연령이 키와 지능 지수에 영향을 미친다. 

아래 예제를 풀어보자. (나중에..)

 

출처 : https://www.boostcourse.org/onlyboostcampaitech5/lecture/1456476

Comments