Manduss life
[Bayes 통계학] 조건부 확률/베이즈 정리를 통한 정보 갱신/인과관계 추론 본문
조건부 확률
$$P(A\cap B)= P(B)P(A|B)$$
$$P(B|A) = \frac{P(A \cap B)}{P(A)} = P(B) \frac{P(A|B)}{P(A)}$$
"|" 가 나올 시 분수(가로 찍.. ㅎ)가 나온다 라고 외우자 !
Q. COVID-99의 발병률이 10%로 알려져 있다. COVID-99에 실제로 걸렸을 때 검진될 확률은 99%, 실제로 걸리지 않았을 때 오검진될 확률이 1%라고 할 때, 어떤 사람이 질병에 걸렸다고 검진결과가 나왔을 때 정말로 COVID-99에 감염되었을 확률은?
A. $\theta$가 실제 병에 걸린다는 명제. $D$가 양성이라는 진단을 받은 명제이다.
$P(\theta) $ = 0.1, $P(D|\theta)$ = 0.99 이다.
$P(D)$가 문제인데, 이는 $P(D) = \sum_{\theta}P(D|\theta)P(\theta)$ = 0.99 x 0.1 + 0.01 x 0.9로 계산이 가능하다.
조건부 확률의 시각화
- True Positive(Recall) : 실제 양성을 양성이라고 진단하는 확률. 탐지해야할 대상을 얼마나 잘 탐지하는지의 평가 척도, $P(D|\theta)$
- False Positive(False alarm) : 음성을 양성이라고 진단하는 확률. $P(D|-\theta)$
- False Negative : 양성을 음성이라고 진단하는 확률.
- True Negative : 음성을 음성이라고 진단하는 확률.
- Precision : 양성이라고 진단했을 때 실제 양성일 확률. 탐지 결과가 얼마나 정확한지를 나타내는 척도.
- $ \textrm{Precision} \; = \; \frac{\textrm{TP}}{\textrm{TP + FP}}$
TP = True Positive, FP = False Positive(False alarm)
베이즈 정리를 통한 정보 갱신
- 이전에 계산된 사후확률을 사전확률로 계산하여 갱신된 사후확률을 구하는 것.
조건부 확률과 인과관계
- 조건부 확률은 인과관계를 추론할 때 함부로 사용해서는 안된다.
- 인과관계는 데이터 분포의 변화에 강건한 예측모형을 만들 때 필요하다.
- 조건부 확률를 사용할 시, 데이터 분포의 변화(ex.데이터가 유입된 환경)가 있을 시 정확도가 떨어진다.
인과관계 추론 시 중첩요인
- 인과관계 추론 시 중첩요인을 제거해야 정확한 결과를 얻을 수 있다.
- 아래 그림에서 Z가 중첩요인이 된다.
- ex) T - 키, R - 지능 지수, Z - 연령, 연령이 커짐에 따라 키도 커지기 때문에 연령이 키와 지능 지수에 영향을 미친다.
아래 예제를 풀어보자. (나중에..)
출처 : https://www.boostcourse.org/onlyboostcampaitech5/lecture/1456476
'전산 > Math' 카테고리의 다른 글
[선형대수] 선형 방정식/선형 시스템/선형 결합/선형독립/선형의존 (0) | 2023.01.11 |
---|
Comments