데이터 분석 기술 블로그

Joint and Marginal Distributions (결합 및 주변 분포) 본문

데이터 사이언스/수리 통계학

Joint and Marginal Distributions (결합 및 주변 분포)

데이터분석가 이채은 2025. 3. 28. 14:25

결합 분포(Joint Distribution)주변 분포(Marginal Distribution)는 두 개 이상의 확률 변수가 함께 어떻게 분포하는지를 이해할 때 핵심이 되는 개념이다.


결합 분포란? (Joint Distribution)

결합 분포는 두 확률 변수 XY가 동시에 어떤 값을 가질 확률을 나타내는 함수이다.

  • 이산형 확률 변수의 경우:

이를 결합 확률 질량 함수 (Joint PMF)라고 한다.

 

  • 연속형 확률 변수의 경우:

즉, 두 변수의 관계를 함께 고려하는 분포이다.


주변 분포란? (Marginal Distribution)

주변 분포는 다변량 확률 분포에서 특정 변수 하나만 따로 떼어내어 보는 분포이다.
다른 변수의 값을 고려하지 않고, 전체 분포에서 그 변수를 "통합(integrate out)"해서 얻는다.

 

이산형일 경우

 

연속형일 경우

 

결합 분포에서 다른 변수의 축을 적분/합산하여 제거하면 주변 분포가 된다.


예제 1: 이산형 결합 분포

X \ Y 1 2 3
1 0.1 0.2 0.3
2 0.3 0.4 0.7
0.4 0.6 1.0


예제 2: 연속형 결합 분포

fX,Y(x, y) = 6xy on 0 ≤ x ≤ 1, 0 ≤ y ≤ 1
이때, fX(x)를 구해보자.