데이터 분석 기술 블로그

Multivariate Normal Distribution / Vector Gaussian (다변량 정규분포) 본문

데이터 사이언스/수리 통계학

Multivariate Normal Distribution / Vector Gaussian (다변량 정규분포)

데이터분석가 이채은 2025. 4. 2. 02:00

다변량 정규분포(Multivariate Normal Distribution)는 여러 개의 확률 변수가 정규분포를 따르며 서로 상관관계를 가질 수 있는 분포이다.
머신러닝, 통계, 신호 처리 등에서 매우 중요한 분포다.

 


확률 밀도 함수 (PDF)

  • 이 식은 1차원 정규분포의 확장이라고 보면 된다.
  • 중심은 평균 μ, 형태는 공분산 행렬 Σ에 의해 결정된다.

성질

주변 분포도 정규 분포
→ 전체가 다변량 정규 분포를 따르면, 부분 벡터도 정규 분포를 따름

 

조건부 분포도 정규 분포
→ 일부 변수를 조건으로 고정했을 때 나머지 변수의 분포도 여전히 정규 분포

 

선형 변환에도 안정적

 

공분산 행렬의 고유벡터 방향으로 타원 형태
→ 등고선은 타원, 중심은 μ


예제

 

  • 주변 분포는 각각 정규 분포
  • 조건부 분포도 정규 분포