- update
- regexp
- 그리디
- count
- 이진트리
- 백트래킹
- M:N
- Article & User
- drf
- ORM
- 통계학
- SQL
- Vue
- 트리
- create
- 큐
- outer join
- 스택
- stack
- 뷰
- migrations
- Queue
- distinct
- N:1
- Django
- 쟝고
- DB
- delete
- Tree
- 완전검색
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
목록전체 글 (423)
데이터 분석 기술 블로그

기본 개념 → 그러면 Y의 확률 밀도 함수는 다음과 같이 계산된다: 또는 반대로 표현하면:야코비 행렬 (Jacobian Matrix)행렬식 ∣ det J ∣은 변환된 공간의 면적/부피 보정 요인(확률 보존을 위한 스케일 조정)예제: 극좌표 변환 이걸 극좌표로 변환: 등방성 분포가 원형 대칭으로 잘 표현됨.

이산형 확률 변수들이 여러 개일 때, 그들을 변환했을 경우 확률이 어떻게 바뀌는지 알아보자.기본 개념여러 개의 이산 확률 변수 X1, X2, …, Xn가 있을 때,이들을 어떤 함수로 변환하여 새로운 확률 변수 Y1, Y2, …를 정의할 수 있어.확률 계산 방식변환된 변수 Y의 확률을 구하려면,원래 변수 공간에서 Y = y를 만족하는 모든 (x1, x2, … ) 조합의 확률을 더해서 구해야 해 한다.즉, 다대일 함수일 경우, 하나의 y에 해당하는 여러 x 값을 모두 더한다.예제 1: 두 이진 변수의 합 Y ∼ Binomial(2, p)→ 이항 분포로의 변환예제 2: 다항 분포 → 범주 합치기 → Y는 X1, X2 범주의 총합 (ex: "찬성 + 보통")Y ∼ Binomial(n, p1 + p2)

Multinomial Distribution (다항 분포)다항 분포(Multinomial Distribution)는 여러 개의 범주형 결과가 나올 수 있는 시행을 여러 번 반복했을 때의 분포이다. 정의한 번의 시행에서 K개의 결과 중 하나가 나옴 (예: 동전 2면 → 이항, 주사위 6면 → 다항).시행을 n번 반복했을 때, 각 범주가 나온 횟수를 벡터로 표현.확률 질량 함수 (PMF) 이항 분포: 은 K = 2일 때의 특별한 경우이다.기댓값과 공분산기댓값: 공분산: 서로 다른 범주 간에는 음의 공분산(한쪽이 많으면 다른 쪽은 적음)예제주사위(6면)를 10번 던졌을 때, 각 면이 나온 횟수의 분포는?

다변량 정규분포(Multivariate Normal Distribution)는 여러 개의 확률 변수가 정규분포를 따르며 서로 상관관계를 가질 수 있는 분포이다.머신러닝, 통계, 신호 처리 등에서 매우 중요한 분포다. 확률 밀도 함수 (PDF)이 식은 1차원 정규분포의 확장이라고 보면 된다.중심은 평균 μ, 형태는 공분산 행렬 Σ에 의해 결정된다.성질주변 분포도 정규 분포→ 전체가 다변량 정규 분포를 따르면, 부분 벡터도 정규 분포를 따름 조건부 분포도 정규 분포→ 일부 변수를 조건으로 고정했을 때 나머지 변수의 분포도 여전히 정규 분포 선형 변환에도 안정적 공분산 행렬의 고유벡터 방향으로 타원 형태→ 등고선은 타원, 중심은 μ예제 주변 분포는 각각 정규 분포조건부 분포도 정규 분포

확률 벡터란?확률 변수 여러 개를 벡터 형태로 묶은 것이 확률 벡터이다. 예:이때 X는 n차원 확률 벡터 (random vector)각 Xi는 확률 변수이고, 전체가 하나의 다변량 확률 분포를 따르게 된다.다변량 분포(Multivariate Distribution)확률 벡터 X의 분포는 다음과 같은 성분들로 구성된다:결합 확률 밀도 함수 (Joint PDF): 주변 분포 (Marginal Distribution):각 변수에 대해 나머지를 적분하여 구함. 조건부 분포 (Conditional Distribution):일부 변수를 조건으로 고정한 후 나머지의 분포를 분석.기댓값 벡터와 공분산 행렬다변량 확률 벡터의 대표적인 두 가지 통계량은 다음과 같다: 기대값 벡터 (Mean Vector) 공분산 행렬 ..

Independence (독립성)확률 변수 X와 Y가 독립(independent)이라는 것은 한 변수가 다른 변수의 값에 전혀 영향을 주지 않는다는 의미이다.독립의 정의 (이산형/연속형 공통)확률 변수 X와 Y가 독립이려면, 모든 x, y에 대해 다음이 성립해야 한다: 또는 연속형 확률 변수라면: 즉, 결합 확률(또는 밀도)이 각 변수의 곱으로 표현될 수 있으면 독립이다.조건부 확률로 보는 독립또는 이렇게도 표현 가능하다: 조건부 확률이 원래 확률과 같으면 → 정보가 추가돼도 변하지 않음 → 독립독립 vs 상관관계독립 ⇒ 상관없음 (correlation = 0)BUT 상관 없음 ⇏ 독립예제 1: 이산형 독립 여부 확인 X \ Y 12310.20.30.520.30.20.5합0.50.51.0 따라서 X와 Y..

조건부 분포란?조건부 분포는 어떤 사건이 발생했다고 가정할 때, 다른 확률 변수의 분포를 의미한다. 이산형 조건부 확률: 연속형 조건부 밀도 함수: 분모는 조건의 주변 분포,분자는 조건과 대상이 함께 일어나는 결합 분포.조건부 분포의 해석조건부 분포는 두 변수 간의 의존성 또는 인과성을 분석할 때 핵심 역할을 한다. 예:P(질병 ∣ 검사 = 양성)P(고객이탈 ∣ 최근방문횟수 = 낮음)베이즈 정리 (Bayes’ Rule)2025.02.20 - [데이터 사이언스/수리 통계학] - Bayes' Rule (베이즈 정리) Bayes' Rule (베이즈 정리)베이즈 정리베이즈 정리(Bayes’ Rule)는 새로운 정보를 반영하여 확률을 업데이트하는 방법이다. 즉, 어떤 사건이 발생한 후, 그 원인이 특정 사건일 확..