- Vue
- SQL
- 통계학
- Article & User
- 뷰
- 이진트리
- drf
- migrations
- 스택
- regexp
- update
- Tree
- ORM
- stack
- distinct
- M:N
- 트리
- DB
- count
- create
- 쟝고
- Queue
- 그리디
- outer join
- delete
- 완전검색
- N:1
- 큐
- 백트래킹
- Django
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
목록데이터 사이언스 (103)
데이터 분석 기술 블로그

다변량 정규분포(Multivariate Normal Distribution)는 여러 개의 확률 변수가 정규분포를 따르며 서로 상관관계를 가질 수 있는 분포이다.머신러닝, 통계, 신호 처리 등에서 매우 중요한 분포다. 확률 밀도 함수 (PDF)이 식은 1차원 정규분포의 확장이라고 보면 된다.중심은 평균 μ, 형태는 공분산 행렬 Σ에 의해 결정된다.성질주변 분포도 정규 분포→ 전체가 다변량 정규 분포를 따르면, 부분 벡터도 정규 분포를 따름 조건부 분포도 정규 분포→ 일부 변수를 조건으로 고정했을 때 나머지 변수의 분포도 여전히 정규 분포 선형 변환에도 안정적 공분산 행렬의 고유벡터 방향으로 타원 형태→ 등고선은 타원, 중심은 μ예제 주변 분포는 각각 정규 분포조건부 분포도 정규 분포

확률 벡터란?확률 변수 여러 개를 벡터 형태로 묶은 것이 확률 벡터이다. 예:이때 X는 n차원 확률 벡터 (random vector)각 Xi는 확률 변수이고, 전체가 하나의 다변량 확률 분포를 따르게 된다.다변량 분포(Multivariate Distribution)확률 벡터 X의 분포는 다음과 같은 성분들로 구성된다:결합 확률 밀도 함수 (Joint PDF): 주변 분포 (Marginal Distribution):각 변수에 대해 나머지를 적분하여 구함. 조건부 분포 (Conditional Distribution):일부 변수를 조건으로 고정한 후 나머지의 분포를 분석.기댓값 벡터와 공분산 행렬다변량 확률 벡터의 대표적인 두 가지 통계량은 다음과 같다: 기대값 벡터 (Mean Vector) 공분산 행렬 ..

Independence (독립성)확률 변수 X와 Y가 독립(independent)이라는 것은 한 변수가 다른 변수의 값에 전혀 영향을 주지 않는다는 의미이다.독립의 정의 (이산형/연속형 공통)확률 변수 X와 Y가 독립이려면, 모든 x, y에 대해 다음이 성립해야 한다: 또는 연속형 확률 변수라면: 즉, 결합 확률(또는 밀도)이 각 변수의 곱으로 표현될 수 있으면 독립이다.조건부 확률로 보는 독립또는 이렇게도 표현 가능하다: 조건부 확률이 원래 확률과 같으면 → 정보가 추가돼도 변하지 않음 → 독립독립 vs 상관관계독립 ⇒ 상관없음 (correlation = 0)BUT 상관 없음 ⇏ 독립예제 1: 이산형 독립 여부 확인 X \ Y 12310.20.30.520.30.20.5합0.50.51.0 따라서 X와 Y..

조건부 분포란?조건부 분포는 어떤 사건이 발생했다고 가정할 때, 다른 확률 변수의 분포를 의미한다. 이산형 조건부 확률: 연속형 조건부 밀도 함수: 분모는 조건의 주변 분포,분자는 조건과 대상이 함께 일어나는 결합 분포.조건부 분포의 해석조건부 분포는 두 변수 간의 의존성 또는 인과성을 분석할 때 핵심 역할을 한다. 예:P(질병 ∣ 검사 = 양성)P(고객이탈 ∣ 최근방문횟수 = 낮음)베이즈 정리 (Bayes’ Rule)2025.02.20 - [데이터 사이언스/수리 통계학] - Bayes' Rule (베이즈 정리) Bayes' Rule (베이즈 정리)베이즈 정리베이즈 정리(Bayes’ Rule)는 새로운 정보를 반영하여 확률을 업데이트하는 방법이다. 즉, 어떤 사건이 발생한 후, 그 원인이 특정 사건일 확..

이변량 정규 분포의 정의두 확률 변수 X, Y가 다음과 같은 이변량 정규 분포를 따른다고 하자:여기서:주변 분포의 형태이변량 정규 분포에서 주변 분포도 정규 분포를 따름. X의 주변 분포는: Y의 주변 분포는: 상관 계수 ρ는 주변 분포에는 영향을 주지 않음.단지 X와 Y가 함께 어떻게 움직이는지 (공분산 구조)에만 영향.예제이때 X와 Y의 주변 분포를 각각 구하라.

결합 분포(Joint Distribution)와 주변 분포(Marginal Distribution)는 두 개 이상의 확률 변수가 함께 어떻게 분포하는지를 이해할 때 핵심이 되는 개념이다.결합 분포란? (Joint Distribution)결합 분포는 두 확률 변수 X와 Y가 동시에 어떤 값을 가질 확률을 나타내는 함수이다.이산형 확률 변수의 경우:이를 결합 확률 질량 함수 (Joint PMF)라고 한다. 연속형 확률 변수의 경우: 즉, 두 변수의 관계를 함께 고려하는 분포이다.주변 분포란? (Marginal Distribution)주변 분포는 다변량 확률 분포에서 특정 변수 하나만 따로 떼어내어 보는 분포이다.다른 변수의 값을 고려하지 않고, 전체 분포에서 그 변수를 "통합(integrate out)"해서..

확률 변수 변환(Change of Variables)은 주어진 확률 변수 X를 새로운 확률 변수 Y로 변환할 때의 확률 분포를 찾는 과정이다. 확률 변수 변환이 중요한 이유는:새로운 변수를 정의해서 확률 분포를 바꿔야 하는 경우가 많음.예를 들어, 데이터 변환(로그 변환, 제곱근 변환 등)을 할 때 사용됨.머신러닝, 신호 처리, 경제 모델링 등 다양한 분야에서 활용됨.확률 밀도 함수(PDF) 변환만약 확률 변수 X가 주어졌을 때, 새로운 확률 변수 Y를 다음과 같이 변환한다고 하자: 이때, Y의 확률 밀도 함수(PDF) fY(y)를 구하려면 다음 공식을 사용해야 한다.단조 증가함수(Monotonic Increasing Function) 일 경우단조 감소 함수(Monotonic Decreasing Func..

이중 지수 분포라플라스 분포(Laplace Distribution) 또는 이중 지수 분포(Double Exponential Distribution)는 평균을 중심으로 대칭적인 확률 분포로, 데이터가 정규 분포보다 중심에 더 집중되고 꼬리가 더 두꺼운(heavy-tailed) 특징이 있다. 정규 분포(Gaussian Distribution)와 유사하지만, 중심에서 더 뾰족하고 꼬리가 두꺼운 분포.특정한 점(평균)에서 값이 급격히 변화하는 경우 모델링할 때 적합."변화가 급격하게 발생하는 데이터"를 다룰 때 사용됨. 라플라스 분포가 적용되는 예시금융 데이터(주가, 환율 변동) → 정규 분포보다 급격한 변화가 많음.자연어 처리(NLP)에서 오차 모델링 → 단어 빈도수나 감정 분석에서 활용됨.신호 처리 및 이미..