- regexp
- migrations
- distinct
- M:N
- 트리
- 이진트리
- create
- 스택
- 큐
- update
- delete
- drf
- stack
- ORM
- 쟝고
- Tree
- Article & User
- 백트래킹
- 통계학
- Django
- count
- 뷰
- SQL
- outer join
- DB
- N:1
- Queue
- Vue
- 완전검색
- 그리디
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
목록데이터 사이언스/수리 통계학 (59)
데이터 분석 기술 블로그

조건부 분포란?조건부 분포는 어떤 사건이 발생했다고 가정할 때, 다른 확률 변수의 분포를 의미한다. 이산형 조건부 확률: 연속형 조건부 밀도 함수: 분모는 조건의 주변 분포,분자는 조건과 대상이 함께 일어나는 결합 분포.조건부 분포의 해석조건부 분포는 두 변수 간의 의존성 또는 인과성을 분석할 때 핵심 역할을 한다. 예:P(질병 ∣ 검사 = 양성)P(고객이탈 ∣ 최근방문횟수 = 낮음)베이즈 정리 (Bayes’ Rule)2025.02.20 - [데이터 사이언스/수리 통계학] - Bayes' Rule (베이즈 정리) Bayes' Rule (베이즈 정리)베이즈 정리베이즈 정리(Bayes’ Rule)는 새로운 정보를 반영하여 확률을 업데이트하는 방법이다. 즉, 어떤 사건이 발생한 후, 그 원인이 특정 사건일 확..

이변량 정규 분포의 정의두 확률 변수 X, Y가 다음과 같은 이변량 정규 분포를 따른다고 하자:여기서:주변 분포의 형태이변량 정규 분포에서 주변 분포도 정규 분포를 따름. X의 주변 분포는: Y의 주변 분포는: 상관 계수 ρ는 주변 분포에는 영향을 주지 않음.단지 X와 Y가 함께 어떻게 움직이는지 (공분산 구조)에만 영향.예제이때 X와 Y의 주변 분포를 각각 구하라.

결합 분포(Joint Distribution)와 주변 분포(Marginal Distribution)는 두 개 이상의 확률 변수가 함께 어떻게 분포하는지를 이해할 때 핵심이 되는 개념이다.결합 분포란? (Joint Distribution)결합 분포는 두 확률 변수 X와 Y가 동시에 어떤 값을 가질 확률을 나타내는 함수이다.이산형 확률 변수의 경우:이를 결합 확률 질량 함수 (Joint PMF)라고 한다. 연속형 확률 변수의 경우: 즉, 두 변수의 관계를 함께 고려하는 분포이다.주변 분포란? (Marginal Distribution)주변 분포는 다변량 확률 분포에서 특정 변수 하나만 따로 떼어내어 보는 분포이다.다른 변수의 값을 고려하지 않고, 전체 분포에서 그 변수를 "통합(integrate out)"해서..

확률 변수 변환(Change of Variables)은 주어진 확률 변수 X를 새로운 확률 변수 Y로 변환할 때의 확률 분포를 찾는 과정이다. 확률 변수 변환이 중요한 이유는:새로운 변수를 정의해서 확률 분포를 바꿔야 하는 경우가 많음.예를 들어, 데이터 변환(로그 변환, 제곱근 변환 등)을 할 때 사용됨.머신러닝, 신호 처리, 경제 모델링 등 다양한 분야에서 활용됨.확률 밀도 함수(PDF) 변환만약 확률 변수 X가 주어졌을 때, 새로운 확률 변수 Y를 다음과 같이 변환한다고 하자: 이때, Y의 확률 밀도 함수(PDF) fY(y)를 구하려면 다음 공식을 사용해야 한다.단조 증가함수(Monotonic Increasing Function) 일 경우단조 감소 함수(Monotonic Decreasing Func..

이중 지수 분포라플라스 분포(Laplace Distribution) 또는 이중 지수 분포(Double Exponential Distribution)는 평균을 중심으로 대칭적인 확률 분포로, 데이터가 정규 분포보다 중심에 더 집중되고 꼬리가 더 두꺼운(heavy-tailed) 특징이 있다. 정규 분포(Gaussian Distribution)와 유사하지만, 중심에서 더 뾰족하고 꼬리가 두꺼운 분포.특정한 점(평균)에서 값이 급격히 변화하는 경우 모델링할 때 적합."변화가 급격하게 발생하는 데이터"를 다룰 때 사용됨. 라플라스 분포가 적용되는 예시금융 데이터(주가, 환율 변동) → 정규 분포보다 급격한 변화가 많음.자연어 처리(NLP)에서 오차 모델링 → 단어 빈도수나 감정 분석에서 활용됨.신호 처리 및 이미..

정규 분포정규 분포(Normal Distribution)는 자연 현상에서 가장 많이 나타나는 확률 분포로, 데이터 분석과 통계에서 핵심적인 역할을 한다. 가우스 분포(Gaussian Distribution)라고도 불린다. 데이터가 대칭적이고 종 모양(Bell-shaped Curve)을 따르는 확률 분포.평균 근처에 값이 집중되고, 평균에서 멀어질수록 값이 드물게 나타남.중심극한정리(Central Limit Theorem, CLT)에 의해 여러 개의 독립적인 확률 변수의 합은 정규 분포를 따름. 정규 분포가 적용되는 예시사람들의 키, 몸무게, 시험 점수제조된 제품의 크기 변화 (품질 관리)주식 시장의 가격 변동기온 변화, 혈압, 심박수 등 생체 데이터정규 분포의 확률 밀도 함수 (PDF) 여기서:μ = 평..

지수 분포지수 분포(Exponential Distribution)는 어떤 사건이 발생할 때까지 걸리는 시간을 모델링하는 확률 분포이다.즉, "다음 사건이 언제 발생할 것인가?"를 예측할 때 사용된다. 사건이 연속적으로 독립적으로 발생할 때, 다음 사건이 발생하기까지의 시간을 모델링하는 분포.평균 발생률(λ\lambdaλ)을 기반으로 사건이 언제 일어날지를 예측. 지수 분포가 적용되는 예시버스가 도착할 때까지의 대기 시간콜센터에서 다음 전화가 걸려오기까지의 시간방사성 물질이 붕괴되기까지 걸리는 시간기계가 고장 나기까지의 시간 (수명 분석)확률 밀도 함수 (PDF) 여기서:λ = 사건이 단위 시간당 발생하는 평균 횟수 (rate parameter)x = 사건이 발생할 때까지의 시간 지수 분포는 시간이 지날수..

균등 분포균등 분포(Uniform Distribution)는 모든 값이 동일한 확률로 발생하는 연속 확률 분포이다.즉, 주어진 범위 내에서 모든 값이 균등한 확률 밀도를 가진다. 연속형 균등 분포 U(a, b): 특정 구간 [a, b]에서 모든 값이 동일한 확률을 가지는 분포. 이산형 균등 분포와 차이점이산형 균등 분포: 특정한 개별 값만 가능 (예: 주사위 던지기 → 1,2,3,4,5,6 중 하나)연속형 균등 분포: 특정 구간 내에서 무한한 값을 가질 수 있음.확률 밀도 함수 (PDF) 모든 값이 동일한 확률 밀도를 가진다.누적 분포 함수 (CDF) 즉, x가 증가할수록 누적 확률도 선형적으로 증가한다.기댓값과 분산균등 분포의 기댓값과 분산은 다음과 같이 계산된다:균등 분포의 활용난수 생성: 컴퓨터에서..