- create
- DB
- 그리디
- Tree
- SQL
- count
- 뷰
- Django
- 트리
- 통계학
- 스택
- 이진트리
- Article & User
- update
- distinct
- Queue
- delete
- 쟝고
- 완전검색
- 백트래킹
- 큐
- outer join
- drf
- Vue
- stack
- ORM
- N:1
- M:N
- migrations
- regexp
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
목록전체 글 (370)
데이터 분석 기술 블로그

Independence (독립성)확률 변수 X와 Y가 독립(independent)이라는 것은 한 변수가 다른 변수의 값에 전혀 영향을 주지 않는다는 의미이다.독립의 정의 (이산형/연속형 공통)확률 변수 X와 Y가 독립이려면, 모든 x, y에 대해 다음이 성립해야 한다: 또는 연속형 확률 변수라면: 즉, 결합 확률(또는 밀도)이 각 변수의 곱으로 표현될 수 있으면 독립이다.조건부 확률로 보는 독립또는 이렇게도 표현 가능하다: 조건부 확률이 원래 확률과 같으면 → 정보가 추가돼도 변하지 않음 → 독립독립 vs 상관관계독립 ⇒ 상관없음 (correlation = 0)BUT 상관 없음 ⇏ 독립예제 1: 이산형 독립 여부 확인 X \ Y 12310.20.30.520.30.20.5합0.50.51.0 따라서 X와 Y..

조건부 분포란?조건부 분포는 어떤 사건이 발생했다고 가정할 때, 다른 확률 변수의 분포를 의미한다. 이산형 조건부 확률: 연속형 조건부 밀도 함수: 분모는 조건의 주변 분포,분자는 조건과 대상이 함께 일어나는 결합 분포.조건부 분포의 해석조건부 분포는 두 변수 간의 의존성 또는 인과성을 분석할 때 핵심 역할을 한다. 예:P(질병 ∣ 검사 = 양성)P(고객이탈 ∣ 최근방문횟수 = 낮음)베이즈 정리 (Bayes’ Rule)2025.02.20 - [데이터 사이언스/수리 통계학] - Bayes' Rule (베이즈 정리) Bayes' Rule (베이즈 정리)베이즈 정리베이즈 정리(Bayes’ Rule)는 새로운 정보를 반영하여 확률을 업데이트하는 방법이다. 즉, 어떤 사건이 발생한 후, 그 원인이 특정 사건일 확..

이변량 정규 분포의 정의두 확률 변수 X, Y가 다음과 같은 이변량 정규 분포를 따른다고 하자:여기서:주변 분포의 형태이변량 정규 분포에서 주변 분포도 정규 분포를 따름. X의 주변 분포는: Y의 주변 분포는: 상관 계수 ρ는 주변 분포에는 영향을 주지 않음.단지 X와 Y가 함께 어떻게 움직이는지 (공분산 구조)에만 영향.예제이때 X와 Y의 주변 분포를 각각 구하라.

결합 분포(Joint Distribution)와 주변 분포(Marginal Distribution)는 두 개 이상의 확률 변수가 함께 어떻게 분포하는지를 이해할 때 핵심이 되는 개념이다.결합 분포란? (Joint Distribution)결합 분포는 두 확률 변수 X와 Y가 동시에 어떤 값을 가질 확률을 나타내는 함수이다.이산형 확률 변수의 경우:이를 결합 확률 질량 함수 (Joint PMF)라고 한다. 연속형 확률 변수의 경우: 즉, 두 변수의 관계를 함께 고려하는 분포이다.주변 분포란? (Marginal Distribution)주변 분포는 다변량 확률 분포에서 특정 변수 하나만 따로 떼어내어 보는 분포이다.다른 변수의 값을 고려하지 않고, 전체 분포에서 그 변수를 "통합(integrate out)"해서..

확률 변수 변환(Change of Variables)은 주어진 확률 변수 X를 새로운 확률 변수 Y로 변환할 때의 확률 분포를 찾는 과정이다. 확률 변수 변환이 중요한 이유는:새로운 변수를 정의해서 확률 분포를 바꿔야 하는 경우가 많음.예를 들어, 데이터 변환(로그 변환, 제곱근 변환 등)을 할 때 사용됨.머신러닝, 신호 처리, 경제 모델링 등 다양한 분야에서 활용됨.확률 밀도 함수(PDF) 변환만약 확률 변수 X가 주어졌을 때, 새로운 확률 변수 Y를 다음과 같이 변환한다고 하자: 이때, Y의 확률 밀도 함수(PDF) fY(y)를 구하려면 다음 공식을 사용해야 한다.단조 증가함수(Monotonic Increasing Function) 일 경우단조 감소 함수(Monotonic Decreasing Func..

이중 지수 분포라플라스 분포(Laplace Distribution) 또는 이중 지수 분포(Double Exponential Distribution)는 평균을 중심으로 대칭적인 확률 분포로, 데이터가 정규 분포보다 중심에 더 집중되고 꼬리가 더 두꺼운(heavy-tailed) 특징이 있다. 정규 분포(Gaussian Distribution)와 유사하지만, 중심에서 더 뾰족하고 꼬리가 두꺼운 분포.특정한 점(평균)에서 값이 급격히 변화하는 경우 모델링할 때 적합."변화가 급격하게 발생하는 데이터"를 다룰 때 사용됨. 라플라스 분포가 적용되는 예시금융 데이터(주가, 환율 변동) → 정규 분포보다 급격한 변화가 많음.자연어 처리(NLP)에서 오차 모델링 → 단어 빈도수나 감정 분석에서 활용됨.신호 처리 및 이미..

정규 분포정규 분포(Normal Distribution)는 자연 현상에서 가장 많이 나타나는 확률 분포로, 데이터 분석과 통계에서 핵심적인 역할을 한다. 가우스 분포(Gaussian Distribution)라고도 불린다. 데이터가 대칭적이고 종 모양(Bell-shaped Curve)을 따르는 확률 분포.평균 근처에 값이 집중되고, 평균에서 멀어질수록 값이 드물게 나타남.중심극한정리(Central Limit Theorem, CLT)에 의해 여러 개의 독립적인 확률 변수의 합은 정규 분포를 따름. 정규 분포가 적용되는 예시사람들의 키, 몸무게, 시험 점수제조된 제품의 크기 변화 (품질 관리)주식 시장의 가격 변동기온 변화, 혈압, 심박수 등 생체 데이터정규 분포의 확률 밀도 함수 (PDF) 여기서:μ = 평..

지수 분포지수 분포(Exponential Distribution)는 어떤 사건이 발생할 때까지 걸리는 시간을 모델링하는 확률 분포이다.즉, "다음 사건이 언제 발생할 것인가?"를 예측할 때 사용된다. 사건이 연속적으로 독립적으로 발생할 때, 다음 사건이 발생하기까지의 시간을 모델링하는 분포.평균 발생률(λ\lambdaλ)을 기반으로 사건이 언제 일어날지를 예측. 지수 분포가 적용되는 예시버스가 도착할 때까지의 대기 시간콜센터에서 다음 전화가 걸려오기까지의 시간방사성 물질이 붕괴되기까지 걸리는 시간기계가 고장 나기까지의 시간 (수명 분석)확률 밀도 함수 (PDF) 여기서:λ = 사건이 단위 시간당 발생하는 평균 횟수 (rate parameter)x = 사건이 발생할 때까지의 시간 지수 분포는 시간이 지날수..