- 뷰
- 백트래킹
- delete
- create
- regexp
- 완전검색
- outer join
- 쟝고
- migrations
- SQL
- 큐
- count
- Article & User
- update
- M:N
- Django
- Tree
- 트리
- drf
- DB
- ORM
- 스택
- 통계학
- distinct
- stack
- 그리디
- Queue
- N:1
- Vue
- 이진트리
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
목록전체 글 (423)
데이터 분석 기술 블로그

결합 분포(Joint Distribution)와 주변 분포(Marginal Distribution)는 두 개 이상의 확률 변수가 함께 어떻게 분포하는지를 이해할 때 핵심이 되는 개념이다.결합 분포란? (Joint Distribution)결합 분포는 두 확률 변수 X와 Y가 동시에 어떤 값을 가질 확률을 나타내는 함수이다.이산형 확률 변수의 경우:이를 결합 확률 질량 함수 (Joint PMF)라고 한다. 연속형 확률 변수의 경우: 즉, 두 변수의 관계를 함께 고려하는 분포이다.주변 분포란? (Marginal Distribution)주변 분포는 다변량 확률 분포에서 특정 변수 하나만 따로 떼어내어 보는 분포이다.다른 변수의 값을 고려하지 않고, 전체 분포에서 그 변수를 "통합(integrate out)"해서..

확률 변수 변환(Change of Variables)은 주어진 확률 변수 X를 새로운 확률 변수 Y로 변환할 때의 확률 분포를 찾는 과정이다. 확률 변수 변환이 중요한 이유는:새로운 변수를 정의해서 확률 분포를 바꿔야 하는 경우가 많음.예를 들어, 데이터 변환(로그 변환, 제곱근 변환 등)을 할 때 사용됨.머신러닝, 신호 처리, 경제 모델링 등 다양한 분야에서 활용됨.확률 밀도 함수(PDF) 변환만약 확률 변수 X가 주어졌을 때, 새로운 확률 변수 Y를 다음과 같이 변환한다고 하자: 이때, Y의 확률 밀도 함수(PDF) fY(y)를 구하려면 다음 공식을 사용해야 한다.단조 증가함수(Monotonic Increasing Function) 일 경우단조 감소 함수(Monotonic Decreasing Func..

이중 지수 분포라플라스 분포(Laplace Distribution) 또는 이중 지수 분포(Double Exponential Distribution)는 평균을 중심으로 대칭적인 확률 분포로, 데이터가 정규 분포보다 중심에 더 집중되고 꼬리가 더 두꺼운(heavy-tailed) 특징이 있다. 정규 분포(Gaussian Distribution)와 유사하지만, 중심에서 더 뾰족하고 꼬리가 두꺼운 분포.특정한 점(평균)에서 값이 급격히 변화하는 경우 모델링할 때 적합."변화가 급격하게 발생하는 데이터"를 다룰 때 사용됨. 라플라스 분포가 적용되는 예시금융 데이터(주가, 환율 변동) → 정규 분포보다 급격한 변화가 많음.자연어 처리(NLP)에서 오차 모델링 → 단어 빈도수나 감정 분석에서 활용됨.신호 처리 및 이미..

정규 분포정규 분포(Normal Distribution)는 자연 현상에서 가장 많이 나타나는 확률 분포로, 데이터 분석과 통계에서 핵심적인 역할을 한다. 가우스 분포(Gaussian Distribution)라고도 불린다. 데이터가 대칭적이고 종 모양(Bell-shaped Curve)을 따르는 확률 분포.평균 근처에 값이 집중되고, 평균에서 멀어질수록 값이 드물게 나타남.중심극한정리(Central Limit Theorem, CLT)에 의해 여러 개의 독립적인 확률 변수의 합은 정규 분포를 따름. 정규 분포가 적용되는 예시사람들의 키, 몸무게, 시험 점수제조된 제품의 크기 변화 (품질 관리)주식 시장의 가격 변동기온 변화, 혈압, 심박수 등 생체 데이터정규 분포의 확률 밀도 함수 (PDF) 여기서:μ = 평..

지수 분포지수 분포(Exponential Distribution)는 어떤 사건이 발생할 때까지 걸리는 시간을 모델링하는 확률 분포이다.즉, "다음 사건이 언제 발생할 것인가?"를 예측할 때 사용된다. 사건이 연속적으로 독립적으로 발생할 때, 다음 사건이 발생하기까지의 시간을 모델링하는 분포.평균 발생률(λ\lambdaλ)을 기반으로 사건이 언제 일어날지를 예측. 지수 분포가 적용되는 예시버스가 도착할 때까지의 대기 시간콜센터에서 다음 전화가 걸려오기까지의 시간방사성 물질이 붕괴되기까지 걸리는 시간기계가 고장 나기까지의 시간 (수명 분석)확률 밀도 함수 (PDF) 여기서:λ = 사건이 단위 시간당 발생하는 평균 횟수 (rate parameter)x = 사건이 발생할 때까지의 시간 지수 분포는 시간이 지날수..

균등 분포균등 분포(Uniform Distribution)는 모든 값이 동일한 확률로 발생하는 연속 확률 분포이다.즉, 주어진 범위 내에서 모든 값이 균등한 확률 밀도를 가진다. 연속형 균등 분포 U(a, b): 특정 구간 [a, b]에서 모든 값이 동일한 확률을 가지는 분포. 이산형 균등 분포와 차이점이산형 균등 분포: 특정한 개별 값만 가능 (예: 주사위 던지기 → 1,2,3,4,5,6 중 하나)연속형 균등 분포: 특정 구간 내에서 무한한 값을 가질 수 있음.확률 밀도 함수 (PDF) 모든 값이 동일한 확률 밀도를 가진다.누적 분포 함수 (CDF) 즉, x가 증가할수록 누적 확률도 선형적으로 증가한다.기댓값과 분산균등 분포의 기댓값과 분산은 다음과 같이 계산된다:균등 분포의 활용난수 생성: 컴퓨터에서..

확률 밀도 함수와 누적 분포 함수 연속 확률 변수(Continuous Random Variable)를 다룰 때는 특정 값이 아니라 구간(interval)에 대한 확률을 고려해야 한다. 이를 위해 확률 밀도 함수(PDF)와 누적 분포 함수(CDF) 개념이 필요하다.확률 밀도 함수 (Probability Density Function, PDF)확률 밀도 함수(PDF)는 연속 확률 변수의 분포를 나타내는 함수로, 특정 구간에서 확률을 구할 때 사용된다.즉, 확률이 특정 구간에 얼마나 집중되어 있는지를 나타낸다. PDF의 특징특정 값에서의 확률 P(X = x)는 항상 0 → P(a ≤ X ≤ b) 형태로 계산해야 함.확률을 구하려면 PDF를 적분해야 함.PDF의 총면적(전체 확률)은 1이 되어야 함.확률 계산 ..
연속 확률 변수와 연속 확률 분포연속 확률 변수(Continuous Random Variable)는 무한한 값의 범위에서 특정 값을 가질 확률을 다루는 확률 변수이다.이산 확률 변수(Discrete Random Variable)와 다르게, 연속 확률 변수는 특정한 개별 값을 가지는 것이 아니라 일정한 구간 내에서 값을 가진다. 연속 확률 변수의 핵심 특징:무한한 값을 가질 수 있음 (예: 키, 몸무게, 온도, 시간 등).특정 값의 확률 P(X = x)는 항상 0 (구간 내 확률을 계산해야 함).확률 밀도 함수(PDF, Probability Density Function)를 사용하여 확률을 계산.확률 질량 함수 (PMF) vs. 확률 밀도 함수 (PDF) 개념 이산 확률 변수 연속 확률 변수 확률 표현..