- 큐
- 그리디
- 백트래킹
- N:1
- SQL
- count
- 쟝고
- migrations
- distinct
- Tree
- outer join
- regexp
- delete
- Vue
- 트리
- 뷰
- 통계학
- DB
- Queue
- 스택
- Django
- create
- update
- Article & User
- drf
- ORM
- stack
- 완전검색
- 이진트리
- M:N
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
목록2025/03 (31)
데이터 분석 기술 블로그

균등 분포균등 분포(Uniform Distribution)는 모든 값이 동일한 확률로 발생하는 연속 확률 분포이다.즉, 주어진 범위 내에서 모든 값이 균등한 확률 밀도를 가진다. 연속형 균등 분포 U(a, b): 특정 구간 [a, b]에서 모든 값이 동일한 확률을 가지는 분포. 이산형 균등 분포와 차이점이산형 균등 분포: 특정한 개별 값만 가능 (예: 주사위 던지기 → 1,2,3,4,5,6 중 하나)연속형 균등 분포: 특정 구간 내에서 무한한 값을 가질 수 있음.확률 밀도 함수 (PDF) 모든 값이 동일한 확률 밀도를 가진다.누적 분포 함수 (CDF) 즉, x가 증가할수록 누적 확률도 선형적으로 증가한다.기댓값과 분산균등 분포의 기댓값과 분산은 다음과 같이 계산된다:균등 분포의 활용난수 생성: 컴퓨터에서..

확률 밀도 함수와 누적 분포 함수 연속 확률 변수(Continuous Random Variable)를 다룰 때는 특정 값이 아니라 구간(interval)에 대한 확률을 고려해야 한다. 이를 위해 확률 밀도 함수(PDF)와 누적 분포 함수(CDF) 개념이 필요하다.확률 밀도 함수 (Probability Density Function, PDF)확률 밀도 함수(PDF)는 연속 확률 변수의 분포를 나타내는 함수로, 특정 구간에서 확률을 구할 때 사용된다.즉, 확률이 특정 구간에 얼마나 집중되어 있는지를 나타낸다. PDF의 특징특정 값에서의 확률 P(X = x)는 항상 0 → P(a ≤ X ≤ b) 형태로 계산해야 함.확률을 구하려면 PDF를 적분해야 함.PDF의 총면적(전체 확률)은 1이 되어야 함.확률 계산 ..
연속 확률 변수와 연속 확률 분포연속 확률 변수(Continuous Random Variable)는 무한한 값의 범위에서 특정 값을 가질 확률을 다루는 확률 변수이다.이산 확률 변수(Discrete Random Variable)와 다르게, 연속 확률 변수는 특정한 개별 값을 가지는 것이 아니라 일정한 구간 내에서 값을 가진다. 연속 확률 변수의 핵심 특징:무한한 값을 가질 수 있음 (예: 키, 몸무게, 온도, 시간 등).특정 값의 확률 P(X = x)는 항상 0 (구간 내 확률을 계산해야 함).확률 밀도 함수(PDF, Probability Density Function)를 사용하여 확률을 계산.확률 질량 함수 (PMF) vs. 확률 밀도 함수 (PDF) 개념 이산 확률 변수 연속 확률 변수 확률 표현..

포아송 분포포아송 분포(Poisson Distribution)는 특정 시간 또는 공간 내에서 사건이 발생하는 횟수를 모델링하는 확률 분포이다. 일정한 시간 동안 특정 사건이 몇 번 발생하는지를 예측하는 데 사용되므로 주어진 시간 또는 공간에서 발생하는 사건의 수를 세는 데 적합하다. 예시:은행 창구에서 1시간 동안 방문하는 고객 수웹사이트에서 1분 동안 발생하는 방문자 수병원 응급실에 24시간 동안 도착하는 환자 수축구 경기에서 90분 동안 발생하는 골 수포아송 분포의 확률 질량 함수 (PMF)확률 변수가 X가 포아송 분포를 따른다면:포아송 분포의 확률 질량 함수(PMF)는:여기서:k = 사건이 발생하는 횟수 (0, 1, 2, 3,...)λ = 단위 시간(공간) 당 평균 발생 횟수e = 자연상수 (≈ 2..

기하 분포기하 분포(Geometric Distribution)는 처음으로 성공할 때까지 시행한 횟수를 모델링하는 확률 분포이다.연속된 베르누이 시행에서 처음 성공(1)이 나올 때까지 몇 번의 실패(0)를 거치는지를 나타내는 분포로 성공할 때까지 걸리는 시행 횟수를 분석할 때 사용한다.기하 분포의 확률 질량 함수 (PMF)확률 변수가 X가 기하 분포를 따른다면:기하 분포의 확률 질량 함수(PMF)는:여기서:p = 단일 시행에서 성공할 확률k = 성공이 처음 나타나는 시행의 횟수첫 성공이 k번째 시행에서 나올 확률은, k−1번의 실패 후 성공하는 경우이다.기하 분포의 누적 분포 함수 (CDF)누적 분포 함수(CDF)는 특정 값 이하에서 성공이 발생할 확률을 나타낸다.이를 계산하면: 기하 분포의 CDF 공식:..

이항 분포이항 분포(Binomial Distribution)는 베르누이 시행을 여러 번 반복했을 때 성공하는 횟수를 나타내는 확률 분포이다.이항 분포란?이항 분포는 성공/실패(binary outcome)가 존재하는 독립적인 시행을 여러 번 반복하는 경우 사용된다.각 시행은 베르누이 시행 (즉, 성공/실패의 두 가지 결과만 존재).모든 시행에서 성공 확률 p가 동일.n번의 시행 중 성공 횟수 X를 확률 변수로 가짐.이항 분포는 "반복된 베르누이 시행"에서 특정 횟수만큼 성공할 확률을 모델링한다.이항 분포의 확률 질량 함수 (PMF)확률 변수가 이항 분포를 따른다면 다음과 같이 표현된다:이때 확률 질량 함수(PMF)는:여기서:k = 성공 횟수 (우리가 구하려는 값)n = 시행 횟수 (총 몇 번 반복하는지)p..

범주형 분포범주형 분포(Categorical Distribution)는 세 개 이상의 범주를 가지는 이산 확률 분포이다.즉, 여러 개의 가능한 결과 중 하나가 발생하는 경우를 모델링하는 데 사용된다.범주형 분포란?범주형 분포는 베르누이 분포의 확장판이다.베르누이 분포: 두 가지 결과(예: 앞면 vs 뒷면)만 존재범주형 분포: 세 개 이상의 결과(예: 주사위 눈금, 여러 선택지 중 하나)확률 변수가 k개의 서로 다른 범주를 가질 때 사용한다.범주형 분포의 확률 질량 함수 (PMF)확률 변수가 X가 k개의 가능한 범주를 가질 때, 범주형 분포는 이렇게 표현된다.각 범주 i에 대한 확률은: 각 범주의 확률을 더하면 항상 1이 되어야 한다.기댓값과 분산범주형 분포의 기댓값은 개별 확률과 범주의 값을 이용해서 계..

베르누이 분포베르누이 분포(Bernoulli Distribution)는 가장 단순한 확률 분포로, 두 가지 결과(성공 또는 실패)만 가지는 실험을 나타내는 분포이다.베르누이 시행 (Bernoulli Trial)베르누이 분포는 한 번의 시행(Experiment)에서 성공 또는 실패 중 하나의 결과만 나오는 경우에 적용된다.예를 들어:동전 던지기 (앞면=1, 뒷면=0)정답을 맞힐 확률 (정답=1, 오답=0)공장에서 생산된 제품이 정상인지 불량인지 (정상=1, 불량=0)이처럼 결과가 이진(binary)으로 나뉘는 실험을 베르누이 시행(Bernoulli Trial)이라고 한다.베르누이 분포의 확률 질량 함수 (PMF)확률 변수가 X가 베르누이 분포를 따른다면:여기서:p = 성공할 확률 (0 ≤ p ≤ 1)1 −..