- Article & User
- 이진트리
- outer join
- stack
- 백트래킹
- ORM
- 쟝고
- 완전검색
- migrations
- M:N
- create
- 뷰
- regexp
- DB
- count
- Queue
- Tree
- distinct
- drf
- 스택
- 트리
- delete
- SQL
- Django
- N:1
- 큐
- update
- Vue
- 통계학
- 그리디
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
목록전체 글 (372)
데이터 분석 기술 블로그

정규 분포정규 분포(Normal Distribution)는 자연 현상에서 가장 많이 나타나는 확률 분포로, 데이터 분석과 통계에서 핵심적인 역할을 한다. 가우스 분포(Gaussian Distribution)라고도 불린다. 데이터가 대칭적이고 종 모양(Bell-shaped Curve)을 따르는 확률 분포.평균 근처에 값이 집중되고, 평균에서 멀어질수록 값이 드물게 나타남.중심극한정리(Central Limit Theorem, CLT)에 의해 여러 개의 독립적인 확률 변수의 합은 정규 분포를 따름. 정규 분포가 적용되는 예시사람들의 키, 몸무게, 시험 점수제조된 제품의 크기 변화 (품질 관리)주식 시장의 가격 변동기온 변화, 혈압, 심박수 등 생체 데이터정규 분포의 확률 밀도 함수 (PDF) 여기서:μ = 평..

지수 분포지수 분포(Exponential Distribution)는 어떤 사건이 발생할 때까지 걸리는 시간을 모델링하는 확률 분포이다.즉, "다음 사건이 언제 발생할 것인가?"를 예측할 때 사용된다. 사건이 연속적으로 독립적으로 발생할 때, 다음 사건이 발생하기까지의 시간을 모델링하는 분포.평균 발생률(λ\lambdaλ)을 기반으로 사건이 언제 일어날지를 예측. 지수 분포가 적용되는 예시버스가 도착할 때까지의 대기 시간콜센터에서 다음 전화가 걸려오기까지의 시간방사성 물질이 붕괴되기까지 걸리는 시간기계가 고장 나기까지의 시간 (수명 분석)확률 밀도 함수 (PDF) 여기서:λ = 사건이 단위 시간당 발생하는 평균 횟수 (rate parameter)x = 사건이 발생할 때까지의 시간 지수 분포는 시간이 지날수..

균등 분포균등 분포(Uniform Distribution)는 모든 값이 동일한 확률로 발생하는 연속 확률 분포이다.즉, 주어진 범위 내에서 모든 값이 균등한 확률 밀도를 가진다. 연속형 균등 분포 U(a, b): 특정 구간 [a, b]에서 모든 값이 동일한 확률을 가지는 분포. 이산형 균등 분포와 차이점이산형 균등 분포: 특정한 개별 값만 가능 (예: 주사위 던지기 → 1,2,3,4,5,6 중 하나)연속형 균등 분포: 특정 구간 내에서 무한한 값을 가질 수 있음.확률 밀도 함수 (PDF) 모든 값이 동일한 확률 밀도를 가진다.누적 분포 함수 (CDF) 즉, x가 증가할수록 누적 확률도 선형적으로 증가한다.기댓값과 분산균등 분포의 기댓값과 분산은 다음과 같이 계산된다:균등 분포의 활용난수 생성: 컴퓨터에서..

확률 밀도 함수와 누적 분포 함수 연속 확률 변수(Continuous Random Variable)를 다룰 때는 특정 값이 아니라 구간(interval)에 대한 확률을 고려해야 한다. 이를 위해 확률 밀도 함수(PDF)와 누적 분포 함수(CDF) 개념이 필요하다.확률 밀도 함수 (Probability Density Function, PDF)확률 밀도 함수(PDF)는 연속 확률 변수의 분포를 나타내는 함수로, 특정 구간에서 확률을 구할 때 사용된다.즉, 확률이 특정 구간에 얼마나 집중되어 있는지를 나타낸다. PDF의 특징특정 값에서의 확률 P(X = x)는 항상 0 → P(a ≤ X ≤ b) 형태로 계산해야 함.확률을 구하려면 PDF를 적분해야 함.PDF의 총면적(전체 확률)은 1이 되어야 함.확률 계산 ..
연속 확률 변수와 연속 확률 분포연속 확률 변수(Continuous Random Variable)는 무한한 값의 범위에서 특정 값을 가질 확률을 다루는 확률 변수이다.이산 확률 변수(Discrete Random Variable)와 다르게, 연속 확률 변수는 특정한 개별 값을 가지는 것이 아니라 일정한 구간 내에서 값을 가진다. 연속 확률 변수의 핵심 특징:무한한 값을 가질 수 있음 (예: 키, 몸무게, 온도, 시간 등).특정 값의 확률 P(X = x)는 항상 0 (구간 내 확률을 계산해야 함).확률 밀도 함수(PDF, Probability Density Function)를 사용하여 확률을 계산.확률 질량 함수 (PMF) vs. 확률 밀도 함수 (PDF) 개념 이산 확률 변수 연속 확률 변수 확률 표현..

포아송 분포포아송 분포(Poisson Distribution)는 특정 시간 또는 공간 내에서 사건이 발생하는 횟수를 모델링하는 확률 분포이다. 일정한 시간 동안 특정 사건이 몇 번 발생하는지를 예측하는 데 사용되므로 주어진 시간 또는 공간에서 발생하는 사건의 수를 세는 데 적합하다. 예시:은행 창구에서 1시간 동안 방문하는 고객 수웹사이트에서 1분 동안 발생하는 방문자 수병원 응급실에 24시간 동안 도착하는 환자 수축구 경기에서 90분 동안 발생하는 골 수포아송 분포의 확률 질량 함수 (PMF)확률 변수가 X가 포아송 분포를 따른다면:포아송 분포의 확률 질량 함수(PMF)는:여기서:k = 사건이 발생하는 횟수 (0, 1, 2, 3,...)λ = 단위 시간(공간) 당 평균 발생 횟수e = 자연상수 (≈ 2..

기하 분포기하 분포(Geometric Distribution)는 처음으로 성공할 때까지 시행한 횟수를 모델링하는 확률 분포이다.연속된 베르누이 시행에서 처음 성공(1)이 나올 때까지 몇 번의 실패(0)를 거치는지를 나타내는 분포로 성공할 때까지 걸리는 시행 횟수를 분석할 때 사용한다.기하 분포의 확률 질량 함수 (PMF)확률 변수가 X가 기하 분포를 따른다면:기하 분포의 확률 질량 함수(PMF)는:여기서:p = 단일 시행에서 성공할 확률k = 성공이 처음 나타나는 시행의 횟수첫 성공이 k번째 시행에서 나올 확률은, k−1번의 실패 후 성공하는 경우이다.기하 분포의 누적 분포 함수 (CDF)누적 분포 함수(CDF)는 특정 값 이하에서 성공이 발생할 확률을 나타낸다.이를 계산하면: 기하 분포의 CDF 공식:..

이항 분포이항 분포(Binomial Distribution)는 베르누이 시행을 여러 번 반복했을 때 성공하는 횟수를 나타내는 확률 분포이다.이항 분포란?이항 분포는 성공/실패(binary outcome)가 존재하는 독립적인 시행을 여러 번 반복하는 경우 사용된다.각 시행은 베르누이 시행 (즉, 성공/실패의 두 가지 결과만 존재).모든 시행에서 성공 확률 p가 동일.n번의 시행 중 성공 횟수 X를 확률 변수로 가짐.이항 분포는 "반복된 베르누이 시행"에서 특정 횟수만큼 성공할 확률을 모델링한다.이항 분포의 확률 질량 함수 (PMF)확률 변수가 이항 분포를 따른다면 다음과 같이 표현된다:이때 확률 질량 함수(PMF)는:여기서:k = 성공 횟수 (우리가 구하려는 값)n = 시행 횟수 (총 몇 번 반복하는지)p..