- update
- ORM
- count
- outer join
- stack
- 뷰
- create
- 통계학
- Article & User
- 트리
- Queue
- SQL
- Vue
- 쟝고
- 스택
- migrations
- DB
- 백트래킹
- M:N
- N:1
- Django
- distinct
- 이진트리
- 완전검색
- 큐
- delete
- Tree
- drf
- 그리디
- regexp
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
목록전체 글 (374)
데이터 분석 기술 블로그
pandas란?pandas는 Python에서 데이터를 다루기 위한 라이브러리입니다.엑셀, CSV, SQL 데이터 등을 쉽게 불러오고, 처리하고, 분석할 수 있도록 도와주는 도구로, 주로 데이터 분석과 머신러닝 전처리에 많이 사용됩니다.pandas의 핵심 개념pandas는 두 가지 주요 데이터 구조를 제공합니다:Series → 1차원 데이터(리스트 같은 형태)DataFrame → 2차원 테이블 형태(엑셀 같은 형태)1. Series (1차원 데이터)import pandas as pd# 리스트를 Series로 변환s = pd.Series([10, 20, 30, 40, 50])print(s)출력 결과0 101 202 303 404 50dtype: int64인덱스(0,1,2,...)와..
튜플(Tuple)이란?튜플은 리스트와 비슷하지만, 변경할 수 없는(immutable) 자료형입니다.즉, 한 번 생성되면 요소를 수정, 추가, 삭제할 수 없습니다. 소괄호 ()를 사용해서 표현합니다.튜플 기본 문법# 튜플 생성my_tuple = (10, 20, 30, 40, 50)# 값 가져오기 (리스트와 동일)print(my_tuple[0]) # 10print(my_tuple[2]) # 30print(my_tuple[-1]) # 50 (음수 인덱스 사용 가능)리스트처럼 인덱스로 접근 가능값을 변경할 수 없음 (my_tuple[0] = 100 ❌ 오류 발생)튜플의 주요 특징특징설명변경 불가능 (Immutable)값을 추가, 수정, 삭제할 수 없음리스트보다 속도가 빠름수정할 필요 없는 데이터 저장 시 유..
리스트(List)란?리스트는 여러 개의 데이터를 순서대로 저장하는 자료형입니다.대괄호 []로 감싸서 표현하며, 각 요소는 인덱스(순번)를 가지고 있습니다.리스트 기본 문법# 리스트 생성my_list = [10, 20, 30, 40, 50]# 값 가져오기 (인덱스는 0부터 시작)print(my_list[0]) # 10print(my_list[2]) # 30print(my_list[-1]) # 50 (음수 인덱스는 뒤에서부터)인덱스(index)로 값을 가져올 수 있음음수 인덱스도 사용 가능 (예: -1은 마지막 값)리스트 주요 기능기능설명예제list.append(값)리스트 끝에 값 추가my_list.append(60)list.insert(인덱스, 값)특정 위치에 값 삽입my_list.insert(1, 1..
딕셔너리(Dictionary)란?딕셔너리(dict)는 키(key)와 값(value)의 쌍으로 이루어진 데이터 구조입니다.리스트나 튜플과 달리, 순서(index)가 아니라 키를 이용해서 값을 찾는 방식입니다.딕셔너리 기본 문법# 딕셔너리 생성my_dict = { "name": "Alice", "age": 25, "city": "Seoul"}# 값 출력print(my_dict["name"]) # "Alice"print(my_dict["age"]) # 25print(my_dict["city"]) # "Seoul""name", "age", "city" → 키(key)"Alice", 25, "Seoul" → 값(value)키를 이용해 값을 가져올 수 있음 → my_dict["name"]딕셔..
os는 Python의 내장 모듈로, 운영 체제(OS: Operating System)와 상호작용할 수 있도록 도와주는 기능을 제공합니다. 주요 기능 파일 및 폴더 관리os.listdir("폴더경로") → 폴더 내 파일 리스트 가져오기os.path.join("경로", "파일명") → 운영 체제에 맞게 경로 생성환경 변수 및 시스템 정보 접근os.getenv("변수명") → 환경 변수 가져오기os.name → OS 종류 확인 (Windows: 'nt', Mac/Linux: 'posix')파일/폴더 조작os.remove("파일경로") → 파일 삭제os.makedirs("폴더경로") → 폴더 생성예제import os# 현재 작업 디렉토리 확인print(os.getcwd())# data 폴더 내 모든 파일 리스트..
코호트 분석(Cohort Analysis)란?코호트 분석은 같은 시기, 같은 조건에서 유사한 행동을 한 사용자 그룹(코호트, Cohort)의 패턴을 분석하는 방법입니다.쉽게 말해, 비슷한 시기에 가입한 사용자들이 시간이 지나면서 어떻게 행동하는지를 분석하는 기법입니다.특정 그룹의 리텐션(유지율), 구매 패턴, 전환율 변화 등을 확인할 때 사용됩니다.특히, 퍼널 분석(AARRR)과 함께 사용하면 사용자 이탈 원인을 파악하는 데 효과적입니다.왜 코호트 분석이 중요할까?신규 vs 기존 사용자 행동 비교 가능 → 어느 그룹이 더 오래 남아 있는지 확인마케팅/광고 효과 측정 가능 → 특정 캠페인 후 고객 유지율 분석제품 개선 방향 설정 가능 → 신규 유저들이 특정 시점에서 이탈하는 패턴 발견코호트 분석의 3가지 ..
A/B 테스트란?A/B 테스트는 두 가지 이상의 대안을 비교하여 어떤 것이 더 좋은 성과를 내는지 실험하는 방법입니다.실제 사용자 그룹을 랜덤하게 나누어 서로 다른 버전을 경험하게 하고, 데이터 기반으로 효과를 측정하는 것이 핵심입니다. 예를 들어, 이커머스 사이트에서 "결제 버튼의 색상이 전환율에 영향을 미칠까?"라는 가설을 검증하고 싶다면A 그룹: 기존 버튼(파란색)B 그룹: 새로운 버튼(빨간색)각 그룹의 전환율(구매 완료 비율)을 비교하여 어느 쪽이 더 효과적인지 판단A/B 테스트가 중요한 이유객관적인 데이터 기반 의사결정 가능 → 감이 아닌 실제 데이터를 활용한 최적화사용자 경험(UX) 개선 → 가장 효과적인 디자인, 콘텐츠, 프로모션을 선택 가능전환율 최적화 → 퍼널 분석과 함께 사용하면 이탈이..
AARRR 프레임워크란?AARRR은 사용자의 행동을 분석하고 비즈니스 성장을 촉진하는 데이터 기반 프레임워크입니다.스타트업과 IT 기업에서 많이 쓰이며, 사용자가 처음 유입된 후 서비스에서 어떻게 유지되고, 수익을 창출하며, 다른 사람에게 추천하는지를 단계별로 분석하는 데 활용합니다.AARRR은 Acquisition(획득), Activation(활성화), Retention(유지), Revenue(수익), Referral(추천)의 앞 글자를 따서 만들었습니다.AARRR 5단계Acquisition (획득) - 사용자는 어디서 유입되었는가?설명: 사용자가 처음 우리 서비스나 제품을 알게 되고 방문하는 단계예제:웹사이트 방문, 앱 다운로드, 광고 클릭Google, Facebook 광고를 통해 유입SEO, 바이럴..