- 백트래킹
- stack
- Article & User
- 큐
- ORM
- 그리디
- drf
- SQL
- delete
- Queue
- N:1
- outer join
- update
- DB
- count
- 완전검색
- Django
- Tree
- 뷰
- distinct
- migrations
- Vue
- create
- regexp
- 트리
- 통계학
- 스택
- 쟝고
- M:N
- 이진트리
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
목록데이터 분석 (29)
데이터 분석 기술 블로그
LOOKUP() 함수란?LOOKUP() 함수는 현재 행(Row)에서 특정 위치에 있는 값을 가져오는 함수입니다.쉽게 말하면, 현재 위치를 기준으로 앞이나 뒤의 값을 참조하는 역할을 합니다.LOOKUP() 함수 기본 문법LOOKUP([필드명], 숫자) 인자(Arguments) 설명 필드명참조할 대상(값을 가져올 필드)숫자몇 행(Row) 앞뒤 데이터를 가져올지 결정 (음수: 이전 값, 0: 현재 값, 양수: 이후 값)
ATTR() 함수란?ATTR()(Attribute) 함수의 역할은 Tableau에서 특정 필드의 "고유한 값"을 가져오는 함수이다. 주로 데이터가 여러 값으로 나뉠 가능성이 있을 때, 단일 값인지 확인하는 용도로 사용한다. 하나의 값만 존재하면 그대로 반환, 여러 값이 있으면 * (애스터리스크) 표시한다.ATTR() 이 필요한 이유는 Funnel_Step 필드는 여러 단계(홈페이지 방문, 검색 페이지 방문 등)가 있고 ATTR(Funnel_Step)을 사용하면 단일 단계인지 확인 가능하다.
pandas란?pandas는 Python에서 데이터를 다루기 위한 라이브러리입니다.엑셀, CSV, SQL 데이터 등을 쉽게 불러오고, 처리하고, 분석할 수 있도록 도와주는 도구로, 주로 데이터 분석과 머신러닝 전처리에 많이 사용됩니다.pandas의 핵심 개념pandas는 두 가지 주요 데이터 구조를 제공합니다:Series → 1차원 데이터(리스트 같은 형태)DataFrame → 2차원 테이블 형태(엑셀 같은 형태)1. Series (1차원 데이터)import pandas as pd# 리스트를 Series로 변환s = pd.Series([10, 20, 30, 40, 50])print(s)출력 결과0 101 202 303 404 50dtype: int64인덱스(0,1,2,...)와..
튜플(Tuple)이란?튜플은 리스트와 비슷하지만, 변경할 수 없는(immutable) 자료형입니다.즉, 한 번 생성되면 요소를 수정, 추가, 삭제할 수 없습니다. 소괄호 ()를 사용해서 표현합니다.튜플 기본 문법# 튜플 생성my_tuple = (10, 20, 30, 40, 50)# 값 가져오기 (리스트와 동일)print(my_tuple[0]) # 10print(my_tuple[2]) # 30print(my_tuple[-1]) # 50 (음수 인덱스 사용 가능)리스트처럼 인덱스로 접근 가능값을 변경할 수 없음 (my_tuple[0] = 100 ❌ 오류 발생)튜플의 주요 특징특징설명변경 불가능 (Immutable)값을 추가, 수정, 삭제할 수 없음리스트보다 속도가 빠름수정할 필요 없는 데이터 저장 시 유..
리스트(List)란?리스트는 여러 개의 데이터를 순서대로 저장하는 자료형입니다.대괄호 []로 감싸서 표현하며, 각 요소는 인덱스(순번)를 가지고 있습니다.리스트 기본 문법# 리스트 생성my_list = [10, 20, 30, 40, 50]# 값 가져오기 (인덱스는 0부터 시작)print(my_list[0]) # 10print(my_list[2]) # 30print(my_list[-1]) # 50 (음수 인덱스는 뒤에서부터)인덱스(index)로 값을 가져올 수 있음음수 인덱스도 사용 가능 (예: -1은 마지막 값)리스트 주요 기능기능설명예제list.append(값)리스트 끝에 값 추가my_list.append(60)list.insert(인덱스, 값)특정 위치에 값 삽입my_list.insert(1, 1..
딕셔너리(Dictionary)란?딕셔너리(dict)는 키(key)와 값(value)의 쌍으로 이루어진 데이터 구조입니다.리스트나 튜플과 달리, 순서(index)가 아니라 키를 이용해서 값을 찾는 방식입니다.딕셔너리 기본 문법# 딕셔너리 생성my_dict = { "name": "Alice", "age": 25, "city": "Seoul"}# 값 출력print(my_dict["name"]) # "Alice"print(my_dict["age"]) # 25print(my_dict["city"]) # "Seoul""name", "age", "city" → 키(key)"Alice", 25, "Seoul" → 값(value)키를 이용해 값을 가져올 수 있음 → my_dict["name"]딕셔..
os는 Python의 내장 모듈로, 운영 체제(OS: Operating System)와 상호작용할 수 있도록 도와주는 기능을 제공합니다. 주요 기능 파일 및 폴더 관리os.listdir("폴더경로") → 폴더 내 파일 리스트 가져오기os.path.join("경로", "파일명") → 운영 체제에 맞게 경로 생성환경 변수 및 시스템 정보 접근os.getenv("변수명") → 환경 변수 가져오기os.name → OS 종류 확인 (Windows: 'nt', Mac/Linux: 'posix')파일/폴더 조작os.remove("파일경로") → 파일 삭제os.makedirs("폴더경로") → 폴더 생성예제import os# 현재 작업 디렉토리 확인print(os.getcwd())# data 폴더 내 모든 파일 리스트..
코호트 분석(Cohort Analysis)란?코호트 분석은 같은 시기, 같은 조건에서 유사한 행동을 한 사용자 그룹(코호트, Cohort)의 패턴을 분석하는 방법입니다.쉽게 말해, 비슷한 시기에 가입한 사용자들이 시간이 지나면서 어떻게 행동하는지를 분석하는 기법입니다.특정 그룹의 리텐션(유지율), 구매 패턴, 전환율 변화 등을 확인할 때 사용됩니다.특히, 퍼널 분석(AARRR)과 함께 사용하면 사용자 이탈 원인을 파악하는 데 효과적입니다.왜 코호트 분석이 중요할까?신규 vs 기존 사용자 행동 비교 가능 → 어느 그룹이 더 오래 남아 있는지 확인마케팅/광고 효과 측정 가능 → 특정 캠페인 후 고객 유지율 분석제품 개선 방향 설정 가능 → 신규 유저들이 특정 시점에서 이탈하는 패턴 발견코호트 분석의 3가지 ..