반응형
[데이터 분석 프로세스]
- 질문 던지기, 가설 수립
- 데이터 전처리
- 데이터 탐색하기
- Deep-Dive 분석으로 결론 이끌어내기
- 분석 결과 커뮤니케이션
STEP 1. 질문 던지기, 가설 수립
나의 비즈니스가 갖고 있는 문제가 뭐지?
쇼핑몰 남성패션 영업관리 상황 가정
- 남성 패션 층의 브랜드와 매출을 관리
- A ~ H 까지 8개의 브랜드가 입점한 상태, 두달전 층 리뉴얼
쇼핑몰의 경우, 오프라인과 온라인의 경계가 무너지는 추세 = 고객의 경험을 극대화가 목표로 바뀜
🤔리뉴얼 이후 매출은 변화가 없는데, 고객 경험은 매출의 경향성과 다르게 나타날 수 있을 것이다.
1. 특별한 변화가 없는데 대시보드에서 매출액이 확 증가하는 경우도 있다. = 쪼개서 살펴본다
2. 변화를 적용한 후에 어떤 효과가 있는지 찾아보기
3. 평상시에 생각했던 것들을 가설로 잡고 분석 = 사람의 생각이 중요
STEP 2. 데이터 전처리
지금 나에게 필요한 데이터
고객들의 매장병 방문과 동선에 대한 데이터
가설 : 리뉴얼 이후 매출은 변화가 없는데 고객 경험은 매출의 경향성과 다르게 나타날 수 있을 것이다.
1. 데이터가 수집되고 있는가
- 블루투스를 활용해 센서 out, 1,2,3,4,5, in 을 통해 동선을 파악한다.
- 고객의 동선은 고객의 경험을 의미한다.
2. 쓸 수 있는 데이터인가
데이터 전처리 = 데이터 클렌징 = 데이터 wrangling
전처리란? 가설을 검증하기 위한 필요한 데이터를 만드는 과정
- 데이터의 질이나 문제를 확인하고 이것을 깨끗하게 만드는 과정
- 분석의 80%를 차지한다
- 결측치 (missing value)
- 값이 비어있음 -> (주로) 평균으로 채워줌
- 문자인 데이터 -> 최빈값으로 채워줌
- 중복 데이터
- 중복 제거
- 부정확한 데이터 타입
- 숫자인데 문자로 되어 있음
- 날짜인데 문자로 되어 있음
- 데이터 타입 적절하게 수정
- 이상치 (outlier)
- 어떠한 이유로 일반적인 데이터 범위에서 크게 벗어나 있는 값
- 많지 않다면 제거
정제되지 않은 데이터는 꼭 전처리를 거쳐 사용할 수 있게 만든다
STEP 3. 데이터 탐색하기 (Exploratory Data Analysis, EDA)
데이터를 보니 이런 특징이 있구나!
매장별 방문객, 매장별 체류시간, 요일별 방문객 리뉴얼 전 후 차이
- 리뉴얼 전 후 매장별 방문객 분석
- C 매장은 리뉴얼 전이나 후나 가장 핫한 매장이구나
- E,F,G,H는 리뉴얼 후 방문객 수가 너무 줄었네
- 리뉴얼 전 후 매장별 고객 체류 시간
- 매장별로 고객 체류 시간이 차이가 날 줄 알았는데 차이가 없네? = 이 역시도 분석 결과
- 매장 방문 불균형이 심해졌구나
- 요일별 방문객 수 확인
- 목요일이 가장 적고, 금토에 가장 붐비네?
- 월요일도 일요일만큼 사람이 많이 오네?
STEP 4. Deep-Dive 분석으로 결론 이끌어내기
가설에 맞게 상황을 더 쪼개서 보거나 모델링을 진행하는 단계
고객들의 매장병 방문객 수와 체류시간 확인 후 이슈
- EDA에서 "리뉴얼 후 매장별 방문객은 불균형인데, 체류시간은 큰 차이가 없구나 라는" 것을 발견했다
- 네트워크 분석으로 고객 동선을 분석해보면 좋을 것 같다.
- 결과적으로, 리뉴얼은 매출이 크게 변하지 않았지만, 고객의 동선이 잘 이어지지 않게 만들었으므로, 하지말았어야 하는 것이었다.
- 고객의 동선을 유도하도록 유인 장치를 만들 수 있다. (프라모델 전시 등)
STEP 5. 분석 결과 커뮤니케이션 하기
데이터 분석 과정에서 가장 중요한 단계
누구에게 결과를 전달하느냐에 따라 달라짐
- 임원 = 보고서 작성
- 현직자 = 대시보드
청자의 상황을 이해하는 것이 정말 중요하다.
반응형
'Data Analyst' 카테고리의 다른 글
[독서] 최근 구매한 도서 (0) | 2021.11.02 |
---|---|
데이터 분석 포트폴리오 만들기 (0) | 2021.11.01 |
03. 데이터 분석을 배워야하는 이유 (0) | 2021.07.28 |
데이터 분석 직무 (0) | 2021.07.28 |
회사에서의 데이터 분석 (0) | 2021.07.28 |