본문으로 바로가기

04. 데이터 분석의 정석

category Data Analyst 2021. 7. 28. 11:24
반응형

[데이터 분석 프로세스]

  1. 질문 던지기, 가설 수립
  2. 데이터 전처리
  3. 데이터 탐색하기
  4. Deep-Dive 분석으로 결론 이끌어내기
  5. 분석 결과 커뮤니케이션

STEP 1. 질문 던지기, 가설 수립

나의 비즈니스가 갖고 있는 문제가 뭐지?
쇼핑몰 남성패션 영업관리 상황 가정
  • 남성 패션 층의 브랜드와 매출을 관리
  • A ~ H 까지 8개의 브랜드가 입점한 상태, 두달전 층 리뉴얼

쇼핑몰의 경우, 오프라인과 온라인의 경계가 무너지는 추세 = 고객의 경험을 극대화가 목표로 바뀜

🤔리뉴얼 이후 매출은 변화가 없는데, 고객 경험은 매출의 경향성과 다르게 나타날 수 있을 것이다.

1. 특별한 변화가 없는데 대시보드에서 매출액이 확 증가하는 경우도 있다. = 쪼개서 살펴본다

2. 변화를 적용한 후에 어떤 효과가 있는지 찾아보기

3. 평상시에 생각했던 것들을 가설로 잡고 분석 = 사람의 생각이 중요


STEP 2. 데이터 전처리

지금 나에게 필요한 데이터
고객들의 매장병 방문과 동선에 대한 데이터

가설 : 리뉴얼 이후 매출은 변화가 없는데 고객 경험은 매출의 경향성과 다르게 나타날 수 있을 것이다.

 

1.  데이터가 수집되고 있는가

  • 블루투스를 활용해 센서 out, 1,2,3,4,5, in 을 통해 동선을 파악한다.
  • 고객의 동선은 고객의 경험을 의미한다.

 

2.  쓸 수 있는 데이터인가

데이터 전처리 = 데이터 클렌징 = 데이터 wrangling

전처리란? 가설을 검증하기 위한 필요한 데이터를 만드는 과정
  • 데이터의 질이나 문제를 확인하고 이것을 깨끗하게 만드는 과정
  • 분석의 80%를 차지한다
  1. 결측치 (missing value)
    • 값이 비어있음 -> (주로) 평균으로 채워줌
    • 문자인 데이터 -> 최빈값으로 채워줌
  2. 중복 데이터
    • 중복 제거
  3. 부정확한 데이터 타입
    • 숫자인데 문자로 되어 있음
    • 날짜인데 문자로 되어 있음
    • 데이터 타입 적절하게 수정
  4. 이상치 (outlier)
    • 어떠한 이유로 일반적인 데이터 범위에서 크게 벗어나 있는 값
    • 많지 않다면 제거

정제되지 않은 데이터는 꼭 전처리를 거쳐 사용할 수 있게 만든다


STEP 3. 데이터 탐색하기 (Exploratory Data Analysis, EDA)

데이터를 보니 이런 특징이 있구나!
매장별 방문객, 매장별 체류시간, 요일별 방문객 리뉴얼 전 후 차이
  1. 리뉴얼 전 후 매장별 방문객 분석
    • C 매장은 리뉴얼 전이나 후나 가장 핫한 매장이구나
    • E,F,G,H는 리뉴얼 후 방문객 수가 너무 줄었네
  2. 리뉴얼 전 후 매장별 고객 체류 시간
    • 매장별로 고객 체류 시간이 차이가 날 줄 알았는데 차이가 없네? = 이 역시도 분석 결과
    • 매장 방문 불균형이 심해졌구나
  3. 요일별 방문객 수 확인
    • 목요일이 가장 적고, 금토에 가장 붐비네?
    • 월요일도 일요일만큼 사람이 많이 오네?

STEP 4. Deep-Dive 분석으로 결론 이끌어내기

가설에 맞게 상황을 더 쪼개서 보거나 모델링을 진행하는 단계
고객들의 매장병 방문객 수와 체류시간 확인 후 이슈
  • EDA에서 "리뉴얼 후 매장별 방문객은 불균형인데, 체류시간은 큰 차이가 없구나 라는" 것을 발견했다
  • 네트워크 분석으로 고객 동선을 분석해보면 좋을 것 같다.
  • 결과적으로, 리뉴얼은 매출이 크게 변하지 않았지만, 고객의 동선이 잘 이어지지 않게 만들었으므로, 하지말았어야 하는 것이었다.
  • 고객의 동선을 유도하도록 유인 장치를 만들 수 있다. (프라모델 전시 등)

STEP 5. 분석 결과 커뮤니케이션 하기

데이터 분석 과정에서 가장 중요한 단계
누구에게 결과를 전달하느냐에 따라 달라짐
  • 임원 = 보고서 작성
  • 현직자 = 대시보드

청자의 상황을 이해하는 것이 정말 중요하다.

반응형

'Data Analyst' 카테고리의 다른 글

[독서] 최근 구매한 도서  (0) 2021.11.02
데이터 분석 포트폴리오 만들기  (0) 2021.11.01
03. 데이터 분석을 배워야하는 이유  (0) 2021.07.28
데이터 분석 직무  (0) 2021.07.28
회사에서의 데이터 분석  (0) 2021.07.28