본문 바로가기
카테고리 없음

실무 데이터 분석 시작: KPI 정의부터 데이터 정리까지 한 번에(엑셀·구글시트)

by 데일리63 2026. 3. 4.

    [ 목차 ]

엑셀이나 구글시트로 “데이터 분석”을 맡았다는 말은, 사실상 보고서(결론)를 만들어 달라는 뜻일 때가 많습니다.

그런데 막상 파일을 열어보면 데이터는 많은데 결론이 나오지 않는 경우가 흔해요.

 

제가 실무에서 가장 자주 봤던 실패 패턴은 딱 두 가지였습니다.

첫째, KPI(지표) 정의 없이 표부터 만지는 것.

둘째, 원본 데이터 구조가 분석에 부적합한 상태인데도 차트부터 그리는 것.

 

이 글에서는 초보 실무자가 바로 적용할 수 있도록 KPI 설정 → 데이터 구조 점검 → 정리 기준 → 재현 가능한 루틴을 한 번에 정리합니다.

실무 데이터 분석 시작: KPI 정의부터 데이터 정리까지 한 번에(엑셀·구글시트)
실무 데이터 분석 시작: KPI 정의부터 데이터 정리까지 한 번에(엑셀·구글시트)

1) KPI는 ‘좋아 보이는 숫자’가 아니라 의사결정 질문입니다

KPI를 정할 때 가장 빠른 방법은 “멋진 지표”를 찾는 게 아니라 의사결정 질문을 한 줄로 고정하는 겁니다. 질문이 정확하면, 필요한 데이터와 계산식이 자연스럽게 결정됩니다.

 

실무에서 자주 쓰는 질문 예시

  • 매출: “이번 달 매출이 왜 줄었지?” “어떤 상품/채널이 영향을 줬지?”
  • 마케팅: “신규 유입은 늘었는데 전환율이 왜 떨어졌지?”
  • 운영/CS: “처리 시간이 늘어난 원인은 인력 문제야, 케이스 믹스야?”
  • 제품: “신규 기능 배포 이후 이탈이 늘었나?”

예를 들어 질문이 “이번 달 신규 고객이 늘었나?”라면 KPI는 보통 다음처럼 구성됩니다.

  • 신규 고객 수(이번 달)
  • 전월 대비 증감(절대값)
  • 전월 대비 증감률(%)
  • 채널/상품/지역별 분해(원인 파악용)

여기서 중요한 포인트는 KPI가 “보고서 장식”이 아니라, 다음 행동을 정하는 기준이라는 점이에요.

KPI를 보고 “그래서 뭐 하지?”가 바로 떠오르지 않으면, 지표를 더 늘릴 게 아니라 질문을 더 선명하게 해야 합니다.

2) 분석을 망치는 가장 흔한 원인: ‘원본 데이터가 보고서용으로 꾸며진 경우’

실무 파일을 받아보면 표가 예쁘게 꾸며져 있는 경우가 많습니다.

제목이 크게 들어가고, 중간에 소계/합계가 들어가고, 병합 셀로 구역이 나뉘어 있죠.

이 형태는 “보기”에는 좋지만, 분석(집계/필터/피벗/차트)에는 최악입니다.

분석이 잘 되려면 원본 데이터는 가공용(머신이 먹기 좋은 형태)이어야 합니다.

 

원본 데이터 점검 7가지(실무에서 가장 많이 터지는 지점)

  • 헤더는 1행, 열 이름은 고정: 같은 의미의 열이 달마다 “매출/매출액/판매금액”으로 바뀌면 자동화가 불가능
  • 병합 셀 금지: 필터/정렬/피벗에서 오류의 근원이 됩니다
  • 한 열엔 한 의미: “2026-03-04 14:30”처럼 날짜+시간이 섞였으면 날짜/시간 분리 고려
  • 빈 행/구분선/소계 행 제거: 소계는 피벗이 더 정확하고 재현 가능합니다
  • 숫자 형식 통일: “10,000원”, “10000”, “₩10,000”이 섞이면 계산이 깨집니다
  • 코드값 표준화: ‘서울’, ‘서울시’, ‘SEOUL’이 섞이면 집계가 분산됩니다
  • 중복 키 확인: 주문번호/고객ID 같은 식별자가 중복되면 합산이 과대 계산될 수 있어요

실무에서는 이 점검만 제대로 해도 “왜 숫자가 안 맞지?” 같은 불필요한 소모가 크게 줄어듭니다.

특히 병합 셀, 소계 행, 숫자 형식은 초반에 정리해두지 않으면 뒤에서 두 번, 세 번 더 고치게 됩니다.

3) KPI를 계산하기 전에 ‘단위’를 먼저 합의하세요

데이터 분석에서 의외로 자주 생기는 문제는 “정답이 여러 개”인 상태입니다.

예를 들어 매출을 볼 때도 다음처럼 정의가 갈립니다.

  • 매출: 주문금액 기준? 결제완료 기준? 배송완료 기준?
  • 취소/환불: 발생일 기준? 확정일 기준?
  • 전환: 주문 1건? 결제 1건? 첫 구매 고객 수?

같은 데이터라도 정의가 다르면 결과가 달라집니다.

그래서 저는 파일 상단 또는 별도 시트에 지표 정의(Definition)를 짧게 적어두는 습관을 추천합니다.

이 한 줄이 나중에 “왜 저번 보고서랑 숫자가 달라요?”를 막아줍니다.

4) 정리(Clean)는 미관이 아니라 ‘재현성’입니다

정리의 목표는 표를 깔끔하게 만드는 게 아니라, 누가 열어도 같은 결과가 나오게 하는 것입니다.

실무에서 속도를 만드는 사람들은 대부분 구조를 단순하게 고정합니다. 제가 가장 자주 쓰는 방식은 3시트 구조입니다.

 

RAW–CLEAN–DASH 3시트 구조

  • RAW(원본): 받은 데이터를 그대로 저장(수정 최소화). “원본 보존”이 안전장치가 됩니다.
  • CLEAN(정리): 형식 통일, 결측치 처리, 중복 제거, 파생열 생성(월/주/채널 등)
  • DASH(대시보드): 피벗/차트/KPI 카드만 배치(보고용)

이 구조의 장점은 명확합니다. 다음 달 데이터가 들어오면 RAW만 바꾸고 나머지는 자동으로 갱신되게 설계할 수 있어요.

즉, 분석은 “한 번 잘 만들고 계속 재사용하는 시스템”으로 바뀝니다.

5) CLEAN 시트에서 가장 먼저 만드는 5개 파생열

원본에 없는 열을 추가하면 집계가 쉬워집니다. 초보자도 효과가 큰 파생열 5가지는 아래입니다.

  • 월(Month): 예) 2026-03 → 월별 피벗이 쉬워짐
  • 주(Week): 주간 리포트/추세 확인에 유리
  • 요일(Day of Week): 운영/CS/예약 데이터에서 패턴이 잘 보임
  • 채널 정규화(Channel): ‘네이버’, ‘Naver’, ‘naver’ 같은 값을 한 가지로 통일
  • 구분값(Category): 상품군/업무유형/문의유형 등 의사결정 단위를 만드는 열

이 파생열들은 “고급 분석”이 아니라, 피벗을 안정적으로 돌리기 위한 기초 공사라고 생각하면 됩니다.

6) 결측치·중복·이상치는 ‘초반에’ 잡아야 합니다

실무에서 데이터 품질 이슈는 뒤로 미룰수록 비용이 커져요.

보고서가 어느 정도 완성된 뒤에 결측치나 중복이 발견되면, 피벗/차트/요약문을 전부 다시 손봐야 합니다.

 

실무에서 자주 쓰는 처리 원칙

  • 결측치: 0과 공백은 의미가 다릅니다. “없음”인지 “0”인지부터 구분
  • 중복: 주문번호/티켓번호처럼 키가 있다면 중복 여부를 최우선 점검
  • 이상치: 갑자기 10배 튄 값은 “실제 이벤트”인지 “입력 오류”인지 확인

엑셀/시트에서 조건부서식만 잘 써도 결측·이상치를 빠르게 발견할 수 있습니다.

다음 편에서 이 부분을 더 구체적인 예시로 풀어드릴게요.

7) 대시보드는 ‘많이’가 아니라 ‘순서’가 중요합니다

대시보드를 만들 때 흔한 실수는 지표를 너무 많이 올리는 겁니다.

대시보드는 한 화면에서 의사결정이 가능해야 하니, 저는 보통 다음 순서를 추천합니다.

  • 1) 요약 KPI 3~5개: 매출/전환/처리시간 같은 핵심
  • 2) 추세: 월별 또는 주별 라인 차트 1~2개
  • 3) 분해: 채널/상품/지역 Top N 막대 차트
  • 4) 원인 탐색: 필터(슬라이서) 또는 세부 테이블

이 순서대로 배치하면 “숫자 → 변화 → 원인” 흐름이 자연스럽게 이어져서, 보는 사람도 이해가 빠릅니다.

오늘 바로 적용하는 10분 체크리스트

  • 분석 질문을 1줄로 적기(예: “전월 대비 전환율 하락 원인은?”)
  • KPI 3~5개만 선정(증감률 포함)
  • 원본 표에서 병합 셀/소계/빈 행 제거
  • 헤더 고정 및 열 이름 표준화
  • 날짜 형식 통일(YYYY-MM-DD)
  • 숫자 열에서 ‘원’, ‘,’ 같은 문자 제거(필요 시 별도 표시 열로 분리)
  • 분류값(채널/지역/유형) 표준화
  • RAW–CLEAN–DASH 3시트로 분리
  • CLEAN에 월/주/요일 파생열 추가
  • 피벗으로 월별 요약 1개만 먼저 완성

실무 데이터 분석 시작: KPI 정의부터 데이터 정리까지 한 번에(엑셀·구글시트)
실무 데이터 분석 시작: KPI 정의부터 데이터 정리까지 한 번에(엑셀·구글시트)

다음 글 예고

2편에서는 “좋은 데이터 표의 조건 7가지”를 더 깊게 다룹니다.

특히 실무에서 많이 터지는 결측치(0 vs 공백), 중복 키, 코드값 표준화를 예시와 함께 정리해 피벗이 안정적으로 돌아가게 만들어 드릴게요.

 

내부 연결 추천
- (2편) 좋은 데이터 표의 조건 7가지(헤더, 결측치, 중복, 코드값)
- (3편) 피벗테이블 핵심: “요약”을 제대로 만드는 5단계