일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 수명예측 인공지능
- 데이터문해력
- Python
- GA4
- 구글애널리틱스
- 구글애널리틱스4
- 프로그래머스
- 기사스크랩
- 얼음여왕
- 감사인사
- 코딩
- 데이터 분석
- 독서
- 니다
- 6시 기상
- 미라클 모닝
- 명상
- 티스토리
- GA
- ㅂㅂ
- 채용공고
- 알파줄거리
- 벚꽃개화시기
- 영화 올드 줄거리
- Google Analytics
- 벚꽃
- 코오롱베네트
Archives
- Today
- Total
Data Analyst KIM
[SQL] 실제 기업의 매출 데이터의 구성 요소 알아보기 본문
반응형
실제 매출데이터라면 어떻게 구성되어 있을까?
문자열(고정값) ==> sum 불가능
- 카테고리
- 상품번호
- 매출발생위치(지역,플랫폼,...)
- 매출발생성격(B2B/B2C,Lage/Middle/Small)
- 날짜
숫자열(변동값) ==> sum 가능
- 거래액(gmv등)
- 매출액(sale 등)
- 영업이익(profit 등)
- 매출원가(cost,cogs 등)
- 판매수량(quantity,unit_sold 등)
- 할인금액(discount 등)
<데이터 탐색>
- 2022년 동안, 월별 총 매출액은?(1,2,...,12월 순으로 정렬)
- 2017~2022년 동안의 매출액은? 어느 해가 가장 크게 성장하였는가? 등등
- 2022년 카테고리별 매출액은? 가장 거래액이 큰 카테고리로 정렬한다면?
<다른 툴과 연계해서 심화분석>
- 카테고리별 월 매출액을 추출하고, 특정 시기에 매출이 증가하는 카테고리는 어디인지 그 반대는 어디인지?
- 연간 매출액 성장률이 가장 가파른 카테고리는?
- 반대로 성장률이 마이너스거나 미비한 카테고리는?
문자열과 숫자열로 나뉘어지고 sum을 했을 때 가능한, 즉 의미가 있는 데이터를 숫자열로 생각한다.
기본적인 데이터 탐색을 진행을 하고 다른 툴과 연계해서 심화분석을 진행한다면 더 좋은 분석을 하는데 기여를 할 수 있을 것이다.
오늘은 실제 기업의 매출데이터의 구성에 대해서 공부를 해봤다.
다양한 데이터를 접해보면서 핸들링을 한다면 도움이 될 것이다.
반응형
'데이터 분석 > SQL' 카테고리의 다른 글
[SQL] 데이터 가공하기(case when, cast, concat, join) (0) | 2023.06.27 |
---|---|
[프로그래머스Lv.2] 3월에 태어난 여성 회원 목록 출력하기 (0) | 2023.06.11 |
[SQL이론] SQL 기본 문법 사용 시 주의사항 (0) | 2023.05.15 |
#2. SQL을 이용하여 거래액 데이터 분석(select,from,where,groupby,having,orderby) (0) | 2023.05.10 |
[SQL] #1. SQL의 개념과 설치 (0) | 2023.05.09 |