일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Python
- 벚꽃
- 프로그래머스
- 미라클 모닝
- 알파줄거리
- 데이터문해력
- 수명예측 인공지능
- GA
- 얼음여왕
- 영화 올드 줄거리
- 니다
- 벚꽃개화시기
- 데이터 분석
- 6시 기상
- 코오롱베네트
- 독서
- ㅂㅂ
- Google Analytics
- 구글애널리틱스
- GA4
- 코딩
- 티스토리
- 채용공고
- 구글애널리틱스4
- 기사스크랩
- 감사인사
- 명상
Archives
- Today
- Total
Data Analyst KIM
[SQL] 실제 기업의 매출 데이터의 구성 요소 알아보기 본문
반응형
실제 매출데이터라면 어떻게 구성되어 있을까?
문자열(고정값) ==> sum 불가능
- 카테고리
- 상품번호
- 매출발생위치(지역,플랫폼,...)
- 매출발생성격(B2B/B2C,Lage/Middle/Small)
- 날짜
숫자열(변동값) ==> sum 가능
- 거래액(gmv등)
- 매출액(sale 등)
- 영업이익(profit 등)
- 매출원가(cost,cogs 등)
- 판매수량(quantity,unit_sold 등)
- 할인금액(discount 등)
<데이터 탐색>
- 2022년 동안, 월별 총 매출액은?(1,2,...,12월 순으로 정렬)
- 2017~2022년 동안의 매출액은? 어느 해가 가장 크게 성장하였는가? 등등
- 2022년 카테고리별 매출액은? 가장 거래액이 큰 카테고리로 정렬한다면?
<다른 툴과 연계해서 심화분석>
- 카테고리별 월 매출액을 추출하고, 특정 시기에 매출이 증가하는 카테고리는 어디인지 그 반대는 어디인지?
- 연간 매출액 성장률이 가장 가파른 카테고리는?
- 반대로 성장률이 마이너스거나 미비한 카테고리는?
문자열과 숫자열로 나뉘어지고 sum을 했을 때 가능한, 즉 의미가 있는 데이터를 숫자열로 생각한다.
기본적인 데이터 탐색을 진행을 하고 다른 툴과 연계해서 심화분석을 진행한다면 더 좋은 분석을 하는데 기여를 할 수 있을 것이다.
오늘은 실제 기업의 매출데이터의 구성에 대해서 공부를 해봤다.
다양한 데이터를 접해보면서 핸들링을 한다면 도움이 될 것이다.
반응형
'데이터 분석 > Python | SQL | BI Tools' 카테고리의 다른 글
[로지스틱 회귀분석] 유방암 데이터를 이용해서 모델링 (0) | 2023.05.30 |
---|---|
[Markdown] 주피터 노트북 마크다운 정리(feat.슈퍼짱짱님) (0) | 2023.05.23 |
[SQL이론] SQL 기본 문법 사용 시 주의사항 (0) | 2023.05.15 |
[Power BI] 요일별 산불 피해 데이터를 시각화하여 패턴 찾아보기 (0) | 2023.05.11 |
#2. SQL을 이용하여 거래액 데이터 분석(select,from,where,groupby,having,orderby) (0) | 2023.05.10 |