Data Analyst KIM

[SQL] 실제 기업의 매출 데이터의 구성 요소 알아보기 본문

데이터 분석/SQL

[SQL] 실제 기업의 매출 데이터의 구성 요소 알아보기

김두연 2023. 5. 15. 21:56
반응형

 

 

실제 매출데이터라면 어떻게 구성되어 있을까?

 

문자열(고정값) ==> sum 불가능

- 카테고리

- 상품번호

- 매출발생위치(지역,플랫폼,...)

- 매출발생성격(B2B/B2C,Lage/Middle/Small)

- 날짜

 

숫자열(변동값) ==> sum 가능

- 거래액(gmv등)

- 매출액(sale 등)

- 영업이익(profit 등)

- 매출원가(cost,cogs 등)

- 판매수량(quantity,unit_sold 등)

- 할인금액(discount 등)

 

 

<데이터 탐색>

- 2022년 동안, 월별 총 매출액은?(1,2,...,12월 순으로 정렬)

- 2017~2022년 동안의 매출액은? 어느 해가 가장 크게 성장하였는가? 등등

- 2022년 카테고리별 매출액은? 가장 거래액이 큰 카테고리로 정렬한다면?

 

<다른 툴과 연계해서 심화분석>

- 카테고리별 월 매출액을 추출하고, 특정 시기에 매출이 증가하는 카테고리는 어디인지 그 반대는 어디인지?

- 연간 매출액 성장률이 가장 가파른 카테고리는?

- 반대로 성장률이 마이너스거나 미비한 카테고리는?

 

 

문자열과 숫자열로 나뉘어지고 sum을 했을 때 가능한, 즉 의미가 있는 데이터를 숫자열로 생각한다.

기본적인 데이터 탐색을 진행을 하고 다른 툴과 연계해서 심화분석을 진행한다면 더 좋은 분석을 하는데 기여를 할 수 있을 것이다.

오늘은 실제 기업의 매출데이터의 구성에 대해서 공부를 해봤다.

다양한 데이터를 접해보면서 핸들링을 한다면 도움이 될 것이다.

반응형