Data Analyst KIM

[Power BI 특강] 1일차 - Power BI의 개념과 시각화 본문

데이터 분석/BI tools

[Power BI 특강] 1일차 - Power BI의 개념과 시각화

김두연 2023. 5. 5. 22:19
반응형

 

Power BI 특강(2023.5.5~7) 1일차  

학교에서 진행하는 프로그램(with 한국품질재단)인

Power BI 강의를 들으면서 시각화를 쉽게 하는 방법을 익혔다.

뿐만 아니라 엑셀에 대한 가장 기초적인 데이터 관리법에 대해서 설명해주셨다.

 

컴퓨터가 먹통이 되서 노트북으로 하면서 따라가기가 조금 힘들었지만

최선을 다해서 공부를 하였고 신세계를 경험했다.

 

시각화를 R이나 PYTHON에서 구현하는 것보다 매우 쉬웠고

가장 큰 장점은 Power BI에 게시를 해도 TEAMS에서 볼 수있다는 장점이 있다.

마이크로소프트의 최대 장점인것같다.

 

 

 

 

목차
1. 데이터 베이스에 기반하는 Power BI
2. 외부 데이터 활용
3. 시각화

1. 데이터 베이스에 기반하는 Power BI

이 내용을 말하기 앞서 엑셀에 대해서 말씀해주셨다.

수직화(행단위)가 정말 중요하다.

그리고  연도를 기록할 때 "2023.05.05"를 사용하면 안되고 하이푼(-)을 사용하라고 말씀해주셨다.

추가적으로 피벗에 대해서 설명을 해주셨고 원본은 건드리지 않는게 포인트라는 것을 알 수 있었다.

 

Matrix와 Database에 차이점에 대해서 알려주셧다.

데이터베이스를 정의하자면 같은 종류의 Data를 열로 표준화한 표 혹은 그 집합체이다.

 

KPI(Key Performance Indicator)핵심성과지표라고 불린다.

많은 기업들이 이제까지 주로 측정가능성을 고려한 지표 즉, 매출,비용 등의 재무성과를 주된 지표로 활용했다.

재고를 파악하여 효율을 극대화하기 위해 사용하기도 한다.

 

 

2. 외부 데이터 활용

엑셀,SQL,웹 테이블을 가져오는 방법을 알아보고 실습을 해보았다.

엑셀로 만들어 둔 파일을 Power BI로 가져와서 시각화를 해보았다.

SQL로 데이터베이스 내에 접속을하여 데이터를 보았다.

웹 크롤링을 이용하여 네이버 주가 데이터를 가져와서 공부를 했다.

 

추가로 실제로 기업에 가서 데이터베이스에 접근을 하기 위해서는 다음과 같은 과정이 필요하다.

 

(1) 데이블 요청(전산실 부서에)

이런 테이블을 보고 싶다고 디테일하게 요청

 

(2). 계정(읽기전용, IP보안, 디바이스)
1) 주소(서버) ###.##.###.### , @@@@
2) 폴더(DB) $$$$$$
3) ID : &&&&
4) PW : *******

를 이용하여 접속한다.

 

위의 (2)과정은 Power BI에서 SQL가져오는 방법을 사용하면 된다.

 

 

3. 시각화

어떤 기업의 판매현황 데이터를 활용하여 시각화를 해보았다.

2018,2019년도의 데이터를 활용을 해서 판매계획금액대비 실적금액을 확인하고 비율을 계산해보니 25%였다.

누가 가장 판매 실적이 높은지 보기 위해서 '판매실적금액,성명'을 원그래프로 나타내보았다.

어떤 제품이 가장 많이 팔렸는지 보기 위해 트리맵을 구현해 보았고 어떤 고객이 주로 이용하는지 파악해보았다.

추가로 어떤 지역에서 많이 구매를 하는지 확인해보고 이 모든 과정을 년,월 별로 볼 수 있도록 설정해보았다.

다음의 자료의 년도와 월을 눌려서 각각의 판매실적금액에 대해 알아볼 수 있다.

 

처음 시각화 도구를 사용해보면서 매우 흥미를 느꼇다.
정말 재미있었고 R로 구현하지 않고도 쉽게 가능하다는 것을 깨달았다.
그래서 Power BI를 통해서 다양한 데이터를 시각화해서 인사이트를 얻는 연습을 해야 겠다
첫 날이라 모르는 부분도 좀 있었고 중간에 놓쳐서 헤매기도 했지만 
그러면서 특강 끝나고 2시간 정도 공부를 더하고 찾아보면서 익숙해 지려고 노력했다.
내일은 더 눈에 띄고 좋은 시각화를 만들어볼 것이다.

 

 

반응형