Data Analyst KIM

[Power BI] 요일별 산불 피해 데이터를 시각화하여 패턴 찾아보기 본문

데이터 분석/BI tools

[Power BI] 요일별 산불 피해 데이터를 시각화하여 패턴 찾아보기

김두연 2023. 5. 11. 23:40
반응형

<산불과 요일의 관련성이 존재할까?>

산불과 요일에 연관성이 있을까라는 생각을 하면서 다음과 같은 시각화를 하게되었다.

 

Q1. 어떤 년도에 가장 많은 피해가 발생했을까?

2013~2022년도까지 2022년도의 피해면적이 전체 면적의 약 70%로 가장 크다.

 

Q2. 어떤 월에 가장 많은 피해가 발생했을까? 

월별로 봤을때 2,3,4,5월에 주로 발생을 하고 대부분은 3,4,월에 가장 피해가 크다.

 

Q3. 어떤 시도에서 가장 많이 발생했을까? 그리고 적게 발생한곳은 어디일까?

경상북도와 강원도에서 약 88%정도 발생을 했다.(경상남도를 포함하면 약 93%정도)

서울,세종,광주,제주에서는 산불이 거의 발생 하지않았다.

비교적 경상도와 강원도는 산이 많고 서울과 광주에는 비교적 산이 없기 때문이라고 생각할 수 있다.

 

Q4. 요일과 산불피해의 관계가 존재할까?

요일이라는 것을 변수로 생각한 이유는 월화수목에는 일을 열심히 하려고 하지만 금,토요일은 비교적 쉬는 날이라

등산을 가거나 근무를 소홀히할 가능성이 높기 때문에 요일별로 피해면적을 알아봤다.

피해면적 금>토>목>일 이다.

금요일이 약 53%로 절반을 차지하고 토,목,일이 37%정도 차지한다.

즉, 목금토일에 90%로 가장 많은 피해가 발생했고 원인에 따른 파악이 필요해보인다.

 

Q5. 지역에 따라 요일별로 산불피해의 영향이 다를까?

각 지역마다 운영하는 방식이 다를 것으로 생각을 해서 위와 같은 내용이 궁금했다.

경상북도는 금(80~90%),강원도 목/토(약70%) ,경남 월/화(90%이상), 울산 목/토(90%이상)

Q3,Q4,Q5를 통해서 해석을 해보자면

피해면적은 88%는 경상북도와 강원도에서 발생을 했고 대부분 목,금,토,일에 많이 발생을 했다.

그 중에서 경상북도는 금요일, 강원도는 목요일과 토요일에 피해면적이 가장 크다.

경상북도와 강원도의 요일에 따라서 피해발생 요일의 비율이 결정되는 것을 알 수있다.

 

Q6. 피해면적의 주된 요인은 무엇일까?

주된 원인은 도로변발화추청(=도로변실화추정)이다.

1번의 산불이였지만 약45%이고 2022년에 울진에서 발생한 산불이다.

울진에서의 피해가 2013~2022년까지 중 45%을 차지 한다는 것으로 볼 수 있다.

(시각화 자료를 보면서 알게 되었는데 자료의 원인이 2개씩 존재하는 것을 확인했다.)

(따라서 값의 절반을 계산하는게 실제로 발생한 값이라고 볼 수있다.)

(하지만 비율이 궁금하기 때문에 값은 그냥 두고 비율을 참고하길 바란다.)

 

 

위의 내용들을 참고해서 산불을 막을 수 없다면 산불의 피해를 최소화 할 수 있는 의사결정에 

도움이 될 수 있었으면 좋겠다. 좋은 아이디어가 떠오를 때마다 이렇게 만들어 볼것이다.

산불의 발생확률을 예측하는 것은 지금 내 능력으로는 힘들다.

하지만 시각화를 통해 과거의 자료들을 바탕으로 목,금,토,일에 많이 발생한다는 것을 알 수 있었다.

추가로 내가 살고 있는 경상북도에는 금요일에 큰 피해를 입었다. 

2,3,4,5월에 집중적으로 산불을 조기식별하는 팀을 운영하겠지만 금요일에는 추가적으로 투입하는 등의

방안을 세운다면 피해가 최소화 될것이라고 생각이든다.

아직 많이 미숙하지만 앞으로 매주 다른 데이터를 다루어보면서 좋은 의사결정을 하기위해 노력할 것이다.

 

 

 

 

반응형