Data Analyst KIM

#1. 문제해결 프로세스(현업 데이터 분석 프로세스) 본문

데이터 분석/Project

#1. 문제해결 프로세스(현업 데이터 분석 프로세스)

김두연 2024. 9. 24. 20:07
반응형

최근 데이터 분석 강의에서 현업에서 문제를 해결하는 '문제해결 프로세스'에 대해서 알게 되었습니다.

항상 그냥 데이터 분석의 스킬을 향상시켜 왔다면, 문제해결 프로세스를 통해서 어떤 데이터 분석을 해야할지 알게 되었습니다. 우선 데이터 분석에서 가장 중요한 것이 무엇일까요? 데이터 분석은 왜 하는걸까요?

 

정답은 문제를 해결하기 위해서입니다. 

현업에서는 항상 문제를 해결하기 위해서 데이터 기반의 신규 프로젝트를 기획하고, 핵심 이슈를 해결하고자 노력하고 있습니다. 

 

문제해결 프로세스

1) 문제 정의

2) 기대효과

3) 해결방안

4) 우선 순위

5) 데이터 분석

6) 성과 측정

7) 모델 운영 


Step1. 문제 정의 

 

현재 기업의 문제상황을 문제현상과 문제발생으로 인한 기업의 피해로 나누어 정의합니다. 과제의 개요를 작성하는 단계로서 문제현상을 데이터로 설명할 수 있도록 합니다.

 

Step2. 기대효과

 

문제현상을 해결했을 때, 기대할 수 있는 효과를 정의합니다. 
이때 주의사항은 정성적인 아닌 정량적으로 측정이 가능하도록 해야합니다. 

 

Step3. 해결방안

 

우리가 정의한 문제를 해결했을 때, 얻을 수 있는 효과가 미미하다면 해당 과제의 Drop을 고려할 수도 있습니다.

하지만 기대효과가 크고, 진행해야한다고 판단이 되는 과제라고 한다면, 해결하기 위한 방안을 탐색하고 List up합니다. 
해결방안이 꼭 모델링이 아니여도 됩니다. 간단한 통계분석으로도 해결할 수 있는 문제라면 그렇게 분석을 진행하면 됩니다.

 

Step4. 우선순위

 

List-up한 해결방안들에 대해서 우선순위를 설정합니다. 빠르게 수행할 수 있고, 결과를 파악할 수 있는 방법을 가장 최우선적으로 실행하면 됩니다.

 

 

Step5. 분석

 

우선순위에 따라서 데이터 분석을 수행하는 과정입니다. 이때  통계지식, 머신러닝과 딥러닝,시각화 등의 데이터 분석 방법론들로 Python이나 SQL 등의 도구를 활용하여 분석하는 단계입니다.

 

Step6. 성과측정

 

정의한 문제의 상황이 우리의 Solution을 통해서 좋아졌는지 측정하는 단계입니다. 성과가 나쁘지다면 다시 데이터 분석의 오류는 없었는지 점검하고 다시 분석 할 수도 있습니다.

 

Step7. 모델 운영

 

최종적으로 완성된 Solution을 현업의 상황에 맞춰 주기적으로 운영하기 위한 프로세스를 설계합니다.
일, 주, 월 주기를 설정해야하고, 주기적으로 모델 업데이트 일정도 고려해야합니다. 또한 모델 운영 중 오류 발생시 처리를 위한 프로세스 수립도 필요합니다.

 

 

이렇게 문제를 해결하는 프로세스에 대해서 알아보았습니다. 데이터 분석을 할 때, 참고하여 해결할 필요가 있는 과제인지 여부를 확인하고 진행한다면 더욱더 매력적인 분석이 될 것입니다.

저도 항상 데이터를 내 마음대로 분석하고 마지막에 어떤 문제가 있는지 찾기도 하고 그런 경우가 많았습니다.

제가 했던 분석 중 필요없는 분석이 더 많았으면, 오히려 더 시간을 날리는 경우가 많았습니다.

저도 앞으로 이 프로세스를 통해서 문제를 해결하기 위한, 가치가 있는 데이터 분석을 하기 위해 노력할 것입니다.

 

다음 글은 예시를 살펴보겠습니다.

반응형