Data Analyst KIM

[Power BI] 빅데이터 관리사 민간 자격증 공부내용 정리 본문

데이터 분석/Python | SQL | BI Tools

[Power BI] 빅데이터 관리사 민간 자격증 공부내용 정리

김두연 2023. 5. 6. 23:52
반응형

 

내용정리(시험 예상문제)

[필답형]-50점

Matrix양식을 관리하는데 문제점이 있다.
-->데이터 베이스로 관리해야한다.

<Database의 정의>
같은 종류의 Data를 열로 표준화한 표 혹은 그 집합체

<KPI>

핵심성능지표이고 항상 목표가 있다.
목표를 정해서 달성여부를 확인한다.

효과성효율성의 중요성


<SQL Server 테이블 가져오는 4가지 조건>
1. 주소(서버)
2. 폴더
3. 아이디
4. 비밀번호

 


<시각화>
에 넣으면 x축

에 넣으면 y축 생성


<데이터 전처리방법>
머리글을 생성한다.
한 행씩 옮긴다.

 


<모델링>
기록용 데이터 모델링 : 데이터가 중복X
분석용 데이터 모델링 : 데이터 중복O

 


<DAX(Data Analysis eXpressions)>
테이블에 최적화 되어있다.
새열계산과 측정식계산이 있다.
새열 :  테이블 기준계산/ 행을 계산 후 열을 계산
측정식 : 피벗테이블 기준 계산/열을 계산후 행을계산

if(logical_test > 0 , 1 , 0) => 0보다 크면 1을 아니면0
&&는 and를 ,  ||는 or을 의미

목표와 차이가 존재하는 것을 문제라고 한다.

 


<현상분석>
해결하려는 문제의 실체를 파악하여 분석하는 것

슬라이서(층별)는 분류를 목표로한다.

층별이 되야 머리글을 이용하여 분석이 가능하다.

 

예를들어 생산현장의 슬라이서 대상은?(대표적인)

일자 : 오전,오후,요일,...

작업자(Man) : 연령,경험연수,남여,...

설비(Machine) : 기종,호기,성능,공장,...

작업방법(Method) : 작업장소,온도,압력,속도,...

원재료(Material) : 제조사,구입사,부품,...

==> 4M : 원인인자(=투입요소)

원인 인자들은 x1,x2,x3,x4로 나눌 수있다.

 

원인 인자들에 따른 결과는 산출요소라고 하는데

생산량,분석값으로 나타난다.

결과는 y1,y2로 나타낼 수 있다.

 

파레토분석(x축에 문자가 들어가야한다.)

"20:80의 법칙"

품질 문제의 원인은 중요한 20%의 원인이 

전체 문제의 80%를 발생시키기 때문이다.

히스토분석(x축에 숫자가 들어가야한다.)


<Power Query_Data ETL>
1. Extract(추출)
2. Transform(변환)
3. Load(로드)

Transform(변환)의 3가지
역정규화 / 쿼리 결합 / 쿼리 추가 

 

 

<공정에서 필요한 개념>

<평균수명>-MTBF <평균수리시간>-MTTR
Mean : 평균 Mean : 평균
Time : 시간 Time : 시간
Between : 사이 To 
Failure : 고장 Repair : 수리

MTBF(평균수명)높을수록 좋다.

설비평균수명 = 실제가동시간/고장횟수

즉, 1번 고장날 때 소요되는 시간

 

MTTR(평균수리시간)낮을수록 좋다.

평균수리시간 = 수리시간/고장횟수

(수리시간은 고장시간으로 대체,

수리시간은 따로 데이터에 없지만

고장나면 바로 수리를 한다는 가정)

즉, 1번 수리할때 걸리는 시간

 

설비가용성 = MTBF/(MTBF+MTTR)

MTTR(평균수리시간)을 줄이는 것이 설비가용성을 높이는 방법이다.

실제로 삼성에서는 다양한 플랜을 준비를 해서 공정에 문제가 생기면 

바로 대체가 가능하게끔 설계를 해서 MTTR이 0에 가깝다고 한다.

 

 

[실기형 과제]-30점

Q. 공정구분별 공정시간_분(합계)로 파레토 분석을 해주세요.

1. '행렬'을 이용하여 x축 : 공정구분 / 값 : 공정시간_분(합계)를 넣어준다.

2. 행렬을 복사하여 파레토 분석 그림을 클릭하여 그려준다. 

 

 

 

반응형