일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 기사스크랩
- 영화 올드 줄거리
- 벚꽃
- 데이터문해력
- Google Analytics
- 독서
- 6시 기상
- 얼음여왕
- GA
- 미라클 모닝
- Python
- ㅂㅂ
- 구글애널리틱스
- 수명예측 인공지능
- 니다
- 벚꽃개화시기
- 구글애널리틱스4
- 데이터 분석
- 프로그래머스
- 알파줄거리
- 감사인사
- 코오롱베네트
- 티스토리
- 코딩
- GA4
- 채용공고
- 명상
- Today
- Total
목록데이터 분석 (145)
Data Analyst KIM
1. LEFT JOIN 2. ai.DATETIME > ao.DATETIME 3. ORDER BY SELECT ai.ANIMAL_ID , ai.NAME FROM ANIMAL_INS AS ai LEFT JOIN ANIMAL_OUTS AS ao ON ai.ANIMAL_ID = ao.ANIMAL_ID WHERE ai.DATETIME > ao.DATETIME ORDER BY ai.DATETIME
1. INNER JOIN 2. '2022-01' 데이터만 사용 3. SUM으로 총 판매량 계산 4. 카테고리 GROUP BY SELECT b.CATEGORY , SUM(bs.SALES) AS TOTAL_SALES FROM BOOK AS b INNER JOIN BOOK_SALES AS bs ON b.BOOK_ID = bs.BOOK_ID WHERE bs.SALES_DATE LIKE '2022-01%' GROUP BY b.CATEGORY
SELECT ai.NAME , ai.DATETIME FROM ANIMAL_INS AS ai LEFT JOIN ANIMAL_OUTS AS ao ON ai.ANIMAL_ID = ao.ANIMAL_ID WHERE ao.ANIMAL_ID IS NULL ORDER BY ai.DATETIME LIMIT 3
사이킷런의 Model Selection 모듈에서 제공하는 기능 학습 데이터와 테스트 데이터 세트 분리 교차 검증 분할 및 평가 하이퍼 파라미터 튜닝 1. 학습 데이터와 테스트 데이터 세트 분리 데이터를 분리하기 위해서는 train_test_split을 사용을 해야한다. X_train, X_test, y_train, y_test로 나누게 된다. 그 이유는 정확도를 계산 하려면 실제 값과 같은지 다른지를 파악해야하기 때문이다. X_train과 y_train로 학습을 한다. 여기서 feature는 X_train이 되고 Target은 y_train이 된다. 모델링에서 학습을 한 후 X_test를 이용하여 예측을 수행한다. 예측 결과와 y_test를 비교하여 정확도를 계산한다. 기본 코드는 다음과 같다. 여기서 ..
사이킷런 기반 프레임워크 학습 및 예측을 위해 fit(),predict()를 제공 분류와 회귀의 다양한 알고리즘 구현 분류 모듈명 설명 예제 데이터 sklearn.datasets 사이킷런 내장 데이터셋 데이터분리,검증 & 파라미터 튜닝 sklearn.model_selection train_test_split,교차검증,GridSearchCV를 이용하여 데이터 분리,검증 및 튜닝 피처 처리 & 차원 축소 skelarn.decomposition 차원 축소과 관련한 알고리즘을 지원 ex) PCA,NMF,Truncated SVD 평가 sklearn.metrics 성능 측정 ex) Accuracy,Recall,Precision,ROC-AUC,RMSE 등 알고리즘 - sklearn.ensemble - sklearn...