Data Analyst KIM

[ML] 1. 사이킷런 기반의 프레임워크 본문

데이터 분석/ML&DL&NLP

[ML] 1. 사이킷런 기반의 프레임워크

김두연 2023. 10. 4. 22:27
반응형
사이킷런 기반 프레임워크
  • 학습 및 예측을 위해 fit(),predict()를 제공
  • 분류와 회귀의 다양한 알고리즘 구현

 

분류 모듈명 설명
예제 데이터 sklearn.datasets 사이킷런 내장 데이터셋
데이터분리,검증 & 파라미터 튜닝 sklearn.model_selection train_test_split,교차검증,GridSearchCV를 이용하여 데이터 분리,검증 및 튜닝
피처 처리 & 차원 축소 skelarn.decomposition 차원 축소과 관련한 알고리즘을 지원
ex) PCA,NMF,Truncated SVD
평가 sklearn.metrics 성능 측정
ex) Accuracy,Recall,Precision,ROC-AUC,RMSE 등
알고리즘 - sklearn.ensemble
- sklearn.linear_model
- sklearn.tree
- sklearn.cluster
- sklearn.svm ...
- 랜덤 포레스트, 에이다 부스트 등
- 선형 회귀,릿지,라쏘 등
- 의사 결정 트리 
- k-Means,DBSCAN 등
- 서포트 벡터 머신 등
유틸리티 sklearn.pipeline 피처 처리 등의 변환과 학습&예측 등을 함께 묶어서 실행할 수 있는 유틸리티 제공

 


내장된 예제 데이터

Data set의 Key의 의미

  • Data : 피처의 데이터셋
  • Target : 뷴류시 레이블 값
  • Target_names : 레이블 이름
  • feature_names : 피처 이름
  • DESCR : 데이터셋 설명&피처 설명

 

반응형