일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- ㅂㅂ
- 코오롱베네트
- 감사인사
- 미라클 모닝
- 데이터문해력
- 티스토리
- 데이터 분석
- 알파줄거리
- GA4
- 얼음여왕
- 벚꽃
- 구글애널리틱스4
- Google Analytics
- 코딩
- 수명예측 인공지능
- Python
- 독서
- 영화 올드 줄거리
- 구글애널리틱스
- 명상
- 벚꽃개화시기
- 6시 기상
- 채용공고
- GA
- 프로그래머스
- 니다
- 기사스크랩
- Today
- Total
목록2023/07/05 (3)
Data Analyst KIM

(위 파일을 활용하여 전처리를 진행해봐라) 데이터 분석을 하기 위해서는 데이터의 특성을 알고 있어야 한다. 먼저 탐색적 자료분석(EDA)를 통해서 특성을 파악하자. 함수 내용 df.info() 데이터 구성과 특성 확인 df.head() df.tail() 데이터 행 추출 df.shape 행,열 수 확인 df.describe() 수학적 통계값(count,mean,std,min,max,...) 주요 전처리 과정 데이터의 특성은 EDA과정을 한 후 전처리를 진행해야한다. 필요없는 컬럼 삭제 결측치 처리 이상치 처리 범주형 변수일 경우 => 인코딩 수치형 변수일 경우 => 스케일링 주로 위와 같은 과정은 필수적이다. 필요없는 컬럼의 경우에는 drop또는 pop으로 처리를 해준다. 종속변수와 관계가 없는 변수인 경..

DataFrame이란? - 2차원테이블 데이터 구조를 가진 자료형 - Machine Learning에서 data 변형을 위해 가장 많이 사용 기본적으로 데이터를 다루기 위해서는 pandas라이브러리를 활용하여 사용을 한다. 그 중에서도 데이터 프레임을 가장 많이 다룬다. 내가 원하는 모델링을 하기 위해서는 원하는 형태로 가공을 해야한다. 그 과정에서 컬럼 생성,제거,원하는 컬럼 추출,그룹화,인덱싱 등등을 사용하게 된다. 위 폴더를 활용해서 데이터를 다루기 위한 기초를 다질 수 있다.

여러분의 인생에서 중요한 것은 지나가는 세월이 아닌 생활이다. - 아브라함 링컨 - 06:25 ~ 목차 명상 + 감사 인사 세 문장 어제의 '나'를 1칭찬,1반성 오늘의 '나' 관심분야 뉴스를 보며 나의 생각은? 채용공고 정리 1. 명상 + 감사 인사 세 문장 명상 오늘 하루도 명상으로 시작!! https://youtu.be/6Qu5E3MrVH8 감사 인사 세 문장 (1) 수요일임에 감사합니다 (2) 동기들에게 정보를 알려 줄 수 있음에 감사합니다 (3) 나를 깨워주신 어머니에게 감사합니다. 2. 어제의 '나'를 1칭찬,1반성 칭찬 학교 갈 때 차에서 토익 스피킹 강의를 들은 것을 칭찬 반성 토익 스피킹 복습을 조금만 한 것에 반성!! 3. 오늘의 '나' 4. 관심분야 뉴스를 보며 나의 생각은? 하나은행..