일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 니다
- Python
- 알파줄거리
- 코딩
- 벚꽃개화시기
- 벚꽃
- 티스토리
- Google Analytics
- 데이터문해력
- 독서
- 채용공고
- 6시 기상
- 구글애널리틱스4
- 구글애널리틱스
- 코오롱베네트
- ㅂㅂ
- 데이터 분석
- 미라클 모닝
- GA4
- 수명예측 인공지능
- GA
- 기사스크랩
- 얼음여왕
- 프로그래머스
- 영화 올드 줄거리
- 명상
- 감사인사
- Today
- Total
목록2023/07/05 (3)
Data Analyst KIM
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bS4cMM/btsmAMZCDCT/NKPrSpnJWU7ypInvq7kM0K/img.png)
(위 파일을 활용하여 전처리를 진행해봐라) 데이터 분석을 하기 위해서는 데이터의 특성을 알고 있어야 한다. 먼저 탐색적 자료분석(EDA)를 통해서 특성을 파악하자. 함수 내용 df.info() 데이터 구성과 특성 확인 df.head() df.tail() 데이터 행 추출 df.shape 행,열 수 확인 df.describe() 수학적 통계값(count,mean,std,min,max,...) 주요 전처리 과정 데이터의 특성은 EDA과정을 한 후 전처리를 진행해야한다. 필요없는 컬럼 삭제 결측치 처리 이상치 처리 범주형 변수일 경우 => 인코딩 수치형 변수일 경우 => 스케일링 주로 위와 같은 과정은 필수적이다. 필요없는 컬럼의 경우에는 drop또는 pop으로 처리를 해준다. 종속변수와 관계가 없는 변수인 경..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/DFugF/btsmzGMnLXB/6JLcWbXH3JfkcKk5ZHlKi1/img.png)
DataFrame이란? - 2차원테이블 데이터 구조를 가진 자료형 - Machine Learning에서 data 변형을 위해 가장 많이 사용 기본적으로 데이터를 다루기 위해서는 pandas라이브러리를 활용하여 사용을 한다. 그 중에서도 데이터 프레임을 가장 많이 다룬다. 내가 원하는 모델링을 하기 위해서는 원하는 형태로 가공을 해야한다. 그 과정에서 컬럼 생성,제거,원하는 컬럼 추출,그룹화,인덱싱 등등을 사용하게 된다. 위 폴더를 활용해서 데이터를 다루기 위한 기초를 다질 수 있다.
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cgv8A7/btsmmQ4fOpl/GQDOnMKTcQmbyEjdVD7RKK/img.png)
여러분의 인생에서 중요한 것은 지나가는 세월이 아닌 생활이다. - 아브라함 링컨 - 06:25 ~ 목차 명상 + 감사 인사 세 문장 어제의 '나'를 1칭찬,1반성 오늘의 '나' 관심분야 뉴스를 보며 나의 생각은? 채용공고 정리 1. 명상 + 감사 인사 세 문장 명상 오늘 하루도 명상으로 시작!! https://youtu.be/6Qu5E3MrVH8 감사 인사 세 문장 (1) 수요일임에 감사합니다 (2) 동기들에게 정보를 알려 줄 수 있음에 감사합니다 (3) 나를 깨워주신 어머니에게 감사합니다. 2. 어제의 '나'를 1칭찬,1반성 칭찬 학교 갈 때 차에서 토익 스피킹 강의를 들은 것을 칭찬 반성 토익 스피킹 복습을 조금만 한 것에 반성!! 3. 오늘의 '나' 4. 관심분야 뉴스를 보며 나의 생각은? 하나은행..