일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 코오롱베네트
- 코딩
- 얼음여왕
- GA
- 미라클 모닝
- 티스토리
- 벚꽃개화시기
- 데이터문해력
- 영화 올드 줄거리
- 명상
- Python
- 알파줄거리
- 독서
- ㅂㅂ
- 기사스크랩
- 벚꽃
- 데이터 분석
- 감사인사
- 구글애널리틱스
- Google Analytics
- 구글애널리틱스4
- GA4
- 6시 기상
- 니다
- 채용공고
- 프로그래머스
- 수명예측 인공지능
- Today
- Total
목록데이터 분석 (145)
Data Analyst KIM
순위 변화 파악을 위한 시각화 1. Bump Chart RANK(SUM([Sales])) 사용 다음을 사용하여 계산 → 세그먼트 y축 눈금 반전 이중축 + 축 동기화 + 마크(원) Sales Rank(2)에 Sales 레이블 + 테이블 계산 추가 + 구성 비율 + 테이블 아래로 주석 처리 2. Dumbbell Chart 필터 : 2022 & 2023년 이중축 마크 타입 → 라인 → 경로 → 라인
구성 비율을 보기 위한 데이터 시각화 1. Dount Chart - 목표 달성 매개변수 만들기(Sales Goal) 계산된 필드 만들기 = [Sales Goal] - SUM([Sales]) 파이 만들기 + 필요없는 측정값 제 행에 MIN(0)을 만들어서 이중축 생성 집계2의 마크에서 측정값 & 측정값 이름 모두 제거 마크 1번 파이 : Sales 색 / 남은 부분 - 색 & 테두리 2번 파이 : 흰색 계산 필드 : 목표 대비 달성률 계산(% to Goal) 생성 2번 파이에 % to Goal 레이블로 드래그 2. Dount Chart - 구성 비율 MIN(0) → 파이 차트 → 이중축 파이1 : 카테고리-색상 / Sales-각도 파이2 : 크기조절 / 레이블 변경 3. Tree Map '표현 방식' 사용..
분포 데이터 시각화 1. Scatter Plot 2. Box&Whisker Plot 서브 카테고리별 매출액을 월별로 나누어서 박스 플롯으로 나타내라. Order Date → 색상 → 마크 → 원 표현방식을 이용해서 더 빨리 그릴 수 있음 3. Histogram Quntity + 표현방식(히스토그램) Quntity의 구간차원 편집 & 열에 넣음 축 편집 → 고정(시가+끝)
속성별 비교를 위한 데이터 시각화 1. KPI 카드 만들기 (Key Performance Indicator) 열 선반 더블클릭 → MIN(0) 입력 → ctrl 누르고 4개 만들기 마를 모양으로 변경 → 추가 모양 → 빈 이미지 입력 각 마크의 레이블에 원하는 값 입력 및 레이블 수정 서식 → 열 격자선 없음 필터 → 년,월 2. Highlight Table 연도별로 어떤 카테고리가 어떤 시즌에 잘팔리는지 알수 있음 월별로 서브 카테고리의 판매가의 총액을 하이라이트 테이블 사용하여 나태내라. 3. Bullet Chart 서브 카테고리 별로 2021년 매출액과 2022년의 매출액을 비교하는 Bullet Chart를 그려라 계산된 필드 2021Sales = IF YEAR([Order Date]) = 2021..
시간에 따른 데이터 시각화 1. Dual-Axis Line Chart 카테고리와 연도별로 판매액의 합계와 수익 비율을 이중축을 이용하여 나타내라. 2. 100% Stacked Area Chart Q. 월별 서브 카테고리의 매출액을 100% 누적 영역 차트로 그려라. Sales → 퀵 테이블 계산 → 구성 비율 → 다음을 사용하여 계산 → 테이블(아래로) 3. Slope Chart 카테고리를 년도별 판매총액을 Slope Chart로 나타내라 단, 2022년과 2023년의 판매액만 사용할 것 - 이중축, 축동기화 , 비율차이 사용 4. Spark Line Chart 측정값의 추세를 확인하기 위해 사용 5. Calender Chart
Cerebral Stroke Prediction-Imbalanced Dataset Identify Stroke on Imbalanced Dataset www.kaggle.com 1. 라이브러리 불러오기 import numpy as np import pandas as pd import matplotlib.pyplot as plt import matplotlib.patches as mpatches from sklearn.impute import KNNImputer #Imputation %matplotlib inline import warnings warnings.filterwarnings("ignore") 2. 데이터 확인 df = pd.read_csv('dataset.csv') df.info() impor..