스파르타클럽 내일배움캠프 QA/QC 5기 03/27 TIL
2026. 3. 27. 20:17ㆍ내일배움캠프 TIL
오늘은 데이터 전처리 & 시각화 챕터 4와 신재춘 튜터님의 라이브 세션을 수강하고 아티클 스터디를 진행했다.
챕터 4
1. 데이터 시각화(1)
- 목적: 데이터 분석 결과를 타인에게 효과적으로 전달하고 설득하기 위함이다.
- 효과: 방대한 데이터에서 변화와 추이를 시각적으로 즉각 확인 가능하다.
- 마케팅 캠페인 전후 비교, 채널별 효과 비교, 고객 반응 분석 등에 유용하다.
- A/B 테스트 결과를 시각화하여 의사결정을 지원한다.
2. 데이터 시각화(2)
- 정의: 파이썬의 대표적인 2D 그래픽 시각화 라이브러리다.
- 주요 기능: 선 그래프, 막대 그래프, 히스토그램, 산점도 등 다양한 그래프 생성을 지원한다.
- 기본 사용법: import matplotlib.pyplot as plt를 통해 불러오며, plt.plot()으로 그래프를 생성하고 plt.show()로 출력한다.
- 실습 데이터: Seaborn 라이브러리의 내장 데이터셋(iris, tips, titanic 등)을 활용한다.
3. 데이터 시각화(3)
- 스타일 설정: color(색상), linestyle(선 스타일), marker(마커 종류) 파라미터를 통해 그래프의 외형을 조절한다.
- 구성 요소 추가:
- set_xlabel(), set_ylabel(): 축 이름 설정
- set_title(): 그래프 제목 설정
- legend(): 범례 추가
- text(): 특정 위치에 텍스트 삽입
- Pandas 연동: DataFrame 객체에서 .plot() 메서드를 호출하여 직접 시각화가 가능한다.
4. 데이터 시각화(4)
- Line Plot: 연속형 데이터의 시간 흐름에 따른 변화 및 추이를 시각화한다.
- Bar Plot: 범주형 데이터 간의 값의 크기를 비교할 때 사용한다.
- Histogram: 연속형 데이터의 분포, 빈도, 패턴을 파악한다.
- Pie Chart: 범주별 상대적 비율을 확인한다.
- Box Plot: 데이터의 중앙값, 사분위수, 이상치를 확인하여 분포를 파악한다.
- Scatter Plot: 두 변수 간의 상관관계, 군집, 이상치를 확인한다.
- 통계 개념: 데이터의 흩어짐 정도를 나타내는 '표준편차'와 두 변수 간의 관계를 나타내는 '공분산' 개념을 포함한다.
5. 데이터 홀로서기
- 학습 방법:
- 모르는 함수는 구글링을 통해 해결하는 습관이 중요한다.
- '10 minutes to pandas'와 같은 공식 문서 활용을 권장한다.
- 코딩은 언어와 같으므로 매일 꾸준히 사용하는 연습이 필요하다.
- 직무별 특징:
- 비즈니스 분석가(BA): 현업 비즈니스 현상에 대한 이해와 인사이트 도출이 중요하며, Python 활용 빈도는 낮을 수 있다.
- 데이터 사이언티스트(DS): Python 스킬이 필수적이며 AI 및 알고리즘에 대한 깊은 지식이 요구된다.
- 기타: 제품 분석가(PA), BI 분석가 등 직무에 따라 강조되는 스킬셋이 다다.
'내일배움캠프 TIL' 카테고리의 다른 글
| 스파르타클럽 내일배움캠프 QA/QC 5기 04/01 TIL (0) | 2026.04.01 |
|---|---|
| 스파르타클럽 내일배움캠프 QA/QC 5기 03/30 TIL (0) | 2026.03.30 |
| 스파르타클럽 내일배움캠프 QA/QC 5기 03/26 TIL (0) | 2026.03.26 |
| 스파르타클럽 내일배움캠프 QA/QC 5기 03/24 TIL (0) | 2026.03.24 |
| 스파르타클럽 내일배움캠프 QA/QC 5기 03/23 TIL (0) | 2026.03.23 |