스파르타클럽 내일배움캠프 QA/QC 5기 03/27 TIL

2026. 3. 27. 20:17내일배움캠프 TIL

오늘은 데이터 전처리 & 시각화 챕터 4와 신재춘 튜터님의 라이브 세션을 수강하고 아티클 스터디를 진행했다.

챕터 4

1. 데이터 시각화(1)

  • 목적: 데이터 분석 결과를 타인에게 효과적으로 전달하고 설득하기 위함이다.
  • 효과: 방대한 데이터에서 변화와 추이를 시각적으로 즉각 확인 가능하다.
    • 마케팅 캠페인 전후 비교, 채널별 효과 비교, 고객 반응 분석 등에 유용하다.
    • A/B 테스트 결과를 시각화하여 의사결정을 지원한다.

2. 데이터 시각화(2)

  • 정의: 파이썬의 대표적인 2D 그래픽 시각화 라이브러리다.
  • 주요 기능: 선 그래프, 막대 그래프, 히스토그램, 산점도 등 다양한 그래프 생성을 지원한다.
  • 기본 사용법: import matplotlib.pyplot as plt를 통해 불러오며, plt.plot()으로 그래프를 생성하고 plt.show()로 출력한다.
  • 실습 데이터: Seaborn 라이브러리의 내장 데이터셋(iris, tips, titanic 등)을 활용한다.

3. 데이터 시각화(3)

  • 스타일 설정: color(색상), linestyle(선 스타일), marker(마커 종류) 파라미터를 통해 그래프의 외형을 조절한다.
  • 구성 요소 추가:
    • set_xlabel(), set_ylabel(): 축 이름 설정
    • set_title(): 그래프 제목 설정
    • legend(): 범례 추가
    • text(): 특정 위치에 텍스트 삽입
  • Pandas 연동: DataFrame 객체에서 .plot() 메서드를 호출하여 직접 시각화가 가능한다.

4. 데이터 시각화(4)

  • Line Plot: 연속형 데이터의 시간 흐름에 따른 변화 및 추이를 시각화한다.
  • Bar Plot: 범주형 데이터 간의 값의 크기를 비교할 때 사용한다.
  • Histogram: 연속형 데이터의 분포, 빈도, 패턴을 파악한다.
  • Pie Chart: 범주별 상대적 비율을 확인한다.
  • Box Plot: 데이터의 중앙값, 사분위수, 이상치를 확인하여 분포를 파악한다.
  • Scatter Plot: 두 변수 간의 상관관계, 군집, 이상치를 확인한다.
  • 통계 개념: 데이터의 흩어짐 정도를 나타내는 '표준편차'와 두 변수 간의 관계를 나타내는 '공분산' 개념을 포함한다.

5. 데이터 홀로서기

  • 학습 방법:
    • 모르는 함수는 구글링을 통해 해결하는 습관이 중요한다.
    • '10 minutes to pandas'와 같은 공식 문서 활용을 권장한다.
    • 코딩은 언어와 같으므로 매일 꾸준히 사용하는 연습이 필요하다.
  • 직무별 특징:
    • 비즈니스 분석가(BA): 현업 비즈니스 현상에 대한 이해와 인사이트 도출이 중요하며, Python 활용 빈도는 낮을 수 있다.
    • 데이터 사이언티스트(DS): Python 스킬이 필수적이며 AI 및 알고리즘에 대한 깊은 지식이 요구된다.
    • 기타: 제품 분석가(PA), BI 분석가 등 직무에 따라 강조되는 스킬셋이 다다.

0327 9조 아티클 스터디.docx
0.02MB