통계&데이터사이언스/데이터과학개론

데이터과학개론 14.파이썬을 이용한 데이터 시각화 - 1

데이터 시오 2024. 12. 23. 10:37
728x90
반응형

 

산점도

데이터 분석 과정에서 시각화 중요성

전반적인 경향을 직관적으로 이해할 수 있게 도와준다

단일 수치에 의한 판단이 야기할 수 있는 오류는 잡아준다

데이터 분석의 중요한 한 축을 담당한다

 

Matplotlib

그래프 생성을 위한 파이썬의 대표적 라이브러리

figure - 여러 개의 하위 도표를 포함할 수 있는 캔버스 또는 컨테이너와 같은 역할을 하는 객체

axe - 우리가 실제로 생각하는 개별 도표

figure 하나가 여러개의 axe를 포함 할 수 있다

 

import matpotlib.pyplot as plt

서브플롯

plt.subplots 함수를 이용해 figure 객체와 axe 객체들을 얻어

각각의 axe 객체를 이용해 도표를 추가해 주면 된다

선그래프

linestyle 파라미터가 선의 종류를 결정한다

solid

dashed

dashdot

dotted

 

히스토그램

데이터가 어떤 분포를 따르는지를 시각적으로 파악하기 위해 사용한다

- 히스토그램의 모양이 대체로 종 모양의 형태를 한다면,

해당 데이터가 정규분포를 따른다고 본다

- 히스토그램 모양은 bin의 수에 따라 달라진다

- 데이터 분포의 확인 위해서 다른 방법들을 함께 사용하는 것이 바람직하다

 

728x90