본문 바로가기
통계&데이터사이언스/데이터과학개론

데이터과학개론 15.파이썬을 이용한 데이터 시각화 - 2

by 데이터 시오 2024. 12. 23.
728x90
반응형

box plot

box plot

히스토그램, 상자그림, 줄기-잎 그림은 모두 데이터의 분포를 보기 위해 사용한다

box plot은 데이터의 사분위수를 볼 수 있다. 이상치를 식별하기 좋다

여러 데이터의 범위를 한 번에 비교하기 용이하다

 

order statistics ( 순서 통계량)

샘플을 작은 값에서 큰 값 순서로 정렬해서 얻어지는 statistic

 

sample percentile 백분위수

주어진 샘플에서 np개의 같거나 작은 관측값들을 가지는 값

(n + 1)pth order statiwstic

 

Quartile 사분위수

first quartile (Q1)

second quartile (Q2)

third quartile (Q3)

IQR : Q3 - Q1

 

stem-and-leaf

줄기-잎 그림

분포와 데이터값을 동시에 보여준다

그림과 표의 중간에 가까운 형태

 

pip install stemgraphic

 

히트맵

두 변수 사이의 관계를 값과 함께 색상으로 표현하는 것이 시각적으로 도움이 된다

 

오차 막대 그래프

값과 오차를 같이 나타내기 위한 도표

 

 

728x90