728x90
반응형

box plot
box plot
히스토그램, 상자그림, 줄기-잎 그림은 모두 데이터의 분포를 보기 위해 사용한다
box plot은 데이터의 사분위수를 볼 수 있다. 이상치를 식별하기 좋다
여러 데이터의 범위를 한 번에 비교하기 용이하다
order statistics ( 순서 통계량)
샘플을 작은 값에서 큰 값 순서로 정렬해서 얻어지는 statistic
sample percentile 백분위수
주어진 샘플에서 np개의 같거나 작은 관측값들을 가지는 값
(n + 1)pth order statiwstic
Quartile 사분위수
first quartile (Q1)
second quartile (Q2)
third quartile (Q3)
IQR : Q3 - Q1
stem-and-leaf
줄기-잎 그림
분포와 데이터값을 동시에 보여준다
그림과 표의 중간에 가까운 형태
pip install stemgraphic
히트맵
두 변수 사이의 관계를 값과 함께 색상으로 표현하는 것이 시각적으로 도움이 된다
오차 막대 그래프
값과 오차를 같이 나타내기 위한 도표
728x90
'통계&데이터사이언스 > 데이터과학개론' 카테고리의 다른 글
데이터과학개론 14.파이썬을 이용한 데이터 시각화 - 1 (0) | 2024.12.23 |
---|---|
데이터과학개론 13.파이썬을 이용한 데이터 가공 - 2 (0) | 2024.12.23 |
데이터과학개론 12.파이썬을 이용한 데이터 가공 - 1 (0) | 2024.12.23 |
데이터과학개론 11. ggplot2를 이용한 데이터 시각화 (1) | 2024.12.23 |
데이터과학개론 10. 데이터 시각화의 이해 (0) | 2024.12.23 |