통계&데이터사이언스/데이터과학개론

데이터과학개론 11. ggplot2를 이용한 데이터 시각화

데이터 시오 2024. 12. 23. 10:29
728x90
반응형

 

1. ggplot2 패키지의 기본 구조

문법적 구조

기본적인 구조를 유지하면서 부분적 변경으로 다양한 시각화 방법을 구현한다

 

함수의 추가

시각화 방법에 따라 여려 개의 함수를 추가할 수 있다

- geom 계열 함수 여려 개를 병렬적으로 추가할 수 있다

- 세부 옵션을 위해 coord 계열 함수 외에도 facet 계열 함수,

scale 계열 함수, theme 계열 함수 등을 추가 가능하다

ggplot() 함수와 geom 계열 함수는 반드시 포함되어야 하는 필수요소이다

2. ggplot2를 이용한 시각화 사례

패키지의 활성화

library 함수가 반드시 필요하다

library(tidyverse) 또는  library(ggplot2)

 

ggplot2

주어진 데이터를 가지고 시각화를 구현하는 시작 단계에서 사용

- 함수 내에 시각화 대산이 되는 데이터, 축의 설정,

그래프 색깔, 투명도, 선 패턴 등 큰 틀을 매핑하는  aes() 함수가 위치한다

 

geom 계열 함수

기본적으로 생성된 그래프에 추가적으로 적용해 새로운 시각화를 구현한다

ggplot(mtcars1, aes(hp, mpg, color=factor(cyl)))

+geom_point()

+geom_smooth(aes(group=123),se = FALSE)

3. ggplot2의 시각화 코드 구조

+ 로 연결된 문법 구조

ggplot(data= < dataset name>)

+ geom_function(aes<mapping>))

+ coord_function

+ scale_function

 

 

728x90