통계&데이터사이언스/빅데이터의 이해와 활용

[빅데이터의 이해와활용] 빅데이터 시각화

데이터 시오 2024. 10. 7. 16:18
728x90
반응형

데이터 시각화

데이터 시각화

- 이미지를 통해 인지 과정을 돕는다

- 데이터의 숨은 의미를 발견, 설명, 이를 통해 의사결정을 내리는데 도움을 주는 통찰력을 가지게 한다

- 시각화 = 외부인지보조

 

데이터 시각화의 원칙

1. 데이터 시각화는 정직해야 한다

2. 정보의 시각화 과정에서 디자인은 항상 간결, 정확해야 한다


시간 시각화

시계열 데이터는 데이터 시각화의 가장 기본적인 형태

이 데이터를 통해 파악할 수 있는 것은 Trend (경향성)

 

선 그래프

- 대부분의 시계열 데이터를 표현할 수 있는 그래프

- 하나의 그래프에 여러개의 데이터를 그려서 비교할 수 있다는 장점이 있다

 

점 그래프

- 시간에 따라 데이터 포인트로 표현하는 그래프

- 데이터 포인트 수가 많을 때 적합하다

 

막대 그래프

- 시간에 따라 명확하게 구분되는 데이터 포인트를 사용할 때 적합한 그래프

- 데이터 포인트가 일정하게 분포되어 있을 때 주로 사용한다

 

누적 그래프

- 범주가 여러개일 경우, 범주를 서로 비교하는 것이 아니라 모두를 합친 것이 의미를 가질 때 사용한다

 

버블 그래프

- 원의 크기가 데이터의 어떠한 값을 표현

- 시간에 따라 변화하는 두개의 값, 즉 버블의 x,y 위치, 크기 등을 모두 한번에 보여줄 수 있다

 

칼라 스케일 그래프

- 막대 그래프의 높이 대신 시각적인 색으로 차이가 나게 보여주는 그래프

- 주로 x, y축을 활용한 패턴을 보여주어야 할 때 사용


텍스트 시각화

텍스트 시각화

- 문서의 핵심을 손쉽게 파악한다

- 많은 양의 문서를 분류해 전체 문서를 조망한다

- 문서의 내용이나 문서의 집합이 어덯게 서로 다른지 비교한다

- 시간에 따라 텍스트가 어떻게 변해왔는지 분석한다

- 텍스트에 나타나는 패턴을 파악한다

 

워드클라우드

- 문서에 등장한 단어의 빈도수를 이용해 어떤 단어를 많이 사용했는지 시각화

- 많은 문서들에서 중요한 단어 추출하는데 유용

 

워드트리 Word Tree

- 한글 구조에 적용은 어렵다

- 특정한 단어가 다른 단어들과 어떤 구조로 연결되어있는지 시각화


소셜 네트워크 시각화

 

데이터 시각화의 도구

728x90