[빅데이터의 이해와활용] 빅데이터 시각화
데이터 시각화
데이터 시각화
- 이미지를 통해 인지 과정을 돕는다
- 데이터의 숨은 의미를 발견, 설명, 이를 통해 의사결정을 내리는데 도움을 주는 통찰력을 가지게 한다
- 시각화 = 외부인지보조
데이터 시각화의 원칙
1. 데이터 시각화는 정직해야 한다
2. 정보의 시각화 과정에서 디자인은 항상 간결, 정확해야 한다
시간 시각화
시계열 데이터는 데이터 시각화의 가장 기본적인 형태
이 데이터를 통해 파악할 수 있는 것은 Trend (경향성)
선 그래프
- 대부분의 시계열 데이터를 표현할 수 있는 그래프
- 하나의 그래프에 여러개의 데이터를 그려서 비교할 수 있다는 장점이 있다
점 그래프
- 시간에 따라 데이터 포인트로 표현하는 그래프
- 데이터 포인트 수가 많을 때 적합하다
막대 그래프
- 시간에 따라 명확하게 구분되는 데이터 포인트를 사용할 때 적합한 그래프
- 데이터 포인트가 일정하게 분포되어 있을 때 주로 사용한다
누적 그래프
- 범주가 여러개일 경우, 범주를 서로 비교하는 것이 아니라 모두를 합친 것이 의미를 가질 때 사용한다
버블 그래프
- 원의 크기가 데이터의 어떠한 값을 표현
- 시간에 따라 변화하는 두개의 값, 즉 버블의 x,y 위치, 크기 등을 모두 한번에 보여줄 수 있다
칼라 스케일 그래프
- 막대 그래프의 높이 대신 시각적인 색으로 차이가 나게 보여주는 그래프
- 주로 x, y축을 활용한 패턴을 보여주어야 할 때 사용
텍스트 시각화
텍스트 시각화
- 문서의 핵심을 손쉽게 파악한다
- 많은 양의 문서를 분류해 전체 문서를 조망한다
- 문서의 내용이나 문서의 집합이 어덯게 서로 다른지 비교한다
- 시간에 따라 텍스트가 어떻게 변해왔는지 분석한다
- 텍스트에 나타나는 패턴을 파악한다
워드클라우드
- 문서에 등장한 단어의 빈도수를 이용해 어떤 단어를 많이 사용했는지 시각화
- 많은 문서들에서 중요한 단어 추출하는데 유용
워드트리 Word Tree
- 한글 구조에 적용은 어렵다
- 특정한 단어가 다른 단어들과 어떤 구조로 연결되어있는지 시각화
소셜 네트워크 시각화