데이터 시오 2024. 9. 11. 13:22
728x90
반응형

빅데이터 시대 

우리의 일상생활은 스마트 기기나 센서 등을 통해 측정되어 데이터로 축적, 정리  

 

데이터 : 수집된 원시정보, 단순 사실

통계 : 특정 집단특성을 요약 및 예측하는데 사용되는 숫자정보를 데이터를 평균, 지수 형태로 요약 

== > 소비자물가지수, 경제성장률

 

통계학

- 통계가 확률이론과 결합된 학문

→ 통계로 세상을 체계적으로 이해, 의사결정할 수 있는 방법의 학문인 통계학

데이터의 공정한 수집, 정리· 요약, 미지 사실에 대한 추측 및 의사결정하는 방법의 학문

데이터의 수집과 분석

데이터의 요약과 설명

데이터로부터 결론 도출

 

Statistics = 통계학 / 통계

통계로 해당 분야 이해 → 해당 분야의 지식 중요하다, 통계학은 반드시 필요하지 않다

통계로 해당 분야 분석 & 예측 → 통계학 필요하다


데이터를 통계로 어떻게 만들까

중심위치 : 평균(mean), 중앙값(median), 최빈값(mode)

산포 : 분산(variance), 표준편차(standard deviation)

 

데이터의 중심위치

평균

중앙값 : 데이터를 순서대로 정렬할 때 데이터의 중앙에 위치하는 값

최빈값 : 관심대상의 데이터 중 도수가 가장 큰 값

 

데이터의 산포

산포의 측정

범위: 최댓값에서 최솟값 차감
분산: (관찰값 – 평균)의 제곱합을 (데이터 수-1)로 나눈 것
표준편차: 분산을 제곱근한 것

 

지수 : 시간의 흐름에 따라 수량이나 가격 등이 어떻게 변화되었는지 파악할 수 있도록 만든 통계

- 가격지수와 물량지수

- 라스파이레스식

- 파셰식

- 피셔식


국가통계로 본 우리나라

국가통계의 역할
국가통계: 국가상태를 측정해서 숫자로 요약한 것
국가의 각종 정책 또는 계획의 기초자료
국가통계는 과거부터 체계적으로 작성 → 숫자로 쓴 역사책
국가통계의 이해: 해당 분야의 지식과 통계를 읽을 수 있는 기초지식이 필요


1.통계는 관심대상의 데이터를 요약한 숫자정보이다.
2.통계학은 관심대상에 대한 데이터를 수집하여 요약·정리하고, 이로부터 불확실한 사실에 대한 결론이나 일반적 규칙성을 끌어내는 이론과 방법을 제시하는 학문이다.
3.데이터를 그래프로 표현하는데이터시각화는 세상을 좀 더 효과적으로 이해하게 하고 문제의 핵심을 통찰할 수 있게 한다.
4.데이터의중심위치로는 평균, 중앙값과최빈값이 이용되며, 산포로는 분산과 표준편차가 이용된다.
5.국가통계는 국가의 제도적 틀을 설정·유지하고, 국민의 합의를 도출하여 일관된 국가전략을 추구하는 데 필요한 국가경영의 하부구조 역할을 한다.

728x90