[통계로세상읽기] 1강
빅데이터 시대
우리의 일상생활은 스마트 기기나 센서 등을 통해 측정되어 데이터로 축적, 정리
데이터 : 수집된 원시정보, 단순 사실
통계 : 특정 집단특성을 요약 및 예측하는데 사용되는 숫자정보를 데이터를 평균, 지수 형태로 요약
== > 소비자물가지수, 경제성장률
통계학
- 통계가 확률이론과 결합된 학문
→ 통계로 세상을 체계적으로 이해, 의사결정할 수 있는 방법의 학문인 통계학
데이터의 공정한 수집, 정리· 요약, 미지 사실에 대한 추측 및 의사결정하는 방법의 학문
데이터의 수집과 분석
데이터의 요약과 설명
데이터로부터 결론 도출
Statistics = 통계학 / 통계
통계로 해당 분야 이해 → 해당 분야의 지식 중요하다, 통계학은 반드시 필요하지 않다
통계로 해당 분야 분석 & 예측 → 통계학 필요하다
데이터를 통계로 어떻게 만들까
중심위치 : 평균(mean), 중앙값(median), 최빈값(mode)
산포 : 분산(variance), 표준편차(standard deviation)
데이터의 중심위치
평균
중앙값 : 데이터를 순서대로 정렬할 때 데이터의 중앙에 위치하는 값
최빈값 : 관심대상의 데이터 중 도수가 가장 큰 값
데이터의 산포
산포의 측정
범위: 최댓값에서 최솟값 차감
분산: (관찰값 – 평균)의 제곱합을 (데이터 수-1)로 나눈 것
표준편차: 분산을 제곱근한 것
지수 : 시간의 흐름에 따라 수량이나 가격 등이 어떻게 변화되었는지 파악할 수 있도록 만든 통계
- 가격지수와 물량지수
- 라스파이레스식
- 파셰식
- 피셔식
국가통계로 본 우리나라
국가통계의 역할
국가통계: 국가상태를 측정해서 숫자로 요약한 것
국가의 각종 정책 또는 계획의 기초자료
국가통계는 과거부터 체계적으로 작성 → 숫자로 쓴 역사책
국가통계의 이해: 해당 분야의 지식과 통계를 읽을 수 있는 기초지식이 필요
1.통계는 관심대상의 데이터를 요약한 숫자정보이다.
2.통계학은 관심대상에 대한 데이터를 수집하여 요약·정리하고, 이로부터 불확실한 사실에 대한 결론이나 일반적 규칙성을 끌어내는 이론과 방법을 제시하는 학문이다.
3.데이터를 그래프로 표현하는데이터시각화는 세상을 좀 더 효과적으로 이해하게 하고 문제의 핵심을 통찰할 수 있게 한다.
4.데이터의중심위치로는 평균, 중앙값과최빈값이 이용되며, 산포로는 분산과 표준편차가 이용된다.
5.국가통계는 국가의 제도적 틀을 설정·유지하고, 국민의 합의를 도출하여 일관된 국가전략을 추구하는 데 필요한 국가경영의 하부구조 역할을 한다.