본문 바로가기
통계&데이터사이언스/데이터정보처리입문

1강 데이터분석과 컴퓨터

by 데이터 시오 2024. 2. 27.
728x90
반응형

1.1 데이터정보와 컴퓨터

1. 지식정보화 

정보화 사회: 빅데이터Big Data, 딥러닝Deep Learning, AI

- 정보가 중심이 되어 사회, 경제가 움직이는 사회

- 정보의 수집과 분석 및 정확한 판단 없이는 살아갈 수 없는 사회

- 정보가 급하게 증대, 성장, 보급되는 사회

 

정보화 사회에서는 효율적인 정보의 수집, 수집된  정보의 가치판단, 정보 활영 능력 등이 필수적으로 요구됨

이러한 의미에사 지금은 지식정보화 사회

 

지식정보화 사회에서 데이터를 효율적으로 처리하고 분석하기 위해서는 컴퓨터의 활용 및 데이터 분석 능력이 필수적임

 

2. 지식정보화 사회에서 필수적인 요구사항

 

컴퓨터의 활용방법을 알고 있어야 함

인터넷을 효율적으로 활용할 수 있도록 함

정보를 제대로 이해하고, 문제를 파악하고 판단하기 위해 통계적인 (논리적인) 사고가 요구됨

데이터 분석에 대한 기본 개념과 방법론들을 숙지

데이터로부터 유용한 정보를 추출하고, 합리적인 의사결정을 하기 위해서는 데이터분석 소프트웨어를 잘 활용할 수 있도록 함

 

1.2 데이터분석 개요

❤️‍🔥 데이터분석 절차

<문제의 정의>

          🔽

<조사, 실험의 계획>

          🔽

<데이터의 수집>

          🔽

<데이터의 정리, 분석>

          🔽

<분석결과의 평가>

 

🌵문제의 정의

- 일반적으로 연구의 시작은 대개 간단하고 모호한 질문부터 시작된다

- 자세하고 정확한 질문으롤 구체화 시켜 연구의 목적으로 하는 것이 문제의 정의

- 연구 대상이 되는 모집단이 어떠한 것이며, 무엇이 불확실한 상황, 어떠한 의사결정들이 내려질 수 있는지에 대한 자세한 검토가 이루어져야한다. 

 

🌵조사, 실험의 계획 

연구의 목적이 명확하게 정의가 되면 달성할 수 있는 조사 / 실험을 계획해야한다

구체적으로 연구대상이 되는 모집단을 모두 조사할 것이지 아니면 표본만을 조사할 것인지 결정

표본을 조사하려고 한다면 어떻게 표본을 선택할 것, 표본의 크기는 어느정도로 하며, 각 표본에서는 무슨 자료를 얻을 것인지를 결정해야한다.

 

🌵데이터의 수집

구체적인 조사, 실험이 계획되면 이에 따라 데이터를 수집하낟

자료가 이미 수집되어 있거나 인터넷 / 문헌에서 쉽게 구할 수 있다. 다만, 이 때는 이 자료들이 연구목적에 적절하고 정확한 것이니지를 검토해야한다.

 

🌵데이터의 정리, 분석

적절한 데이터 수집 후 도표나 그림을 이용해 자료를 정리한다

주어진 문제의 해결에 적합한 분석방법을 이용, 자료를 분석한다

데이터분석 시스템의 활용 >> 엑셀, R, 파이썬, SAS, SPSS, Minitab 등

통계적 분석 >> 기술통계, 탐색적 자료분석, 범주형자료분석, 두 모집단 비교, 회귀분석, 실험계획, 다변량 분석

 

🌵분석결과의 평가

분석결과를 이용해 연구목적에서 제기된 질문에 대한 결론을 내린다

어떤 경우에는 부분적인 답만 결론을 내릴 수 있다

제기되지 않았던 질문에 대한 결론을 얻을 수 있다

결론에 따른 여러 새로운 연구에 대한 제안도 할 수 있다.

1.3. 데이터분석 소프트웨어 소개 

1. SPSS (www.spss.co.kr)

GUI 환경 하에서 통계분석 및 자료처리가 이루어짐

분석절차에 맞게 다양한 대화상자가 제공되므로 쉽게 분석처리가 가능

스프레드시트 형태이 데이터 입력으로 일반 사용자에게 친숙 

메뉴방식 및 프로그램 방식을 모두 이용하여 통계분석절차를 제공

메뉴방식을 이용한 통계그래픽스 기능이 뛰어남

 

2. SAS(www.sas.co.kr)

자료의 처리 기능이 뛰어나다

데이터베이스, 데이터 웨어하우징 등의 기능이 탁월하다 

다양한 통계분석 절차를 가짐

데이터마이닝 기능이 뛰어남

빅데이터 솔루션 기능

프로그램 방식이 기본이다

 

 

SAS 모듈 

SAS/BASE

SAS.STAT

SAS/AF

SAS/ASSIST

SAS/ETS

SAS/GRAPH

SAS/IML

SAS/INSIGHT

SAS/OR

SAS/QC

SAS/E-Miner

 

3. R (www.r-project.org)

무료

기능이 매우 뛰어나다

프로그램 처리방식

자료처리, 분석 & 그래픽스 분야에 탁월한 기능

 

4. Python 파이썬 

무료

객체지향언어

프로그램 문법이 쉽다

머신러닝, 딥러닝 분야에 탁월한 기능

 

 

 

 

 

 

 

728x90