[생활코딩] 머신러닝1 (3)
머신러닝은
1. 지도학습
2. 비지도학습
3. 강화학습
지도학습 = 기계를 가르친다는 의미
비지도학습은 지도학습에 포함되지 않는 방법
데이터의 성격을 파악하거나 데이터를 잘 정리정돈 하는 것
강화학습은 학습을 통해서 능력을 향상시킨다는 점에서 지도학습과 비슷하다
차이점 - 어떻게 하는 것이 좋은 결과를 낼 수 있는지를 느기면서 실력 향상을 위함이 다른다.
'더 좋은 답'을 경험을 통해 찾아가는 것
지도학습 Supervised Learning
지도학습은 과거의 데이터로부터 학습해서 결과를 예측하는데 주로 사용한다
머신러닝의 지도학습을 이용하기 위해 충분히 많은 데이터를 수집해야 한다.
데이터는 독립변수와 종속변수로 이루어져있다
지도학샙을 하기 위해서는 과거 대이터가 있어야 한다
그 데이터를 독립변수 / 종속변수로 분리 필요
독립변수와 종속변수의 관계를 학습시키면 컴퓨터는 그 관계를 설명할 수 있는 공식을 만든다
좋은 Model 되려면 데이터가 많을수록 & 정확할수록 좋다
회귀 & 분류
회귀는 영어로 Regression이고, 분류는 Classification
양적 데이터 & 범주형 데이터
1. 양적 데이터
- 얼마나 큰지, 얼마나 많은지, 어느정도 인지를 의미하는 데이터
- 종속변수가 양적 데이터라면 회귀를 사
2. 범주형 데이터
- 종속변수가 범주형 데이터라면 분류를 사용
비지도 학습
군집화(Clustering) - 비슷한 것들 모아서 그룹을 만드는 것
분류는 어떤 대상이 어떤 그룹에 속하는지를 판단하는 것
연관규칙학습
서로 연관된 특징을 찾아내는 것
= 장바구니 분석이라고도 함
강화학습
강화학습은 일단 해보면서 경험을 통해 실력을 향상시키는 것
더 많은 보상을 받을 수 있는 정책을 만드는 것이 핵심