728x90
반응형

3장의 학습목표는 머신러닝과 딥러닝, 두 가지 성격의 대회를 정복하는 일반적인 프로세스를 알아보고, 프로세스의 각 단계에서 확인해야 할 체크리스트를 정리하는 것이다.
1. 머신러닝 문제해결 프로세스
캐글 경진대회에서 대회에 따라 세부 내용은 조금식 다를 수 있다. 하지만, 큰 흐름과 구조는 비슷하다
문제(경진대회)이해 - 문제를 정확하게 이해해야 목표점 정확히 설정 가능
탐색적 데이터 분석 - 데이터를 면밀히 분석, 효과적인 모델을 찾고 최적화 가능
데이터 전처리 - 캐글 데이터 대부분은 전처리가 이루어진 데이터를 제공
베이스라인 모델 - 기본 모델을 만든다
성능개선 - 다양한 아이디어를 활용해 모델 성능 올리기 (창의력이 가장 많이 필요로 하는 부분)
1. 문제(경진대회)이해
문제이해
어떤 문제를 풀어야 하는지 이해
경진대회의 배경 & 목적 이해
어떤 데이터를 활용해 어떤 값을 예측해야하는지, 회귀 문제인지 분류 문제인지, 어떻게 접근해야 하는지 등 자양한 사항 확인
평가지표 파악
대회 평가지표를 파악한다
2. 탐색적 데이터 분석
3. 베이스라인 모델
4. 성능개선
2. 머신러닝 문제해결 체크리스트
3. 딥러닝 문제해결 프로세스
4. 딥러닝 문제해결 리스트
728x90