개괄적 진행 단계
1. 문제 정의 - 어떤 문제를 해결하고 싶은지
분류 / 회귀 / 예측 / 이상값 감지 / 그룹화 / 강화학습
2. 데이터 수집(공개 데이터 활용, 자체 데이터 수집)
3. 데이터 전처리
- 데이터 형식 맞추기(날짜, 금액 등)
- 비어있는 값 채우기(근사값, 평균값 등으로 대체, 수치형이 아닌 경우에는 최빈값으로 대체)
4. 연관 데이터 추가
=> 훈련데이터
훈련데이터를 이용해 머신러닝 모델 학습 -> 실전 활용
*훈련데이터 최적화되는 것과 실전 일반화 모두를 생각해야 함
*데이터의 양보다는 질!
질이 괜찮다 싶으면 양 추가하는 식으로 진행
5. 알고리즘 선택
6. 모델 학습
(학습용 데이터 + 알고리즘 = 모델)
7. 모델 평가
(언더피팅 / 오버피팅 / 모델 용량 / 평가 지표)
8. 알고리즘, 데이터 수정
=> 모델 성능 계속 향상시키기
*모델 활용: local / web / app
Under fitting, Good fitting, Over fitting
-언더 피팅
주어진 데이터를 확실하게 학습하지 못한 상태
-굿 피팅
잘 학습이 된 상태
-오버 피팅(과적합, 과대적합)
피팅이 오버하게 된 상태
훈련에서는 잘 돌아가도 실전에서 잘 안돌아갈 확률이 큼
=> 굿 피팅의 함수 활용할 때 결과 가장 좋음
*머신러닝 학습시킬 때 언더피팅인지 오버피팅인지 체크하면서 진행하기!
참고 자료)
'CS > AI | CV' 카테고리의 다른 글
이미지 합성 인공지능 #1 (0) | 2021.09.13 |
---|---|
선형 분류 (0) | 2021.09.06 |
선형 회귀 2, Colab 실습 (0) | 2021.07.28 |
ID Photo Generator | 증명사진 생성기 (0) | 2021.07.26 |
Semantic Segmentation, Instance Segmentation, Object detection (0) | 2021.07.23 |