머신러닝 프로젝트 계획

개괄적 진행 단계

1. 문제 정의 - 어떤 문제를 해결하고 싶은지
분류 / 회귀 / 예측 / 이상값 감지 / 그룹화 / 강화학습

2. 데이터 수집(공개 데이터 활용, 자체 데이터 수집)

3. 데이터 전처리
- 데이터 형식 맞추기(날짜, 금액 등)
- 비어있는 값 채우기(근사값, 평균값 등으로 대체, 수치형이 아닌 경우에는 최빈값으로 대체)

4. 연관 데이터 추가

=> 훈련데이터

훈련데이터를 이용해 머신러닝 모델 학습 -> 실전 활용
*훈련데이터 최적화되는 것과 실전 일반화 모두를 생각해야 함

*데이터의 양보다는 질!
질이 괜찮다 싶으면 양 추가하는 식으로 진행

5. 알고리즘 선택

6. 모델 학습

(학습용 데이터 + 알고리즘 = 모델)

7. 모델 평가

(언더피팅 / 오버피팅 / 모델 용량 / 평가 지표)

8. 알고리즘, 데이터 수정

=> 모델 성능 계속 향상시키기

*모델 활용: local / web / app

Under fitting, Good fitting, Over fitting

-언더 피팅
주어진 데이터를 확실하게 학습하지 못한 상태

-굿 피팅
잘 학습이 된 상태

-오버 피팅(과적합, 과대적합)
피팅이 오버하게 된 상태
훈련에서는 잘 돌아가도 실전에서 잘 안돌아갈 확률이 큼

=> 굿 피팅의 함수 활용할 때 결과 가장 좋음
*머신러닝 학습시킬 때 언더피팅인지 오버피팅인지 체크하면서 진행하기!

참고 자료)

ai hub 패션 상품 및 착용 이미지 데이터셋

친절한AI 유투브 재생목록

저작자표시 비영리 변경금지 (새창열림)

'CS > AI | CV' 카테고리의 다른 글

이미지 합성 인공지능 #1 (0)	2021.09.13
선형 분류 (0)	2021.09.06
선형 회귀 2, Colab 실습 (0)	2021.07.28
ID Photo Generator \| 증명사진 생성기 (0)	2021.07.26
Semantic Segmentation, Instance Segmentation, Object detection (0)	2021.07.23

damio

머신러닝 프로젝트 계획

개괄적 진행 단계

Under fitting, Good fitting, Over fitting

'CS > AI | CV' 카테고리의 다른 글

티스토리툴바

머신러닝 프로젝트 계획

개괄적 진행 단계

Under fitting, Good fitting, Over fitting

'CS > AI | CV' 카테고리의 다른 글

'CS/AI | CV' Related Articles

티스토리툴바