본문 바로가기

CS/AI | CV

머신러닝 프로젝트 계획

개괄적 진행 단계

1. 문제 정의 - 어떤 문제를 해결하고 싶은지
 분류 / 회귀 / 예측 / 이상값 감지 / 그룹화 / 강화학습

어떤 문제를 해결하고자 하느냐에 따라 적합한 알고리즘이 정해져 있음


2. 데이터 수집(공개 데이터 활용, 자체 데이터 수집)

 

3. 데이터 전처리
 - 데이터 형식 맞추기(날짜, 금액 등)
 - 비어있는 값 채우기(근사값, 평균값 등으로 대체, 수치형이 아닌 경우에는 최빈값으로 대체)


4. 연관 데이터 추가


=> 훈련데이터

훈련데이터를 이용해 머신러닝 모델 학습 -> 실전 활용
*훈련데이터 최적화되는 것과 실전 일반화 모두를 생각해야 함

 


*데이터의 양보다는 질!
 질이 괜찮다 싶으면 양 추가하는 식으로 진행

 

5. 알고리즘 선택

 

6. 모델 학습

 (학습용 데이터 + 알고리즘 = 모델)

 

7. 모델 평가

 (언더피팅 / 오버피팅 / 모델 용량 / 평가 지표)

 

8. 알고리즘, 데이터 수정

 

=> 모델 성능 계속 향상시키기

 

*모델 활용: local / web / app

 

 

Under fitting, Good fitting, Over fitting

-언더 피팅
주어진 데이터를 확실하게 학습하지 못한 상태

-굿 피팅
잘 학습이 된 상태

-오버 피팅(과적합, 과대적합)
피팅이 오버하게 된 상태
훈련에서는 잘 돌아가도 실전에서 잘 안돌아갈 확률이 큼

=> 굿 피팅의 함수 활용할 때 결과 가장 좋음
*머신러닝 학습시킬 때 언더피팅인지 오버피팅인지 체크하면서 진행하기!


 

 

 

참고 자료)

ai hub 패션 상품 및 착용 이미지 데이터셋

친절한AI 유투브 재생목록

'CS > AI | CV' 카테고리의 다른 글

이미지 합성 인공지능 #1  (0) 2021.09.13
선형 분류  (0) 2021.09.06
선형 회귀 2, Colab 실습  (0) 2021.07.28
ID Photo Generator | 증명사진 생성기  (0) 2021.07.26
Semantic Segmentation, Instance Segmentation, Object detection  (0) 2021.07.23

Tiny Star