본문 바로가기

CS/AI | CV

선형 분류

@Binary Label Encoding -> "0" or "1"

고양이 or not 고양이 같은 범주형(비정형) 데이터들은 반드시 인코딩 되어야 함(0 or 1)

 

 

정답 Y는 0과 1로만 구분할 수 있다고 가정

정답을 구하는 데 있어서 모델이 적합하지 않을 수 있음

1보다 크거나 0보다 작거나,,,,

-> 가설 재설정

 

 

H(x) = Wx + b

 

H 값을 0에서 1 사이로 제한 거는 방법?

-> 시그모이드 함수(0과 1 사이로 모든 값을 바운드 시킬 수 있음)

 

 

Z = WX 에서

Z 값을 0 < Z < 1

0 에서 1 사이로 바운드 시키기

 

sigmod 함수 덕분에 H(x)가 바운드됨

 

 

Cost function에 적용

기존 선형회귀 cost function에 적용하면 local minima(지역 극소점)에 빠짐

미분 값이 0인 지역이 중간중간 나옴

 

-> 가설 설정 변경 되었으므로 cost 함수도 재설계!

* cost function : 예측 값(가설 값)이 얼마나 정답에 가까운지 측정하는 척도

 

설계 팁

- 정답에 가까워질수록 cost function 값 작게

            멀어질수록 cost funtion 값 크게!

 

 

조건부로 수식이 나눠져 있으면 코딩 시 불편함

하나의 방정식으로 표현하는 게 중요

 

C(H(x), y) = -ylog(H(x)) - (1-y)log(1-H(x))

 

 

 

요약)

 

선형 회귀는 이진 분류하는데 문제가 있어서 로지스틱 회귀로 변경,

로지스틱 회귀를 이용하기 위해

시그모이드 함수 이용해 변경했을 때

 

cost function은 위와 같은 식으로 변경해야 함(재설계)

 

경사하강법 이용해 W 구할 수 있음

 

=> 구해진 W로 이진 분류 가능!

 

 

 

'CS > AI | CV' 카테고리의 다른 글

이미지 합성 인공지능 #2  (0) 2021.09.13
이미지 합성 인공지능 #1  (0) 2021.09.13
머신러닝 프로젝트 계획  (0) 2021.08.31
선형 회귀 2, Colab 실습  (0) 2021.07.28
ID Photo Generator | 증명사진 생성기  (0) 2021.07.26

Tiny Star