티스토리 뷰

https://hunkim.github.io/ml/

Sung Kim 교수님의 모두를 위한 머신러닝/딥러닝을 정리한 것


Logistic (Regression) Classification



- classification algorithm 중에서 굉장히 정확도가 높다.

- 실제 문제에서도 바로 적용해 볼 수 있다.

- Neural Network과 Deep Learning을 이해하는데 중요한 역할


Classification

- 둘 중 하나의 정해진 category 찾기

ex)

1. 스팸메일인지 아닌지

2. 이전의 좋아요한 data로 학습해서 feed를 보여줄지 안보여줄지

3. 신용카드를 도난당했을때 평소와 다른 소비패턴인지 아닌지 등등




공부 시간에 따른 pass / fail 에 관한 data에 대하여





Linear Regression으로 해결 할 수 있지 않을까?



hours가 증가하면서 생기는 pass데이터로 인해 적정한 pass 지점이 변경된다.

이로 인해 기존의 pass였던 data가 fail이 되는 부적절한 판단이 생긴다.


binary classification의 경우 output을 오직 0과 1을 가지는데

Linear Regression은 hypothesis가 1보다 크거나 0보다 작은 값을 가질 수 있다.




그렇다면, hypothesis를 0과 1사이로 압축시켜주는 함수가 있을까?


Sigmoid function(logistic function)



https://www.quora.com/Why-is-logistic-regression-considered-a-linear-model



- Z = WX로 WX가 커질수록 1에 가까워지고 작을수록 0에 가까워진다.




Logistic Hypothesis

- Z 대신 WX(matrix형태)로 나타냄



Cost Function

- 기존 cost function의 hypothesis는 convex하다

- hypothesis를 0~1사이로 만들었더니(Linear -> sigmoid) 그래프가 다음과 같이 바뀌었다.

-> Model을 쓸 수 없다.

-> cost function을 바꾸자!


New cost function for logistic





Gradient Descent Algorithm



Comments
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday