Machine Learning은 데이터를 기반으로 최적화
Linear Regression은 예측(Regression)을 할 경우에 많이 사용된다.
예를 들어, X(입력 데이터)가 주어졌을 때, 실수 Y를 예측하는 경우 (강수량 예측, 판매량 예측)에 사용된다.
그렇다면, Classification과 같은 문제는 어떻게 풀어야할까요?
다음과 같은 문제를 풀기위한 Logistic Regression에 대해서 알아보도록 하겠습니다.
스탠다드 로지스틱 함수(시그모이드)
$Logistic \; function = \frac{L}{1+e^{-k(x-x_0)}}$
$x_0$:midpoint, $L$: curve’s maximum value, $k$: steepness of the curve로
$Standard \; Logistic \; function\; f(x) =\frac{1}{1+e^{-x}} = \frac{e^x}{1+e^{x}}$
스탠다드 로지스틱 회귀는 중간점이 0이고, $L$이 1인 경우일 때, 스탠다드 로지스틱회귀라고 말한다.
스탠다드 로지스틱 회귀는 0 ~ 1만 까지 출력을 가능하게 만든다.
0.5보다 크다면 1로 분류가능하게 만들어 버리고 0.5보다 작다면 0으로 분류해버리게 만든다.
그렇게 함으로써 이진 분류가 가능하게 된다.