선행 지식


image.png

Model이라는 것은 어떤 함수라고 생각한다.

우리가 딥러닝을 배운다고 하면 어떤 X(입력 데이터)를 학습하여 Y에 가깝게 추론할 수 있는 모델을 구축하여야 하는데 이때 X→Y 로 만들 수 있게 해주는 F(function)을 찾는 것이 모델이라고 생각한다.

Linear Statistical Model은 function이

$Y=B_0 + B_1X + B_2X_2 + \cdots + B_nX_n + e$ 와 같은 수식이다.

이때 $X$는 독립변수 $Y$는 종속 변수로써 독립변수 앞의 가중치에 따라 어느 것이 더 중요한지 파악할 수있으며 독립변수에 의해 종속 변수가 결정된다.

image.png

우리는 데이터를 설명할 수 있는 최적의 Linear Statistical Model을 찾아야한다.

이러한 문제는 파라미터 최적의 $B_0,B_1$를 찾아내는 일로 귀결된다.

Least-square method (최소 자승법)이라는 방법으로 최적의 $B_0,B_1$를 찾을 수가 있는데

찾기 위해서는 SSE(Sum of Squares for error)라는 손실함수가 필요하다.

$SSE = \sum_{i=1}^n(y_i-\hat{y_i})$ 는 다음 수식과 같은데

이때, $y_i,\hat{y_i}$는 각각 실제값과 예측값이다.

그 둘의 차이를 모두 더하여 모델이 실제 값과 유사하게 예측하는지 평가할 수 있다.