새소식

반응형
AI/ML*DL 시작하기

선형회귀(Linear Regression)

  • -
반응형

머신러닝을 배우기 시작하면 꼭 한번 쯤은 공부하게 되는 선형회귀분석입니다.

 

머신러닝을 배우는 과정에서는 선형회귀외에도 Binary Classificaion, PCA분석, KNN 알고리즘 등 다양한 방법들이 있지만 오늘은 선형회귀에 대해 알아보고자 합니다. 

 

아래 이미지가 잘 보이시나요?

선형회귀분석을 잘 설명하는 이미지라고 볼 수 있습니다. 

 

파란색 점들이 데이터 일때, 파란색 데이터들이 어떤 형태로 이루어져 있는 것 처럼 보이시나요?

 

빨간색 선이 잘 보여주고 있죠? 마치 데이터들이 선형성(Linear)을 띄고 있다는 것을 알 수 있습니다.

 

선형회귀분석을 적용하고자 하신다면 기본적으로 데이터들이 선형성을 띄는것이 필요합니다. 

 

반대로 말하자면 분석하고자 하는 데이터셋이 원형형태의 군집을 이루고 있거나, 방사형으로 퍼져있는 경우에는 선형회귀분석에 적합하지 않습니다.

 

위 그림만 본다면, X값에 따라 어느정도 Y값의 범위를 예측할 수 있습니다. 선형회귀의 원리는 선형성을 띄는 데이터셋에서 가장 오차율이 적은 y=wx+b를 찾는 것이라고 보시면 됩니다. 마치 저 빨간색 선 처럼 말이죠 

고로, 저희 가설(Hypothesis)은 H(x) = wx+b로 시작하게 됩니다. 임의의 기울기 값과 bias값에서 데이터셋을 학습하면서 가장 이상적인 기울기와 Bias값을 찾아내는 것이죠. 위 그림처럼 빨간색 선 또는 노란색 선에서 학습할 수록 점점 파란색 선으로 바꿔가는 과정이라고 보시면 됩니다.

 

자 이제 다음 포스팅에서는 Python을 이용해서 학습과정에 대해 간단한 실습을 진행해보겠습니다.

반응형
Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.