머신러닝 모델은 파라미터와 하이퍼파라미터로 구성된 수학적 함수이다
- 파라미터 : 모델 학습동안 변화하는 변수로 학습한 내용을 저장한 변수
- 하이퍼파라미터 : 학습이전에 세팅되는 고정된 변수값

선형모델은 bias 와 weight의 파라미터로 이루어져있음
선형 모델에서는 피처 값의 변화에 따라 레이블의 값이 일정하게 변화함
이것을 2D 공간에서 시각화하면 좌상단의 그림과 같음
y= mx + b 형태의 식으로 나타나는데 레이블 데이터를 학습하면서, m과 b에 대한 값이 조정된다
이 개념을 3차원으로도 그릴 수 있수 있는데 위와 같이 하이퍼플레인이 그려짐

그러면 선형모델이 어떻게 데이터를 분류할까?
가장 심플한 케이스는 이진분류
두 종류의 데이터를 가장 잘 나누는 선이 곧 좋은 모델
이 선을 결정경계(Decision Boundary)라고 함
이 때 중요한 것은 학습하지 못한 데이터까지
포괄적으로 분류하는 선을 찾는 것이 중요함

 

 

 

 

 

+ Recent posts