-
[Method] Linear regression (선형회귀)AI부트캠프 2021. 1. 28. 23:41
선형회귀 : independent variable과 dependent variable간의 상관관계를 토대로, 주어져 있지 않은 점의 함수 값을 예측하는 예측모델 (supervised learning의 한 종류이다)
예) independent variable을 x축, dependent variable을 y축으로 할 때, 각 데이터(파란색 점)들의 경향성을 가장 잘 나타내는 회귀선(붉은색 선)을 찾는 것
OLS : 선형회귀 방법 중, 잔차제곱합을 최소화하는 방법
import seaborn seaborn.regplot(x= independent_variables, y= dependent_variables)
[python] scikit-learn을 이용하여 선형회귀모델을 만드는 방법
1. scikit-learn 라이브러리에서 사용할 학습 모델 불러오기
from sklearn.linear_model import LinearRegression
2. 예측모델 인스턴스를 만들기
model = LinearRegression()
3. feature matrix와 label vector 데이터 만들기
feature matrix: 특성행렬, 데이터의 feature들을 tabular 형태로 만든 것
label vector: 데이터의 label 값들을 1차원 형태로 만든 것
(이때 데이터는 df라는 이름의 dataframe에 저장되어 있다고 하자.)
X_train = df[[feature_names]] y_train = df[[target]]
4. 모델을 학습
model.fit(X_train, y_train)
5. 이제 새로운 데이터 샘플을 선택해 학습한 모델을 통해 예측할 수 있다
y_pred = model.predict([[x_value]]) #회귀식에 x_value를 삽입하면 나오는 y 값을 return한다.
6. 선형회귀모델의 계수와 y절편을 구해 independent variable과 dependent variable이 각각 어떤 상관관계를 갖는지 확인할 수 있다.
model.coef_ #계수 확인 model.intercept_ #절편 확인
'AI부트캠프' 카테고리의 다른 글
Tree based model (0) 2021.03.03 Linear model (0) 2021.03.03 [Concept] Section review (0) 2021.01.27 [Concept] Intermediate Linear Algebra (0) 2021.01.19 [Concept] Vectors/ Metrices (0) 2021.01.13