ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [Method] Linear regression (선형회귀)
    AI부트캠프 2021. 1. 28. 23:41

    선형회귀 : independent variable과 dependent variable간의 상관관계를 토대로, 주어져 있지 않은 점의 함수 값을 예측하는 예측모델 (supervised learning의 한 종류이다)

     

    예) independent variable을 x축, dependent variable을 y축으로 할 때, 각 데이터(파란색 점)들의 경향성을 가장 잘 나타내는 회귀선(붉은색 선)을 찾는 것

     

    OLS : 선형회귀 방법 중, 잔차제곱합을 최소화하는 방법

     

    import seaborn
    
    seaborn.regplot(x= independent_variables, y= dependent_variables)

    [python] scikit-learn을 이용하여 선형회귀모델을 만드는 방법

     

    1. scikit-learn 라이브러리에서 사용할 학습 모델 불러오기

    from sklearn.linear_model import LinearRegression

     

    2. 예측모델 인스턴스를 만들기

    model = LinearRegression()

     

    3. feature matrix와 label vector 데이터 만들기

      feature matrix: 특성행렬, 데이터의 feature들을 tabular 형태로 만든 것

      label vector: 데이터의 label 값들을 1차원 형태로 만든 것

    (이때 데이터는 df라는 이름의 dataframe에 저장되어 있다고 하자.)

    X_train = df[[feature_names]]
    y_train = df[[target]]

     

    4. 모델을 학습

    model.fit(X_train, y_train)

     

    5. 이제 새로운 데이터 샘플을 선택해 학습한 모델을 통해 예측할 수 있다

    y_pred = model.predict([[x_value]])
    #회귀식에 x_value를 삽입하면 나오는 y 값을 return한다.

     

    6. 선형회귀모델의 계수와 y절편을 구해 independent variable과 dependent variable이 각각 어떤 상관관계를 갖는지 확인할 수 있다.

    model.coef_ #계수 확인
    model.intercept_ #절편 확인

     

    'AI부트캠프' 카테고리의 다른 글

    Tree based model  (0) 2021.03.03
    Linear model  (0) 2021.03.03
    [Concept] Section review  (0) 2021.01.27
    [Concept] Intermediate Linear Algebra  (0) 2021.01.19
    [Concept] Vectors/ Metrices  (0) 2021.01.13
Designed by Tistory.