머신러닝 : Pipeline 사용법

pipeline은 사용자가 정의한 데이터 전처리부터 모델학습 까지의 일련의 과정들을 하나의 class로 묶어 줍니다. 이로인해 사용자가 얻을 수 있는 장점은 다음과 같습니다.

주요 파라미터

fit(X, y) : X를 step에 따라 각 transformer에서 fit_transform()하고 최종적으로 estimator를 fit()한다. [마지막 step이 estimator일 때만 가능]
transform(X) : X를 step에 따라 transform()한 결과를 반환. [마지막 step이 transformer일때만 가능]
predict(X) : X를 step에 따라 transform하고 estimator로 predict()한 결과 반환. [마지막 step이 estimator일때만 가능]
fit_transform(X) : 모든 단계에서 fit_transform()한 결과를 반환. [마지막 step이 transformer일때만 사용가능]
fit_predict(X, y) : fit()의 최종단계에서 estimator가 fit_predict()를 수행. [마지막 step이 estimator일 때만 가능]