인공지능 관련

사이킷런 (scikit-learn) 기초

PGNV 2021. 5. 21. 15:53

사이킷런(scikit-learn) 라이브러리는 파이썬 API를 사용하는데 파이썬 언어는 배우기 쉽고 컴파일하지 않아도 되기 때문에 사용하기 편리합니다. 또한 사이킷런(scikit-learn) 은 대표적인 머신러닝 라이브러리입니다.

 

 

K-최근접 이웃(K-Nearest Neighbors)

어떤 데이터에 대한 답을 구할때,
주위의 다른 데이터를 보고 다수를 차지하는것을 정답으로 사용

 

from sklearn.neighbors import KNeighborsClassifier

knn = KNeighborsClassifier(n_neighbors = 1, weights = "distance", metric="euclidean")

n_neighbors (default=5) : 분류시 고려할 인접 샘플 수

weights(default="uniform") : distance로 설정하면 분류할때 인접한 샘플의 거리에 따라 다른 가중치 부여(가까울수록 큼)

metric(default="minkowski") : 거리계산의 척도 (minkowski, euclidean, mahalanois 등이 있음)

 

 

 

 

 

 

n_jobs

사용할 CPU코어 지정
(-1로 설정하면 모든 CPU사용)
default : 1

n_jobs = -1

 

 

 

 

 

 

fit()

사이킷런 모델을 훈련할 때 사용함

model.fit(X_train, Y_train)

 

 

 

 

 

 

predict()

사이킷런 모델의 성능 측정

model.predict(X_train)

 

 

 

 

 

 

score() 

사이킷런 모델의 성능 측정

model.score(X_train, Y_train)

 

 

 

 

 

 

 

train_test_split()

 

훈련데이터를 훈련 세트와 테스트 세트로 나누는 함수

sfuffle  (default : True) : 훈련 세트와 테스트 세트로 나누기 전에 무작위로 섞을지 여부 결정
(test_size 지정가능)
※test_size (default) : 0.25(25%)

X_train, X_test, Y_train_, Y_test = train_test_split(X, Y, test_size=0.3, random_state=123)

 

 

 mean_absolute_error()

회귀 모델의 평균 절댓값 오차를 계산합니다.(타깃과 예측을 뺀 값을 제곱한 다음 전체 샘플에 대해 평균한 값을 반환)

첫 번째 매개변수는 타깃, 두 번째 매개변수는 예측값을 전달

※평균 제곱 오차를 계산하는 mean_squared_error() 와 비슷

from sklearn.metrics import mean_absolute_error
mean_absolute_error(test_input, train_target)

 

 

 

 

KNeighborsRegressor

k-최근접 이웃 회귀 모델을 만드는 사이킷 런 클래스

n_neighbors(default : 5) 이웃의 개수 지정

from sklearn.neighbors import KNeighborsRegressor
knr = KNeighborsRegressor
knr.fit(train_input, train_target)

 

 

 

LinearRegression()

사이킷런의 선형 회귀 클래스

fit_intercept(default : True) : False로 지정하면 절편을 학습하지 않습니다. 

coef_ : 특성에 대한 계수를 포함한 배열

intercept_ : 절편이 저장됨

 

from sklearn.linear_model import LinearRegression
lr = LinearRegression()

 

 

'인공지능 관련' 카테고리의 다른 글

대표적인 오차 함수  (0) 2021.06.01
최적화 알고리즘 Optimizer  (0) 2021.05.28
인공지능 개발 환경 만들기  (0) 2021.05.18
결정 트리  (0) 2021.05.12
활성화 함수(activation function) 종류와 정리  (0) 2021.05.06