사이킷런(scikit-learn) 라이브러리는 파이썬 API를 사용하는데 파이썬 언어는 배우기 쉽고 컴파일하지 않아도 되기 때문에 사용하기 편리합니다. 또한 사이킷런(scikit-learn) 은 대표적인 머신러닝 라이브러리입니다.
K-최근접 이웃(K-Nearest Neighbors)
어떤 데이터에 대한 답을 구할때,
주위의 다른 데이터를 보고 다수를 차지하는것을 정답으로 사용
from sklearn.neighbors import KNeighborsClassifier
knn = KNeighborsClassifier(n_neighbors = 1, weights = "distance", metric="euclidean")
n_neighbors (default=5) : 분류시 고려할 인접 샘플 수
weights(default="uniform") : distance로 설정하면 분류할때 인접한 샘플의 거리에 따라 다른 가중치 부여(가까울수록 큼)
metric(default="minkowski") : 거리계산의 척도 (minkowski, euclidean, mahalanois 등이 있음)
n_jobs
사용할 CPU코어 지정
(-1로 설정하면 모든 CPU사용)
※default : 1
n_jobs = -1
fit()
사이킷런 모델을 훈련할 때 사용함
model.fit(X_train, Y_train)
predict()
사이킷런 모델의 성능 측정
model.predict(X_train)
score()
사이킷런 모델의 성능 측정
model.score(X_train, Y_train)
train_test_split()
훈련데이터를 훈련 세트와 테스트 세트로 나누는 함수
sfuffle (default : True) : 훈련 세트와 테스트 세트로 나누기 전에 무작위로 섞을지 여부 결정
(test_size 지정가능)
※test_size (default) : 0.25(25%)
X_train, X_test, Y_train_, Y_test = train_test_split(X, Y, test_size=0.3, random_state=123)
mean_absolute_error()
회귀 모델의 평균 절댓값 오차를 계산합니다.(타깃과 예측을 뺀 값을 제곱한 다음 전체 샘플에 대해 평균한 값을 반환)
첫 번째 매개변수는 타깃, 두 번째 매개변수는 예측값을 전달
※평균 제곱 오차를 계산하는 mean_squared_error() 와 비슷함
from sklearn.metrics import mean_absolute_error
mean_absolute_error(test_input, train_target)
KNeighborsRegressor
k-최근접 이웃 회귀 모델을 만드는 사이킷 런 클래스
n_neighbors(default : 5) 이웃의 개수 지정
from sklearn.neighbors import KNeighborsRegressor
knr = KNeighborsRegressor
knr.fit(train_input, train_target)
LinearRegression()
사이킷런의 선형 회귀 클래스
fit_intercept(default : True) : False로 지정하면 절편을 학습하지 않습니다.
coef_ : 특성에 대한 계수를 포함한 배열
intercept_ : 절편이 저장됨
from sklearn.linear_model import LinearRegression
lr = LinearRegression()
'인공지능 관련' 카테고리의 다른 글
대표적인 오차 함수 (0) | 2021.06.01 |
---|---|
최적화 알고리즘 Optimizer (0) | 2021.05.28 |
인공지능 개발 환경 만들기 (0) | 2021.05.18 |
결정 트리 (0) | 2021.05.12 |
활성화 함수(activation function) 종류와 정리 (0) | 2021.05.06 |