사이킷런 (scikit-learn) 기초

인공지능 관련

사이킷런 (scikit-learn) 기초

PGNV 2021. 5. 21. 15:53

사이킷런(scikit-learn) 라이브러리는 파이썬 API를 사용하는데 파이썬 언어는 배우기 쉽고 컴파일하지 않아도 되기 때문에 사용하기 편리합니다. 또한 사이킷런(scikit-learn) 은 대표적인 머신러닝 라이브러리입니다.

K-최근접 이웃(K-Nearest Neighbors)

어떤 데이터에 대한 답을 구할때,
주위의 다른 데이터를 보고 다수를 차지하는것을 정답으로 사용

from sklearn.neighbors import KNeighborsClassifier

knn = KNeighborsClassifier(n_neighbors = 1, weights = "distance", metric="euclidean")

n_neighbors (default=5) : 분류시 고려할 인접 샘플 수

weights(default="uniform") : distance로 설정하면 분류할때 인접한 샘플의 거리에 따라 다른 가중치 부여(가까울수록 큼)

metric(default="minkowski") : 거리계산의 척도 (minkowski, euclidean, mahalanois 등이 있음)

n_jobs

사용할 CPU코어 지정
(-1로 설정하면 모든 CPU사용)
※default : 1

n_jobs = -1

fit()

사이킷런 모델을 훈련할 때 사용함

model.fit(X_train, Y_train)

predict()

사이킷런 모델의 성능 측정

model.predict(X_train)

score()

사이킷런 모델의 성능 측정

model.score(X_train, Y_train)

train_test_split()

훈련데이터를 훈련 세트와 테스트 세트로 나누는 함수

sfuffle (default : True) : 훈련 세트와 테스트 세트로 나누기 전에 무작위로 섞을지 여부 결정
(test_size 지정가능)
※test_size (default) : 0.25(25%)

X_train, X_test, Y_train_, Y_test = train_test_split(X, Y, test_size=0.3, random_state=123)

mean_absolute_error()

회귀 모델의 평균 절댓값 오차를 계산합니다.(타깃과 예측을 뺀 값을 제곱한 다음 전체 샘플에 대해 평균한 값을 반환)

첫 번째 매개변수는 타깃, 두 번째 매개변수는 예측값을 전달

※평균 제곱 오차를 계산하는 mean_squared_error() 와 비슷함

from sklearn.metrics import mean_absolute_error
mean_absolute_error(test_input, train_target)

KNeighborsRegressor

k-최근접 이웃 회귀 모델을 만드는 사이킷 런 클래스

n_neighbors(default : 5) 이웃의 개수 지정

from sklearn.neighbors import KNeighborsRegressor
knr = KNeighborsRegressor
knr.fit(train_input, train_target)

LinearRegression()

사이킷런의 선형 회귀 클래스

fit_intercept(default : True) : False로 지정하면 절편을 학습하지 않습니다.

coef_ : 특성에 대한 계수를 포함한 배열

intercept_ : 절편이 저장됨

from sklearn.linear_model import LinearRegression
lr = LinearRegression()

'인공지능 관련' 카테고리의 다른 글

대표적인 오차 함수 (0)	2021.06.01
최적화 알고리즘 Optimizer (0)	2021.05.28
인공지능 개발 환경 만들기 (0)	2021.05.18
결정 트리 (0)	2021.05.12
활성화 함수(activation function) 종류와 정리 (0)	2021.05.06

현재글사이킷런 (scikit-learn) 기초

코딩초보자의 프로그래밍도전! Programming New Visitor

SSAFY, 데이터 베이스 모델링, Database Modelling, 싸피 경쟁률, Google Developers Machine Learning Bootcamp 2021, 프로그래밍, java, 싸피 웹컴킷 후기, 리틀 엔디안(Little endian), 싸피 7기, 7기 싸피, Machine Learning Bootcamp, 파이썬, 구글 부트캠프, 빅 엔디안(Big endian), 구글 개발자 머신러닝 부트캠프, 자바, 합격후기, 모바일반, python,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

PGNV 계단