Scikit-learn jest jedną z najczęściej wybieranych bibliotek do projektów uczenia maszynowego, zarówno przez początkujących, jak i zaawansowanych użytkowników, co zawdzięcza swojej elastyczności, wszechstronności i prostocie użycia. Zapewnia narzędzia do budowy i trenowania modeli, a także do analizy danych i zapewnia kompatybilność z innymi narzędziami do analizy danych dostępnych w Pythonie.
Link do oficjalnej strony scikit-learn.
Źródło: [1]
Bibliotekę sklearn możemy wykorzystać do:
W scikit-learn dostępne jest kilka funkcji, które mogą być wykorzystane przy różnych modelach i procesach uczenia maszynowego, co ułatwia korzystanie z tej biblioteki. Poniżej znajduje się kilka przykładów:
X
oznaczone są cechy, a jako y
etykiety)X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
X_train
i etykietach y_train
:model.fit(X_train, y_train)
X_test
:model.predict(X_test)
model.score(X_test, y_test)
scaler.fit_transform(training_data)
scaler.transform(test_data)
cross_val_score(model, X_train, y_train, cv=5)
# param_grid jest słownikiem i dla drzewa decyzyjnego może wyglądać następująco:
param_grid = {'max_depth': [None, 10, 20, 30],
'min_samples_split': [2, 10, 20],
'min_samples_leaf': [1, 5, 10],
'max_features': [None, 'sqrt', 'log2']}
# a przeszukiwanie przy pomocy przeszukiwania po siatce hiperparemetrów
GridSearchCV(model(), param_grid, cv=5)
from sklearn import datasets
# Wczytanie datasetu Iris
iris = datasets.load_iris()
# Dostępne są inne datasety, do których dostęp jest za pomocą datasets.load_nazwa(), np.
digits = datasets.load_digits()
wine = datasets.load_wine()
# Możliwe jest też pobieranie datasetów z OpenML, np.
mnist = datasets.fetch_openml('mnist_784', version=1)
Utworzenie samemu zbioru danych jest czasochłonne i wymaga następnie przetworzenia danych, co ponownie może być czasochłonne i dodatkowo skomplikowane. Istnieją strony, na których użytkownicy mogą wstawić datasety, aby inni mogli z nich publicznie korzystać. Najpopularniejsze z nich to:
Przejdź do kolejnego zagadnienia (Implementacja regresji przy pomocy Scikit-learn) lub kliknij tutaj, aby wrócić do strony głównej tematu.