Skip to content

Latest commit

 

History

History
36 lines (27 loc) · 2.55 KB

20.4.md

File metadata and controls

36 lines (27 loc) · 2.55 KB

Scikit Learn

原文:https://www.bookbookmark.ds100.org/ch/20/ref_sklearn.html

# HIDDEN
# Clear previously defined variables
%reset -f

# Set directory for data loading to work properly
import os
os.chdir(os.path.expanduser('~/notebooks/20'))

型号和型号选择

进口 功能 截面 说明
sklearn.model_selection train_test_split(*arrays, test_size=0.2) 建模与估计 返回传入的每个数组的两个随机子集,其中第一个子集中有 0.8 个数组,第二个子集中有 0.2 个数组
sklearn.linear_model LinearRegression() Modeling and Estimation 返回普通最小二乘线性回归模型
sklearn.linear_model LassoCV() Modeling and Estimation 返回通过交叉验证选择最佳模型的 Lasso(L1 正则化)线性模型
sklearn.linear_model RidgeCV() Modeling and Estimation 返回一个脊线(L2 正则化)线性模型,并通过交叉验证选择最佳模型
sklearn.linear_model ElasticNetCV() Modeling and Estimation 返回 ElasticNet(l1 和 l2 正则化)线性模型,并通过交叉验证选择最佳模型
sklearn.linear_model LogisticRegression() Modeling and Estimation 返回逻辑回归分类器
sklearn.linear_model LogisticRegressionCV() Modeling and Estimation 返回通过交叉验证选择最佳模型的逻辑回归分类器

使用模型

假设您有一个model变量是scikit-learn对象:

Function Section Description
model.fit(X, y) Modeling and Estimation 与传入的 X 和 Y 匹配的模型
model.predict(X) Modeling and Estimation 返回根据模型传入的 x 的预测
model.score(X, y) Modeling and Estimation 返回基于 corect 值(y)的 x 预测精度