一旦您在 Keras 中选择并拟合了最终的深度学习模型,您就可以使用它来对新数据实例做出预测。
初学者对如何做到这一点有一些困惑。我经常看到以下问题:
如何在 Keras 中使用我的模型做出预测?
在本教程中,您将了解如何使用 Keras Python 库通过最终的深度学习模型进行分类和回归预测。
完成本教程后,您将了解:
- 如何最终确定模型以便为预测做好准备。
- 如何对 Keras 中的分类问题进行类别概率预测。
- 如何在 Keras 中进行回归预测。
让我们开始吧!
照片由mstk east提供,并保留所属权利。
本教程分为 3 个部分,分别是:
- 完成模型
- 分类预测
- 回归预测
在做出预测之前,必须训练最终模型。
您可能使用 k 折交叉验证或训练/测试分割数据来训练许多模型,这样做是为了让能够利用模型能估计样本外的数据,例如一些新数据。
如果这些模型已达到目的,则可以丢弃。
您现在必须在所有可用数据上训练最终模型,您可以在此处了解有关如何训练最终模型的更多信息:
分类问题是模型学习输入要素和作为标签的输出要素之间的映射的问题,例如“_ 垃圾邮件 ”和“ 非垃圾邮件 _”。
下面是 Keras 中针对简单的两类(二元)分类问题开发的最终神经网络模型的示例。
如果您不熟悉在 Keras 中开发神经网络模型,请参阅帖子:
# 训练最终模型的示例
from keras.models import Sequential
from keras.layers import Dense
from sklearn.datasets.samples_generator import make_blobs
from sklearn.preprocessing import MinMaxScaler
# 生成 2 维分类数据集
X, y = make_blobs(n_samples=100, centers=2, n_features=2, random_state=1)
scalar = MinMaxScaler()
scalar.fit(X)
X = scalar.transform(X)
# 定义并拟合最终模型
model = Sequential()
model.add(Dense(4, input_dim=2, activation='relu'))
model.add(Dense(4, activation='relu'))
model.add(Dense(1, activation='sigmoid'))
model.compile(loss='binary_crossentropy', optimizer='adam')
model.fit(X, y, epochs=200, verbose=0)
完成后,您可能希望将模型保存到文件,例如通过 Keras API 保存后,您可以随时加载模型并使用它做出预测,有关此示例,请参阅帖子:
为简单起见,我们将跳过本教程中的示例。
我们可能希望使用最终模型进行两种类型的分类预测,它们是类别预测和概率预测。
给出最终模型和一个或多个数据实例的类别预测,预测数据实例的类别。
我们并不知道新数据的分类结果,这就是我们首先需要定义模型的原因。
我们可以使用 predict_classes()
函数在 Keras 中使用我们最终的分类模型来预测新数据实例的类别。请注意,此函数仅适用于 Sequential
模型,而不适用于使用函数 API 开发的其他模型。
例如,我们在名为 Xnew
的数组中有一个或多个数据实例,可以传递给我们模型上的 predict_classes()
函数,以便预测数组中每个实例的类别。
Xnew = [[...], [...]]
ynew = model.predict_classes(Xnew)
让我们通过一个例子来具体演示这个过程:
# 对分类问题做出类别预测的示例
from keras.models import Sequential
from keras.layers import Dense
from sklearn.datasets.samples_generator import make_blobs
from sklearn.preprocessing import MinMaxScaler
#生成 2 维的分类数据集
X, y = make_blobs(n_samples=100, centers=2, n_features=2, random_state=1)
scalar = MinMaxScaler()
scalar.fit(X)
X = scalar.transform(X)
# 定义并拟合最终模型
model = Sequential()
model.add(Dense(4, input_dim=2, activation='relu'))
model.add(Dense(4, activation='relu'))
model.add(Dense(1, activation='sigmoid'))
model.compile(loss='binary_crossentropy', optimizer='adam')
model.fit(X, y, epochs=500, verbose=0)
# 不知分类结果的新的实例
Xnew, _ = make_blobs(n_samples=3, centers=2, n_features=2, random_state=1)
Xnew = scalar.transform(Xnew)
# 做出预测
ynew = model.predict_classes(Xnew)
# show the inputs and predicted outputs
for i in range(len(Xnew)):
print("X=%s, Predicted=%s" % (Xnew[i], ynew[i]))
运行该示例预测三个新数据实例的类,然后将数据和预测一起打印。
X=[0.89337759 0.65864154], Predicted=[0]
X=[0.29097707 0.12978982], Predicted=[1]
X=[0.78082614 0.75391697], Predicted=[0]
如果您只有一个新的数据实例,则可以将其作为包含在数组中的实例提供给 predict_classes()
函数,例如:
# 对分类问题做出类别预测的示例
from keras.models import Sequential
from keras.layers import Dense
from sklearn.datasets.samples_generator import make_blobs
from sklearn.preprocessing import MinMaxScaler
from numpy import array
# 生成 2 维分类数据集
X, y = make_blobs(n_samples=100, centers=2, n_features=2, random_state=1)
scalar = MinMaxScaler()
scalar.fit(X)
X = scalar.transform(X)
# 定义并拟合最终模型
model = Sequential()
model.add(Dense(4, input_dim=2, activation='relu'))
model.add(Dense(4, activation='relu'))
model.add(Dense(1, activation='sigmoid'))
model.compile(loss='binary_crossentropy', optimizer='adam')
model.fit(X, y, epochs=500, verbose=0)
# 不知结果的新的实例
Xnew = array([[0.89337759, 0.65864154]])
# make a prediction
ynew = model.predict_classes(Xnew)
# 输入和输出的预测结果
print("X=%s, Predicted=%s" % (Xnew[0], ynew[0]))
运行该示例将打印单个实例和预测类。
X=[0.89337759 0.65864154], Predicted=[0]
请注意,在准备数据时,您将把域中的类值(例如字符串)映射到整数值。您可能使用过 LabelEncoder 。
此LabelEncoder
可用于通过 inverse_transform()
函数将整数转换回字符串值。
因此,您可能希望在拟合最终模型时保存(pickle)用于编码y
值的LabelEncoder
。
您可能希望进行的另一种类型的预测是数据实例属于每个类别的概率。
这被称为概率预测,其中,给定新实例,模型将为每个结果类别的概率返回为 0 和 1 之间的值。
您可以通过调用 predict_proba()
函数在 Keras 中进行这些类型的预测,如下所示:
Xnew = [[...], [...]]
ynew = model.predict_proba(Xnew)
在二元(二进制)分类问题的情况下,通常在输出层中使用 sigmoid
激活函数,预测概率被视为属于类 1 的观测值的概率,或被反转(1-概率)以给出类 0 的概率。
在多分类问题的情况下,通常在输出层上使用 softmax
激活函数,并且将每个类的概率观测值作为向量返回。
以下示例对数据实例的Xnew
数组中的每个示例进行概率预测。
# 为分类问题做出概率预测的示例
from keras.models import Sequential
from keras.layers import Dense
from sklearn.datasets.samples_generator import make_blobs
from sklearn.preprocessing import MinMaxScaler
# 生成 2 维分类数据集
X, y = make_blobs(n_samples=100, centers=2, n_features=2, random_state=1)
scalar = MinMaxScaler()
scalar.fit(X)
X = scalar.transform(X)
#定义并拟合最终模型
model = Sequential()
model.add(Dense(4, input_dim=2, activation='relu'))
model.add(Dense(4, activation='relu'))
model.add(Dense(1, activation='sigmoid'))
model.compile(loss='binary_crossentropy', optimizer='adam')
model.fit(X, y, epochs=500, verbose=0)
# 不知分类结果的新的实例
Xnew, _ = make_blobs(n_samples=3, centers=2, n_features=2, random_state=1)
Xnew = scalar.transform(Xnew)
# 做出预测
ynew = model.predict_proba(Xnew)
# show the inputs and predicted outputs
for i in range(len(Xnew)):
print("X=%s, Predicted=%s" % (Xnew[i], ynew[i]))
运行实例会进行概率预测,然后打印输入数据实例以及属于类 1 的每个实例的概率。
X=[0.89337759 0.65864154], Predicted=[0.0087348]
X=[0.29097707 0.12978982], Predicted=[0.82020265]
X=[0.78082614 0.75391697], Predicted=[0.00693122]
如果您想向用户提供专业的概率解释,这的应用程序中会对您有所帮助。
回归是一种监督学习问题,在给定输入示例的情况下,模型学习到适当输出量的映射,例如“0.1”和“0.2”等。
下面是用于回归的最终 Keras 模型的示例。
# 训练最终回归模型的示例
from keras.models import Sequential
from keras.layers import Dense
from sklearn.datasets import make_regression
from sklearn.preprocessing import MinMaxScaler
# 生成回归数据集
X, y = make_regression(n_samples=100, n_features=2, noise=0.1, random_state=1)
scalarX, scalarY = MinMaxScaler(), MinMaxScaler()
scalarX.fit(X)
scalarY.fit(y.reshape(100,1))
X = scalarX.transform(X)
y = scalarY.transform(y.reshape(100,1))
# 定义并拟合最终模型
model = Sequential()
model.add(Dense(4, input_dim=2, activation='relu'))
model.add(Dense(4, activation='relu'))
model.add(Dense(1, activation='linear'))
model.compile(loss='mse', optimizer='adam')
model.fit(X, y, epochs=1000, verbose=0)
我们可以通过在最终模型上调用 predict()
函数来使用最终的回归模型预测数量。
predict()
函数获取一个或多个数据实例的数组。
下面的示例演示了如何对具有未知预期结果的多个数据实例进行回归预测。
# 为回归问题做出最终预测的示例
from keras.models import Sequential
from keras.layers import Dense
from sklearn.datasets import make_regression
from sklearn.preprocessing import MinMaxScaler
# 生成回归数据集
X, y = make_regression(n_samples=100, n_features=2, noise=0.1, random_state=1)
scalarX, scalarY = MinMaxScaler(), MinMaxScaler()
scalarX.fit(X)
scalarY.fit(y.reshape(100,1))
X = scalarX.transform(X)
y = scalarY.transform(y.reshape(100,1))
# 定义并拟合最终模型
model = Sequential()
model.add(Dense(4, input_dim=2, activation='relu'))
model.add(Dense(4, activation='relu'))
model.add(Dense(1, activation='linear'))
model.compile(loss='mse', optimizer='adam')
model.fit(X, y, epochs=1000, verbose=0)
# 不知结果的新的数据实例
Xnew, a = make_regression(n_samples=3, n_features=2, noise=0.1, random_state=1)
Xnew = scalarX.transform(Xnew)
# 做出预测
ynew = model.predict(Xnew)
#打印输入值和预测的输出
for i in range(len(Xnew)):
print("X=%s, Predicted=%s" % (Xnew[i], ynew[i]))
运行该示例会进行多次预测,然后并排打印输入和预测以供审阅。
X=[0.29466096 0.30317302], Predicted=[0.17097184]
X=[0.39445118 0.79390858], Predicted=[0.7475489]
X=[0.02884127 0.6208843 ], Predicted=[0.43370453]
可以使用相同的函数来对单个数据实例做出预测,只要它适当地包装在列表或者数组的环境中即可。
例如:
# 做出回归预测的实例
from keras.models import Sequential
from keras.layers import Dense
from sklearn.datasets import make_regression
from sklearn.preprocessing import MinMaxScaler
from numpy import array
# 生成回归数据集
X, y = make_regression(n_samples=100, n_features=2, noise=0.1, random_state=1)
scalarX, scalarY = MinMaxScaler(), MinMaxScaler()
scalarX.fit(X)
scalarY.fit(y.reshape(100,1))
X = scalarX.transform(X)
y = scalarY.transform(y.reshape(100,1))
# 定义并拟合最终模型
model = Sequential()
model.add(Dense(4, input_dim=2, activation='relu'))
model.add(Dense(4, activation='relu'))
model.add(Dense(1, activation='linear'))
model.compile(loss='mse', optimizer='adam')
model.fit(X, y, epochs=1000, verbose=0)
# 不知结果的新的实例
Xnew = array([[0.29466096, 0.30317302]])
#做出预测
ynew = model.predict(Xnew)
# 打印输入和预测的输出
print("X=%s, Predicted=%s" % (Xnew[0], ynew[0]))
运行该示例进行单个预测并打印数据实例和预测以供审阅。
X=[0.29466096 0.30317302], Predicted=[0.17333156]
如果您希望深入了解,本节将提供有关该主题的更多资源。
- 如何训练最终机器学习模型
- 保存并加载您的 Keras 深度学习模型
- 用 Keras 逐步开发 Python 中的第一个神经网络
- Keras 中长期短期记忆模型的 5 步生命周期
- 如何用 Keras 中的长短期记忆模型做出预测
在本教程中,您了解了如何使用 Keras Python 库通过最终的深度学习模型进行分类和回归预测。
具体来说,你学到了:
- 如何最终确定模型以便为预测做好准备。
- 如何对 Keras 中的分类问题进行类别和概率预测。
- 如何在 Keras 中进行回归预测。
你有任何问题吗? 在下面的评论中提出您的问题,我会尽力回答。