要想模型有好的精确率,召回率等等这些,一定要有一个强大(鲁棒性强)的数据集。
这里我用我们经历最多的考试的例子来讲解三者之间制作的关系。你在训练模型中就相当于是老师!需要合理的制作和安排训练集,验证集之间的分布关系。让模型对这一事物有一个清晰的概念。
训练集涵盖多种特征的不同变换的照片。
平时的测试题目要多,富含要考的每个考点,大量的刷题富含每个考点让模型能够去处理各种各样的题型。
尽可能多的包含一种物体的多个特征的照片。
验证模型的做题情况(maybe 周测 月考)并且指导模型的学习方向,让模型朝着正确的方向学习。
测试集类似于期末考试,检验模型在真实考试中表现。