上QQ阅读APP看书,第一时间看更新
1.5 如何划分训练集与验证集
前面介绍了如何加载数据集,在加载数据集之后,需要将数据集划分为训练集和验证集。在MATLAB深度学习工具箱中,提供了splitEachLabel函数将数据存储区中的数据集划分为训练集和验证集,具体使用方法如下。
函数:splitEachLabel。
功能:将数据存储区中的数据集划分为训练集和验证集。
用法:[ds1,ds2 ] = splitEachLabel(imds,p)。
输入:imds表示图像样本数据,p表示数据集中用于训练深度网络的样本比例或数量。
输出:ds1用于训练的样本数据,ds2用于验证的样本数据。
注意
splitEachLabel函数默认是按顺序对样本数据集进行划分的,可以添加选项'random-ized'来进行随机划分。
例如,[imdsTrain,imdsValidation] = splitEachLabel(imds,750,'randomize')。
实现的功能是随机将样本数据imds中的750个样本数据划分为训练样本数据。
实现的功能是随机将样本数据imds中70%的样本数据划分为训练样本数据。