网站首页 > 技术文章正文

【Python深度学习系列】网格搜索神经网络超参数:丢弃率dropout

btikc 2024-10-17 08:41:48 技术文章 38 ℃ 0 评论

这是我的第271篇原创文章。

一、引言

在深度学习中，超参数是指在训练模型时需要手动设置的参数，它们通常不能通过训练数据自动学习得到。超参数的选择对于模型的性能至关重要，因此在进行深度学习实验时，超参数调优通常是一个重要的步骤。常见的超参数包括：

model.add()

neurons（隐含层神经元数量）
init_mode（初始权重方法）
activation（激活函数）
dropout（丢弃率）

model.compile()

loss（损失函数）
optimizer（优化器）

learning rate（学习率）
momentum（动量）
weight decay（权重衰减系数）

model.fit()

batch size（批量大小）
epochs（迭代次数）

一般来说，可以通过手动调优、网格搜索（Grid Search）、随机搜索（Random Search）、自动调参算法方式进行超参数调优。dropout是指在网络的训练过程中，对于神经网络单元，按照一定的概率将其暂时从网络中丢弃。注意是暂时，对于随机梯度下降来说，由于是随机丢弃，故而每一个mini-batch都在训练不同的网络。考虑调节 dropout 为了正则化，为了限制过拟合以及提供模型的泛化能力。本文采用网格搜索选择丢弃率dropout。

二、实现过程

2.1 准备数据

dataset：

dataset = pd.read_csv("data.csv", header=None)
dataset = pd.DataFrame(dataset)
print(dataset)

2.2 数据划分

# 切分数据为输入 X 和输出 Y
X = dataset.iloc[:,0:8]
Y = dataset.iloc[:,8]
# 为了复现，设置随机种子
seed = 7
np.random.seed(seed)
random.set_seed(seed)

2.3 创建模型

需要定义个网格的架构函数create_model，create_model里面的参数要在KerasClassifier这个对象里面存在而且参数名要一致。

def create_model(dropout_rate):
    # 创建模型
    model = Sequential()
    model.add(Dense(50, input_shape=(8, ), kernel_initializer='uniform', activation='relu'))
    model.add(Dropout(dropout_rate))
    model.add(Dense(1, kernel_initializer='uniform', activation='sigmoid'))
    # 编译模型
    model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
    return model
model = KerasClassifier(model=create_model, epochs=100, batch_size=80, verbose=0, dropout_rate=0.2)

这里使用了scikeras库的KerasClassifier类来定义一个分类器，这里由于KerasClassifier没有定义初始化权重的参数，需要自定义一个表示丢弃率的参数dropout_rate，并赋默认值为0.2。

2.4 定义网格搜索参数

param_grid = {'dropout_rate': [0.0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]}

param_grid是一个字典，key是超参数名称，这里的名称必须要在KerasClassifier这个对象里面存在而且参数名要一致。value是key可取的值，也就是要尝试的方案。

2.5 进行参数搜索

from sklearn.model_selection import GridSearchCV
grid = GridSearchCV(estimator=model,  param_grid=param_grid)
grid_result = grid.fit(X, Y)

使用sklearn里面的GridSearchCV类进行参数搜索，传入模型和网格参数。

2.6 总结搜索结果

print("Best: %f using %s" % (grid_result.best_score_, grid_result.best_params_))
means = grid_result.cv_results_['mean_test_score']
stds = grid_result.cv_results_['std_test_score']
params = grid_result.cv_results_['params']
for mean, stdev, param in zip(means, stds, params):
    print("%f (%f) with: %r" % (mean, stdev, param))

结果：

经过网格搜索，丢弃率的最优选择是0.2。

作者简介：读研期间发表6篇SCI数据算法相关论文，目前在某研究院从事数据算法相关研究工作，结合自身科研实践经历持续分享关于Python、数据分析、特征工程、机器学习、深度学习、人工智能系列基础知识与案例。关注gzh：数据杂坛，获取数据和源码学习更多内容。

原文链接：

【Python深度学习系列】网格搜索神经网络超参数：丢弃率dropout（案例+源码）

上一篇：中英趣译，用英文说对方“活该”才痛快!
下一篇： Java修炼终极指南:103. 通过 Vector API 求和两个数组

网站首页 > 技术文章正文

【Python深度学习系列】网格搜索神经网络超参数:丢弃率dropout

一、引言

二、实现过程

2.1 准备数据

2.2 数据划分

2.3 创建模型

2.4 定义网格搜索参数

2.5 进行参数搜索

2.6 总结搜索结果

猜你喜欢

本文暂时没有评论，来添加一个吧(●'◡'●)

取消回复欢迎你发表评论:

网站首页 > 技术文章 正文

【Python深度学习系列】网格搜索神经网络超参数:丢弃率dropout

一、引言

二、实现过程

2.1 准备数据

2.2 数据划分

2.3 创建模型

2.4 定义网格搜索参数

2.5 进行参数搜索

2.6 总结搜索结果

猜你喜欢

本文暂时没有评论，来添加一个吧(●'◡'●)

取消回复欢迎 你 发表评论:

网站首页 > 技术文章正文

取消回复欢迎你发表评论: