当前位置：首页 > 数码 > 打破-外围-深刻剖析优化器-PyTorch-开启性能优化之旅 (打破外围束缚的例子文化芯片)

打破-外围-深刻剖析优化器-PyTorch-开启性能优化之旅 (打破外围束缚的例子文化芯片)

admin1年前 (2024-04-20)数码47

今儿我们聊聊pytorch中的优化器。

优化器在深度学习中的选用间接影响模型的训练成果和速度。不同的优化器适用于不同的疑问，其性能的差异或许造成模型更快、更稳固地收敛，或许在某些义务上体现更好。

因此，选用适合的优化器是深度学习模型调优中的一个关键决策，能够清楚影响模型的性能和训练效率。

PyTorch自身提供了许多优化器，用于训练神经网络时降级模型的权重。

经常出现优化器

我们先罗列PyTorch中罕用的优化器，以及便捷引见：

SGD(StochasticGradientDescent)

随机梯度降低是最基本的优化算法之一。它经过计算损失函数关于权重的梯度，并沿着梯度的负方向降级权重。

optimizer=torch.optim.SGD(model.parameters(),lr=learning_rate)

Adam是一种自顺应学习率的优化算法，联合了AdaGrad和RMSProp的思维。它能够自顺应地为每个参数计算不同的学习率。

optimizer=torch.optim.Adam(model.parameters(),lr=learning_rate)

Adagrad是一种自顺应学习率的优化算法，依据参数的历史梯度调整学习率。但因为学习率逐渐减小，或许造成训练过早中止。

optimizer=torch.optim.Adagrad(model.parameters(),lr=learning_rate)

RMSProp也是一种自顺应学习率的算法，经过思考梯度的滑动平均来调整学习率。

optimizer=torch.optim.RMSprop(model.parameters(),lr=learning_rate)

Adadelta是一种自顺应学习率的优化算法，是RMSProp的改良版本，经过思考梯度的移动平均和参数的移动平均来灵活调整学习率。

optimizer=torch.optim.Adadelta(model.parameters(),lr=learning_rate)

一个完整案例

在这里，我们聊聊如何经常使用PyTorch训练一个便捷的卷积神经网络（CNN）来启入手写数字识别。

这个案例经常使用的是MNIST数据集，并经常使用Matplotlib库绘制了损失曲线和准确率曲线。

importtorchimporttorch.nnasnnimporttorch.optimasoptimfromtorchvisionimportdatasets,transformsfromtorch.utils.dataimportDataLoaderimportmatplotlib.pyplotasplt#设置随机种子torch.manual_seed(42)#定义数据转换transform=transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.5,),(0.5,))])#下载和加载MNIST数据集trn_dataset=datasets.MNIST(root='./data',train=True,download=True,transform=transform)test_dataset=datasets.MNIST(root='./data',train=False,download=True,transform=transform)train_loader=DataLoader(train_dataset,batch_size=64,shuffle=True)test_loader=DataLoader(test_dataset,batch_size=1000,shuffle=False)#定义便捷的卷积神经网络模型classCNN(nn.Module):def__init__(self):super(CNN,self).__init__()self.conv1=nn.Conv2d(1,32,kernel_size=3,stride=1,padding=1)self.relu=nn.ReLU()self.pool=nn.MaxPool2d(kernel_size=2,stride=2)self.conv2=nn.Conv2d(32,64,kernel_size=3,stride=1,padding=1)self.fc1=nn.Linear(64*7*7,128)self.fc2=nn.Linear(128,10)defforward(self,x):x=self.conv1(x)x=self.relu(x)x=self.pool(x)x=self.conv2(x)x=self.relu(x)x=self.pool(x)x=x.view(-1,64*7*7)x=self.fc1(x)x=self.relu(x)x=self.fc2(x)returnx#创立模型、损失函数和优化器model=CNN()criterion=nn.CrossEntropyLoss()optimizer=optim.Adam(model.parameters(),lr=0.001)#训练模型num_epochs=5train_losses=[]train_accuracies=[]forepochinrange(num_epochs):model.train()total_loss=0.0correct=0total=0forinputs,labelsintrain_loader:optimizer.zero_grad()outputs=model(inputs)loss=criterion(outputs,labels)loss.backward()optimizer.step()total_loss+=loss.item()_,predicted=torch.max(outputs.data,1)total+=labels.size(0)correct+=(predicted==labels).sum().item()accuracy=correct/totaltrain_losses.end(total_loss/len(train_loader))train_accuracies.append(accuracy)print(f"Epoch{epoch+1}/{num_epochs},Loss:{train_losses[-1]:.4f},Accuracy:{accuracy:.4f}")#绘制损失曲线和准确率曲线plt.figure(figsize=(10,5))plt.subplot(1,2,1)plt.plot(train_losses,label='TrainingLoss')plt.title('TrainingLoss')plt.xlabel('Epoch')plt.ylabel('Loss')plt.legend()plt.subplot(1,2,2)plt.plot(train_accuracies,label='TrainingAccuracy')plt.title('TrainingAccuracy')plt.xlabel('Epoch')plt.ylabel('Accuracy')plt.legend()plt.tight_layout()plt.show()#在测试集上评价模型model.eval()correct=0total=0withtorch.no_grad():forinputs,labelsintest_loader:outputs=model(inputs)_,predicted=torch.max(outputs.data,1)total+=labels.size(0)correct+=(predicted==labels).sum().item()accuracy=correct/totalprint(f"Accuracyontestset:{accuracy*100:.2f}%")

上述代码中，我们定义了一个便捷的卷积神经网络（CNN），经常使用交叉熵损失和Adam优化器启动训练。

在训练环节中，我们记载了每个epoch的损失和准确率，并经常使用Matplotlib库绘制了损失曲线和准确率曲线。

我是小壮，下期见！

这个错误通常是由于PyTorch版本过低导致的。 Lookahead优化器是在PyTorch 1.5及以上版本中才被支持的。如果您的PyTorch版本过低，可以尝试更新到最新版本或者使用早期版本的PyTorch实现自己的Lookahead优化器。如果您已经使用的是PyTorch 1.5及以上版本，那么可以尝试检查您的代码，看看是否有任何变量名称或参数名称与defaults相同。也可以尝试重新安装PyTorch和相关依赖库，看看是否可以解决问题。如果以上方法均不能解决问题，可以考虑在PyTorch官方论坛上提出问题并提供更多细节，以获得更具体的帮助。

免责声明：本文转载或采集自网络，版权归原作者所有。本网站刊发此文旨在传递更多信息，并不代表本网赞同其观点和对其真实性负责。如涉及版权、内容等问题，请联系本网，我们将在第一时间删除。同时，本网站不对所刊发内容的准确性、真实性、完整性、及时性、原创性等进行保证，请读者仅作参考，并请自行核实相关内容。对于因使用或依赖本文内容所产生的任何直接或间接损失，本网站不承担任何责任。

标签: Pytorch