记录一次激活函数导致的LeNet不收敛|电子爱好者

admin管理员组
文章数量:1579083

环境：PyTorch-1.7.1
问题描述：LeNet在MNIST上的loss不收敛，训练集和测试集准确率始终在10%上下。不论如何调整learning rate都无济于事。
解决方案：将激活函数由Sigmoid替换为ReLU即可。Sigmoid容易发生梯度消失，导致网络不收敛。修改后的代码如下：

import argparse
import os
import torch
import torch.nn as nn
import torchvision


parser = argparse.ArgumentParser(description='VT-attack in PyTorch')
parser.add_argument('--epoch', default=20, type=int, help='training epoch')
parser.add_argument('--batch_size', default=2560, type=int, help='training epoch')
parser.add_argument('--device', default='0', type=str, help='gpu device')
parser.add_argument('--use_gpu', default=True, type=bool, help='')

args = parser.parse_args()

class Reshape(torch.nn.Module):
    '''
    Reshape module for MNIST
    '''
    def forward(self, x):
        return x.view(-1, 1, 28, 28)


def evaluate(net, test_set):
    net.eval()
    if args.use_gpu == True:
        net = net.cuda()
    test_loader = torch.utils.data.DataLoader(test_set, batch_size=args.batch_size, shuffle=False,
                                              num_workers=4)
    correct = 0
    for i, (x, y) in enumerate(test_loader):
        if args.use_gpu == True:
            x, y = x.cuda(), y.cuda()
        output = net(x)
        pred_top1 = output.topk(k=1, largest=True).indices
        if pred_top1.dim() >= 2:
            pred_top1 = pred_top1.squeeze()
        correct += (pred_top1 == y).sum().item()
    return correct / len(test_set)

def init_weights(m):
    if type(m) == nn.Linear or type(m) == nn.Conv2d:
        nn.init.xavier_uniform_(m.weight)


def train(net, train_loader, test_set):
    net.apply(init_weights)
    if args.use_gpu == True:
        net = net.cuda()
        criterion = nn.CrossEntropyLoss().cuda()
        optimizer = torch.optim.SGD(net.parameters(), lr=0.01, momentum=0.9)
        scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=10, eta_min=1e-6)

    for epoch in range(args.epoch):
        loss_epoch = 0.0
        net.train()
        for i, (x, y) in enumerate(train_loader):
            if args.use_gpu == True:
                x, y = x.cuda(), y.cuda()
            output = net(x)
            loss = criterion(output, y)
            loss_epoch += loss.cpu().item()
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
            scheduler.step()
        acc = evaluate(net, test_set)
        print("epoch: %d, loss: %.2f, accuracy: %.4f" % (epoch, loss_epoch, acc))




def main():
    net = torch.nn.Sequential(
        Reshape(), nn.Conv2d(1, 6, kernel_size=5, padding=2), nn.ReLU(),
        nn.AvgPool2d(kernel_size=2, stride=2),
        nn.Conv2d(6, 16, kernel_size=5), nn.ReLU(),
        nn.AvgPool2d(kernel_size=2, stride=2), nn.Flatten(),
        nn.Linear(16 * 5 * 5, 120), nn.ReLU(),
        nn.Linear(120, 84), nn.ReLU(),
        nn.Linear(84, 10)
    )
    '''print out the shape of outputs of each layer'''
    X = torch.rand(size=(1, 1, 28, 28), dtype=torch.float32)
    for layer in net:
        X = layer(X)
        print(layer.__class__.__name__, "output shape: \t", X.shape)

    transform = torchvision.transforms.Compose([
        torchvision.transforms.ToTensor(),
    ])
    train_set = torchvision.datasets.MNIST(root="./data", train=True, transform=transform,
                                           download=True)
    train_loader = torch.utils.data.DataLoader(train_set, batch_size=args.batch_size, shuffle=True,
                                               num_workers=4)
    test_set = torchvision.datasets.MNIST(root="./data", train=False, transform=transform,
                                          download=True)
    train(net, train_loader, test_set)

    return

if __name__ == "__main__":
    os.environ["CUDA_VISIBLE_DEVICES"] = args.device
    main()

本文标签：函数 LeNet

版权声明：本文标题：记录一次激活函数导致的LeNet不收敛内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1727845035a1132988.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

【C语言】格式化字符串printf()、sprintf()、scanf()、sscanf()函数详解

16天前

文章目录（一）stdio.h头文件参数说明：（二）printf 和 sprintf 函数(C99)（1）printf() 函数详解printf()功能printf()返回值（2）sprintf() 函数详解sprintf() 功能spri

libvlc_media_add_option 函数中的参数设置

15天前

libvlc_media_add_option 函数中的参数设置 Usage: vlc [options] [stream] ... You can specify multiple streams on the commandline

php 常用函数总结

15天前

第1章常用还是1.1 特许用法1.1.1 DIRECTORY_SEPARATOR；1.1.2 错误提示： throw new Exception(Division by zero.);1.1.

计算机：无所不在的角色与跨学科函数概念的生动探索

15天前

The Computer’s Ubiquitous Role and the Conceptual Underpinnings of Functions Across Disciplines: A Vivid Exploration 计算机

sql游标 while_用SQL Server中的排名函数替换SQL While循环和游标，以提高查询性能

14天前

sql游标 while SQL While loop and cursor are the most common approach to repeat a statement on condition-based or determine

表级触发器不支持ddl语句_用于视图，过程和函数的数据库级DDL触发器

14天前

表级触发器不支持ddl语句 In this article, we will un-riddle the ways to make use of the data definition language trigger (DDL Trigg

mysql contact 函数_mysql(substring函数，contact函数以及replace函数的使用)

14天前

下面讲到的语法，当时的使用场景是要移动树中的节点时，要修改该节点以及其子节点的所有父节点(parentids)。 update trainstaff_dept set parentidsrep

mysql contact 函数_mysql concat函数用法举例

14天前

学习下mysql数据库中的字符串函数 concat函数的使用方法，比如select concat(11,22,33)。 MySQL中concat函数使用方法： CONCAT(str1,str2,

sql group_contact()、concat()、concat_ws函数

14天前

20190812同事给我上了一课，以前从来没有注意过这group_contact()函数，感谢同事兄弟一、CONCAT（）函数 C

x86_64汇编之五：System V AMD64调用约定下的函数调用

12天前

x86_64汇编系列： x86_64汇编之一：AT&T汇编语法x86_64汇编之二：x86_64的基本架构（寄存器、寻址模式、指令集概览&am

用聚宽量化炒股-5获取数据函数-7）获取指数成分股权重函数get_index_weights、获取行业成分股代码函数get_industry_stocks

10天前

1.get_index_weights(index_id,date=None) 可以获取一个指数给定日期在平台可交易的成分股权重。该函数返回值为DataFrame对象。 get_index_weights('000134.

量化交易入门笔记-数据获取函数二

10天前

gt_fundamentals() 函数该函数可查询一只股票或多只股票的财务数据，其语法如下： get_fundamentals(query_object, date=None, statDate=None)参数解析： query_o

matlab中screen函数,Psychtoolbox中Screen函数使用的问题新手

7天前

本帖最后由蓝莓果果干儿于 2015-11-8 15:12 编辑刚准备学习Psychtoolbox编写程序，但是根据教材的指示运行了Screen函数却报错了，本人新手对这方面的东西知之甚少，请大神帮忙看看是什么问题以下是指令以及错误信

python编写自定义函数计算一维numpy数组中与指定目标数值最接近（距离最近）的数值（find closest value in numpy array to a certain value）

5天前

python编写自定义函数计算一维numpy数组中与指定目标数值最接近（距离最近）的数值（find closest value in numpy array to a certain value）目录 python编写自定义函数计算一维

MATLAB教学__03Script Writing,Structured Programming and User-defined Function-撰写脚本，结构化编程和用户自定义函数

3天前

文章目录前言一、Script Writing-撰写脚本程式1.MATLAB Script-MATLAB脚本程式2.Start A Script(.m)File-新建脚本文档(.m)3.Script Editor-脚本编辑器4.常用功能介绍

使用MoveWindow()函数来移动指定句柄的窗口在屏幕中的显示位置及这个窗口的大小

2天前

#include "stdafx.h" #include <Windows.h> int _tmain(int argc, _TCHAR* argv[]) { HWND wnd; wndFindWindow(

gcc 内联函数编译报错

1天前

问题描述一段很简单的代码，使用了内联函数，编译竟然报错。在这里记一下加深记忆。 #include <stdio.h>#include <stdbool.h>inli

Java交互界面实现计算器开发设计【附函数源码，Java理论知识

1天前

setOutput"";setOutput INumSecond;return setOutput;}} .[](https:giteevip204888java-p7)操作符点击后数据转换赋值函数当我

19、Flink 的Table API 和 SQL 中的自定义函数及示例（2）

14小时前

Flink 系列文章一、Flink 专栏 Flink 专栏系统介绍某一知识点，并辅以具体的示例进行说明。 1、Flink 部署系列本部分介绍Flink的部署、配置相关基础内容。2、Flink基础系列本部分

win10 家庭中文版远程提示要求的函数不支持

8小时前

win10 家庭中文版远程提示要求的函数不支持 1.win10家庭中文版没有本地组策略 1).升级专业版 2).新建add.txt文件,输入以下: echo off pushd "%~dp0" dir b C:Wi

电子爱好者 - 最新技术资讯及电子产品介绍！

记录一次激活函数导致的LeNet不收敛

更多相关文章

【C语言】格式化字符串printf()、sprintf()、scanf()、sscanf()函数详解

libvlc_media_add_option 函数中的参数设置

php 常用函数总结

计算机：无所不在的角色与跨学科函数概念的生动探索

sql游标 while_用SQL Server中的排名函数替换SQL While循环和游标，以提高查询性能

表级触发器不支持ddl语句_用于视图，过程和函数的数据库级DDL触发器

mysql contact 函数_mysql(substring函数，contact函数以及replace函数的使用)

mysql contact 函数_mysql concat函数用法举例

sql group_contact()、concat()、concat_ws函数

x86_64汇编之五：System V AMD64调用约定下的函数调用

用聚宽量化炒股-5获取数据函数-7）获取指数成分股权重函数get_index_weights、获取行业成分股代码函数get_industry_stocks

量化交易入门笔记-数据获取函数 二

matlab中screen函数,Psychtoolbox中Screen函数使用的问题 新手

python编写自定义函数计算一维numpy数组中与指定目标数值最接近（距离最近）的数值（find closest value in numpy array to a certain value）

MATLAB教学__03Script Writing,Structured Programming and User-defined Function-撰写脚本，结构化编程和用户自定义函数

使用MoveWindow()函数来移动指定句柄的窗口在屏幕中的显示位置及这个窗口的大小

gcc 内联函数编译报错

Java交互界面实现计算器开发设计【附函数源码，Java理论知识

19、Flink 的Table API 和 SQL 中的自定义函数及示例（2）

win10 家庭中文版 远程提示要求的函数不支持

发表评论

推荐文章

第五课：C++实现加密PDF文档解密

获取GooglePlay下载来源广告数据统计接入

J2EE—解析Servlet处理过程

win10专业版安装.net Framework4.7.2出现问题解决办法

Chrome 书签你知道怎么导入吗（谷歌浏览器的书签保存在哪里 、谷歌浏览器书签保存在哪个文件夹）

热门文章

1076 Wifi密码 （15 分）

SourceTree历史版本下载地址

nonebot2 插件编写指南（四）（从旧版迁移至 2.0.0-beta.2）

网页自动关机代码HTML,电脑怎么设置自动关机时间

Oracle19c实例数据库创建

网络重启计算机命令行,重启网络适配器cmd命令是什么_cmd重启网络适配器的步骤-win7之家...

1003 Emergency （25 分）

12款精品网盘资源搜索网站，只有你想不到没有它搜不到的

搜索资源网站

java正则表达式基础

最新文章

慧荣SMISM3280AB开卡量产工具适用于无法识别设备黑片U盘量产工具修复使用

u盘无法识别怎么办，u盘无法识别解决方法

linux 下u盘分区修复无法识别问题解决

定了，6大领域93个开源任务，阿里开源导师带你参与中科院开源之夏2022

两万字详解自动驾驶开发工具链的现状与趋势

agio U盘强制弹出导致的无法识别需格式化的问题的修复方案

U盘无法与计算机连接,U盘无法连接电脑

通过修复VMware软件解决虚拟机无法识别到U盘设备的问题

@mysql数据库面试手册

测试人员面试需要掌握的内容

Ubuntu及Debian下挂载U盘及exFat文件系统U盘无法挂载的解决

linux usb3.0无法识别u盘启动,Deepin 20系统能识别USB3.0：如果不能用请重启系统或重插几次...

为什么计算机无法读取u盘,电脑无法识别读取U盘怎么办？逐一排查解决问题

解决Ubuntu下U盘无法识别的问题

测试工程师「 面试题 」那点故事

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

量化交易入门笔记-数据获取函数二

matlab中screen函数,Psychtoolbox中Screen函数使用的问题新手

win10 家庭中文版远程提示要求的函数不支持

Chrome 书签你知道怎么导入吗（谷歌浏览器的书签保存在哪里、谷歌浏览器书签保存在哪个文件夹）

1076 Wifi密码（15 分）

测试工程师「面试题」那点故事

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载