7.6 KiB
目录
ShuffleNetV1 描述
ShuffleNetV1是旷视科技提出的一种计算高效的CNN模型,主要目的是应用在移动端,所以模型的设计目标就是利用有限的计算资源来达到最好的模型精度。ShuffleNetV1的设计核心是引入了两种操作:pointwise group convolution和channel shuffle,这在保持精度的同时大大降低了模型的计算量。因此,ShuffleNetV1和MobileNet类似,都是通过设计更高效的网络结构来实现模型的压缩和加速。
论文:Xiangyu Zhang, Xinyu Zhou, Mengxiao Lin, Jian Sun. "ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices." Proceedings of the IEEE conference on computer vision and pattern recognition. 2018.
模型架构
ShuffleNetV1的核心部分被分成三个阶段,每个阶段重复堆积了若干个ShuffleNetV1的基本单元。其中每个阶段中第一个基本单元采用步长为2的pointwise group convolution使特征图的width和height各降低一半,同时channels增加一倍;之后的基本单元步长均为1,保持特征图和通道数不变。此外,ShuffleNetV1中的每个基本单元中都加入了channel shuffle操作,以此来对group convolution之后的特征图进行通道维度的重组,使信息可以在不同组之间传递。
数据集
使用的数据集: imagenet
- 数据集大小: 146G, 1330k 1000类彩色图像
- 训练: 140G, 1280k张图片
- 测试: 6G, 50k张图片
- 数据格式: RGB图像.
- 注意:数据在src/dataset.py中被处理
环境要求
- 硬件(Ascend)
- 使用Ascend来搭建硬件环境。
- 框架
- 如需查看详情,请参见如下资源:
脚本说明
脚本和示例代码
├─shufflenetv1
├─README_CN.md # ShuffleNetV1相关描述
├─scripts
├─run_standalone_train.sh # Ascend环境下的单卡训练脚本
├─run_distribute_train.sh # Ascend环境下的八卡并行训练脚本
├─run_eval.sh # Ascend环境下的评估脚本
├─src
├─config.py # 参数配置
├─dataset.py # 数据预处理
├─shufflenetv1.py # 网络模型定义
├─crossentropysmooth.py # 损失函数定义
├─lr_generator.py # 学习率生成函数
├─train.py # 网络训练脚本
├─export.py # 模型格式转换脚本
└─eval.py # 网络评估脚本
脚本参数
模型训练和评估过程中使用的参数可以在config.py中设置:
'epoch_size': 250, # 模型迭代次数
'keep_checkpoint_max': 5, # 保存ckpt文件的最大数量
'ckpt_path': "./checkpoint/", # 保存ckpt文件的路径
'save_checkpoint_epochs': 1, # 每迭代相应次数保存一个ckpt文件
'save_checkpoint': True, # 是否保存ckpt文件
'amp_level': 'O3', # 训练精度
'batch_size': 128, # 数据批次大小
'num_classes': 1000, # 数据集类别数
'label_smooth_factor': 0.1, # 标签平滑因子
'lr_decay_mode': "cosine", # 学习率衰减模式
'lr_init': 0.00, # 初始学习率
'lr_max': 0.50, # 最大学习率
'lr_end': 0.00, # 最小学习率
'warmup_epochs': 4, # warmup epoch数量
'loss_scale': 1024, # loss scale
'weight_decay': 0.00004, # 权重衰减率
'momentum': 0.9 # Momentum中的动量参数
训练过程
启动
您可以使用python或shell脚本进行训练。
# 训练示例
python:
Ascend单卡训练示例:python train.py --device_id [DEVICE_ID] --dataset_path [DATA_DIR]
shell:
Ascend八卡并行训练: sh scripts/run_distribute_train.sh [RANK_TABLE_FILE] [DATA_DIR]
Ascend单卡训练示例: sh scripts/run_standalone_train.sh [DEVICE_ID] [DATA_DIR]
结果
ckpt文件将存储在 ./checkpoint
路径下,训练日志将被记录到 log.txt
中。训练日志部分示例如下:
epoch time: 99854.980, per step time: 79.820, avg loss: 4.093
epoch time: 99863.734, per step time: 79.827, avg loss: 4.010
epoch time: 99859.792, per step time: 79.824, avg loss: 3.869
epoch time: 99840.800, per step time: 79.809, avg loss: 3.934
epoch time: 99864.092, per step time: 79.827, avg loss: 3.442
评估过程
启动
您可以使用python或shell脚本进行评估。
# 评估示例
python:
python eval.py --device_id [DEVICE_ID] --dataset_path [DATA_DIR] --checkpoint_path [PATH_CHECKPOINT]
shell:
sh scripts/run_eval.sh [DEVICE_ID] [DATA_DIR] [PATH_CHECKPOINT]
训练过程中可以生成ckpt文件。
结果
可以在 eval_log.txt
查看评估结果。
result:{'Loss': 2.0479587888106323, 'Top_1_Acc': 0.7385817307692307, 'Top_5_Acc': 0.9135817307692308}, ckpt:'/home/shufflenetv1/train_parallel0/checkpoint/shufflenetv1-250_1251.ckpt', time: 98560.63866615295
模型说明
训练性能
参数 | Ascend |
---|---|
模型名称 | ShuffleNetV1 |
运行环境 | Ascend 910 |
上传时间 | 2020-12-3 |
MindSpore 版本 | 1.0.0 |
数据集 | imagenet |
训练参数 | src/config.py |
优化器 | Momentum |
损失函数 | SoftmaxCrossEntropyWithLogits |
最终损失 | 2.05 |
精确度 (8p) | Top1[73.9%], Top5[91.4%] |
训练总时间 (8p) | 7.0h |
评估总时间 | 99s |
参数量 (M) | 44M |
脚本 | 链接 |
随机情况的描述
我们在 dataset.py
和 train.py
脚本中设置了随机种子。
ModelZoo
请核对官方 主页。