feature/design_of_v2_layer_converter
typhoonzero 8 years ago
parent b360dec9db
commit a9b33f3801

@ -8,7 +8,6 @@
说明:
* parameter server在集群中启动后自动挂载分布式存储目录并把快照保存到这个目录下。
* ***注parameter server在保存检查点时利用了Linux内核的“写时复制”技术在fork的进程中保存检查点原进程可以继续接收trainer的梯度更新请求而不影响检查点数据的保存。***
* ***注每个parameter server的检查点各自独立保存暂时不考虑多个parameter server同步的保存一个特定时间点的全局检查点因为这样做也没法保证消除随机性。***
检查点保存程序流程:

@ -21,10 +21,10 @@
### 上传训练文件
使用下面命令,可以把本地的训练数据上传到存储集群中
使用下面命令,可以把本地的训练数据上传到存储集群中,并指定上传数据的`dataset-name`
```
paddle upload train_data.list
paddle upload train_data.list "dataset-name"
```
其中`.list`文件描述了训练数据的文件和对应的label对于图像类数据`.list文件`样例如下每一行包含了图片文件的路径和其label用tab分隔开

Loading…
Cancel
Save