fluid_cluster_train_cn_doc

7 years ago · 529878b156
parent 50e8251388
commit 529878b156
1 changed files with 22 additions and 7 deletions
--- a/doc/fluid/howto/cluster/fluid_cluster_train_cn.md
+++ b/doc/fluid/howto/cluster/fluid_cluster_train_cn.md
@ -56,7 +56,7 @@ for pass_id in range(PASS_NUM):
 exit(1)
 ```
-我们创建了一个简单的全连接神经网络程序，并且通过fluid的Executor执行了100次迭代,现在我们需要将该非分布式版本的程序更新为分布式版本的程序。
+我们创建了一个简单的全连接神经网络程序，并且通过fluid的Executor执行了100次迭代,现在我们需要将该单机版本的程序更新为分布式版本的程序。
 ### 介绍Parameter Server
 在非分布式版本的训练脚本中，只存在Trainer一种角色，它不仅处理常规的计算任务，也处理参数相关的计算和保存任务。在分布式版本的训练过程中，由于存在多个Trainer节点进行同样的数据计算任务，因此需要有一个中心化的节点来统一处理参数相关的保存和分配。在PaddlePaddle中，我们称这样的节点为Parameter Server, [Parameter Server 设计文档](https://github.com/PaddlePaddle/Paddle/blob/develop/doc/fluid/design/dist_train/parameter_server.md)
@ -94,7 +94,7 @@ for pass_id in range(100):
        exe.run(t.get_trainer_program())
 ```
 ### 分布式训练脚本运行说明
-分布式任务的运行需要外部指定多个参数：
+分布式任务的运行需要将表格中说明的多个参数进行赋值，：
 | 参数名 | 值类型 | 说明 | 示例 |
 |:-------------|:---|:---------------------------------------|:-------------|
@ -104,11 +104,26 @@ for pass_id in range(100):
 | server_endpoint | str | 当前所起的服务节点的IP:PORT | 127.0.0.1:8789 |
 | training_role | str | 节点角色， TRAINER/PSERVER | PSERVER |
 启动顺序，先启动全部的PSERVER (Parameter Server)后，再启动TRAINER(Trainer)。
 **其中：training_role 是用来区分当前所起服务的角色的，用于训练程序中，用户可根据需要自行定义，其他参数为fluid.DistributeTranspiler的transpile函数所需要，需要在调用函数前进行定义，至于如何从外部环境传入，用户可自定义。**
 参数赋值及使用的相关代码片段：
 ```python
 t = fluid.DistributeTranspiler()
 t.transpile(
    optimize_ops,
    params_grads,
    trainer_id,
    pservers=pserver,
    trainers=trainers)
 if training_role == "PSERVER":
    pserver_prog = t.get_pserver_program(server_endpoint)
    pserver_startup = t.get_startup_program(server_endpoint, pserver_prog)
 ```
 ### 启动顺序
 先启动全部的PSERVER (Parameter Server)后，再启动TRAINER(Trainer)。
-### DEMO
+### Demo
-完整的demo代码位于fluid的test目录下的[book](https://github.com/PaddlePaddle/Paddle/blob/develop/python/paddle/fluid/tests/book/test_fit_a_line.py)中。
+完整的demo代码位于Fluid的test目录下的[book](https://github.com/PaddlePaddle/Paddle/blob/develop/python/paddle/fluid/tests/book/test_fit_a_line.py)中。
 ```
 cd /paddle/python/paddle/fluid/tests/book
 ```