|
|
|
@ -15,7 +15,7 @@
|
|
|
|
|
- 类型: bool (默认: 1).
|
|
|
|
|
|
|
|
|
|
* `--local`
|
|
|
|
|
- 训练过程是否为本地模式,设置为true使用本地训练或者使用集群上的一个节点,否则使用集群上的多台机器。
|
|
|
|
|
- 训练过程是否为本地模式,设置为true使用本地训练或者使用集群上的一个节点,否则使用多机训练。
|
|
|
|
|
- 类型: bool (默认: 1).
|
|
|
|
|
|
|
|
|
|
* `--trainer_count`
|
|
|
|
@ -114,11 +114,11 @@
|
|
|
|
|
- 类型: int32 (默认: 0).
|
|
|
|
|
|
|
|
|
|
* `--test_wait`
|
|
|
|
|
- 指示当指定轮的测试模型不存在时,是否需要等待该轮模型参数。如果在集群的提交环境中设置了test_data_path,将会启动一个进程执行测试,因此我们需要设置test_wait=1。需要注意的是,在集群提交环境中,该参数已经默认设置为True.
|
|
|
|
|
- 指示当指定轮的测试模型不存在时,是否需要等待该轮模型参数。如果在训练期间同时发起另外一个进程进行测试,可以使用该参数.
|
|
|
|
|
- 类型: bool (默认: 0).
|
|
|
|
|
|
|
|
|
|
* `--model_list`
|
|
|
|
|
- 测试时指定的存储模型列表的文件。在集群提交环境中,在指定model_path之后,该参数会自动设置.
|
|
|
|
|
- 测试时指定的存储模型列表的文件.
|
|
|
|
|
- 类型: string (默认: "", null).
|
|
|
|
|
|
|
|
|
|
* `--predict_output_dir`
|
|
|
|
@ -169,7 +169,7 @@
|
|
|
|
|
- 类型: bool (默认: 0).
|
|
|
|
|
|
|
|
|
|
* `--prev_batch_state`
|
|
|
|
|
- 指示批次之间是否是连续的.
|
|
|
|
|
- 标识是否为连续的batch计算.
|
|
|
|
|
- 类型: bool (默认: 0).
|
|
|
|
|
|
|
|
|
|
* `--beam_size`
|
|
|
|
@ -177,7 +177,7 @@
|
|
|
|
|
- 类型: int32 (默认: 1).
|
|
|
|
|
|
|
|
|
|
* `--diy_beam_search_prob_so`
|
|
|
|
|
- 指定共享的动态库,用户可以定义Paddle之外的文件.
|
|
|
|
|
- 用户可以自定义beam search的方法,编译成动态库,供PaddlePaddle加载。 该参数用于指定动态库路径.
|
|
|
|
|
- 类型: string (默认: "", null).
|
|
|
|
|
|
|
|
|
|
## 度量学习(Metric Learning)
|
|
|
|
@ -195,20 +195,20 @@
|
|
|
|
|
- 内存容限阈值,当超过该阈值时,停止加载数据.
|
|
|
|
|
- 类型: double (默认: 1.0).
|
|
|
|
|
|
|
|
|
|
## Unit Test
|
|
|
|
|
## 单元测试
|
|
|
|
|
|
|
|
|
|
* `--checkgrad_eps`
|
|
|
|
|
- 使用checkgrad模式时的参数变化大小.
|
|
|
|
|
- 类型: double (默认: 1e-05).
|
|
|
|
|
|
|
|
|
|
## 参数服务器(Parameter Server)和分布式通信(Distributed Communication)
|
|
|
|
|
## 参数服务器和分布式通信
|
|
|
|
|
|
|
|
|
|
* `--start_pserver`
|
|
|
|
|
- 指示是否开启参数服务器(parameter server).
|
|
|
|
|
- 类型: bool (默认: 0).
|
|
|
|
|
|
|
|
|
|
* `--pservers`
|
|
|
|
|
- 参数服务器的IP地址,以逗号间隔,在集群提交环境中自动设置.
|
|
|
|
|
- 参数服务器的IP地址,以逗号间隔.
|
|
|
|
|
- 类型: string (默认: "127.0.0.1").
|
|
|
|
|
|
|
|
|
|
* `--port`
|
|
|
|
@ -220,7 +220,7 @@
|
|
|
|
|
- 类型: int32 (默认: 1).
|
|
|
|
|
|
|
|
|
|
* `--trainer_id`
|
|
|
|
|
- 在分布式训练中,每个训练器必须指定一个唯一的id号,从0到num_trainers-1。0号训练器是主训练器。使用者无需关心这个参数.
|
|
|
|
|
- 在分布式训练中,每个训练节点必须指定一个唯一的id号,从0到num_trainers-1。0号训练节点是主训练节点。使用者无需关心这个参数.
|
|
|
|
|
- 类型: int32 (默认: 0).
|
|
|
|
|
|
|
|
|
|
* `--num_gradient_servers`
|
|
|
|
|