Remove img_rnorm_layer and fix ParameterAttribute bug for some layer wrapper.

* Fix ParameterAttribute for img_conv_layer, tensor_layer, crf_layer, crf_decoding_layer. Change-Id: Ic24e4bc1f9d5e03bf35058b49a54c78caf7e97a8
9 years ago · 9269a5b4cb
parent c6fd55e4d7
commit 9269a5b4cb
2 changed files with 11 additions and 6 deletions
--- a/demo/sentiment/sentiment_net.py
+++ b/demo/sentiment/sentiment_net.py
@ -65,7 +65,7 @@ def bidirectional_lstm_net(input_dim,
    bi_lstm = bidirectional_lstm(input=emb, size=lstm_dim)
    dropout = dropout_layer(input=bi_lstm, dropout_rate=0.5)
    output = fc_layer(input=dropout, size=class_dim,
-                      act_type=SoftmaxActivation())
+                      act=SoftmaxActivation())

    if not is_predict:
        lbl = data_layer("label", 1)
--- a/python/paddle/trainer_config_helpers/layers.py
+++ b/python/paddle/trainer_config_helpers/layers.py
@ -36,7 +36,7 @@ __all__ = ["full_matrix_projection", "AggregateLevel", "ExpandLevel",
           "cos_sim", "hsigmoid",
           "regression_cost", 'classification_cost', "LayerOutput",
           'img_conv_layer', 'img_pool_layer', 'batch_norm_layer',
-           'img_cmrnorm_layer', 'img_rnorm_layer', 'addto_layer',
+           'img_cmrnorm_layer', 'addto_layer',
           'concat_layer', 'lstm_step_layer', 'recurrent_group',
           'memory', 'StaticInput', 'expand_layer', 'scaling_layer',
           'power_layer', 'interpolation_layer', 'trans_layer',
@ -1419,7 +1419,10 @@ def img_conv_layer(input, filter_size, num_filters,
        padding_y = padding
    if param_attr.attr.get('initial_smart') == True: # special initial for conv layers.
        init_w = (2.0 / (filter_size ** 2 * num_channels)) ** 0.5
-        param_attr = ParameterAttribute(initial_mean=0.0, initial_std=init_w)
+        param_attr.attr["initial_mean"] = 0.0
+        param_attr.attr["initial_std"] = init_w
+        param_attr.attr["initial_strategy"] = 0
+        param_attr.attr["initial_smart"] = False
    Layer(
        name=name,
        inputs=Input(input.name, conv=Conv(
@ -2724,7 +2727,7 @@ def tensor_layer(input, size, act=None, name=None,
        type=LayerType.TENSOR_LAYER,
        active_type=act.name,
        bias=ParamAttr.to_bias(bias_attr),
-        inputs=[Input(input[0].name, **param_attr),
+        inputs=[Input(input[0].name, **param_attr.attr),
                Input(input[1].name)],
        **ExtraLayerAttribute.to_kwargs(layer_attr)
    )
@ -3067,6 +3070,7 @@ def ctc_layer(input, label, size, name=None, norm_by_times=False):
    return LayerOutput(name, LayerType.CTC_LAYER, [input, label], size=size)

@wrap_name_default()
+@wrap_param_attr_default()
 def crf_layer(input, label, size, weight=None, param_attr=None, name=None):
    """
    A layer for calculating the cost of sequential conditional random
@ -3100,7 +3104,7 @@ def crf_layer(input, label, size, weight=None, param_attr=None, name=None):
    assert isinstance(label, LayerOutput)
    assert weight is None or isinstance(weight, LayerOutput)

-    ipts = [Input(input.name, **param_attr),
+    ipts = [Input(input.name, **param_attr.attr),
            Input(label.name)]
    if weight is not None:
        ipts.append(Input(weight.name))
@ -3117,6 +3121,7 @@ def crf_layer(input, label, size, weight=None, param_attr=None, name=None):
    return LayerOutput(name, LayerType.CRF_LAYER, parents, size=size)

@wrap_name_default()
+@wrap_param_attr_default()
 def crf_decoding_layer(input, size, label=None, param_attr=None, name=None):
    """
    A layer for calculating the decoding sequence of sequential conditional
@ -3142,7 +3147,7 @@ def crf_decoding_layer(input, size, label=None, param_attr=None, name=None):
    assert isinstance(input, LayerOutput)
    assert label is None or isinstance(label, LayerOutput)

-    ipts = [Input(input.name, **param_attr)]
+    ipts = [Input(input.name, **param_attr.attr)]
    if label is not None:
        ipts.append(Input(label.name))