Merge pull request #8874 from jacquesqiao/optimize-optimizer

a little optimize of optimizer
7 years ago · e4ce4795dc
parent 685f03762e 73db6eecca
commit e4ce4795dc
2 changed files with 67 additions and 28 deletions
--- a/python/paddle/fluid/optimizer.py
+++ b/python/paddle/fluid/optimizer.py
@ -92,7 +92,10 @@ class Optimizer(object):
        # create learning rate variable for every parameter
        param = param_and_grad[0]
        param_lr = param.optimize_attr['learning_rate']
-        return self.global_learning_rate() * param_lr
+        if param_lr == 1.0:
            return self.global_learning_rate()
        else:
            return self.global_learning_rate() * param_lr
    def _create_accumulators(self, block, parameters):
        """Create all accumulators needed by the parameters
--- a/python/paddle/fluid/tests/unittests/test_optimizer.py
+++ b/python/paddle/fluid/tests/unittests/test_optimizer.py
@ -21,31 +21,43 @@ from paddle.fluid.backward import append_backward
 class TestOptimizer(unittest.TestCase):
    def test_sgd_optimizer(self):
-        init_program = framework.Program()
+        def check_sgd_optimizer(optimizer_attr):
-        program = framework.Program()
+            init_program = framework.Program()
-        block = program.global_block()
+            program = framework.Program()
-        mul_x = block.create_parameter(
+            block = program.global_block()
-            dtype="float32", shape=[5, 10], lod_level=0, name="mul.x")
+            mul_x = block.create_parameter(
-        mul_y = block.create_var(
+                dtype="float32",
-            dtype="float32", shape=[10, 8], lod_level=0, name="mul.y")
+                shape=[5, 10],
-        mul_out = block.create_var(
+                lod_level=0,
-            dtype="float32", shape=[5, 8], lod_level=0, name="mul.out")
+                name="mul.x",
-        mean_out = block.create_var(
+                optimize_attr=optimizer_attr)
-            dtype="float32", shape=[1], lod_level=0, name="mean.out")
+            mul_y = block.create_var(
-        block.append_op(
+                dtype="float32", shape=[10, 8], lod_level=0, name="mul.y")
-            type="mul",
+            mul_out = block.create_var(
-            inputs={"X": mul_x,
+                dtype="float32", shape=[5, 8], lod_level=0, name="mul.out")
-                    "Y": mul_y},
+            mean_out = block.create_var(
-            outputs={"Out": mul_out},
+                dtype="float32", shape=[1], lod_level=0, name="mean.out")
-            attrs={"x_num_col_dims": 1})
+            block.append_op(
-        block.append_op(
+                type="mul",
-            type="mean", inputs={"X": mul_out}, outputs={"Out": mean_out})
+                inputs={"X": mul_x,
-        sgd_optimizer = optimizer.SGDOptimizer(learning_rate=0.01)
+                        "Y": mul_y},
-        opts, _ = sgd_optimizer.minimize(mean_out, init_program)
+                outputs={"Out": mul_out},
                attrs={"x_num_col_dims": 1})
            block.append_op(
                type="mean", inputs={"X": mul_out}, outputs={"Out": mean_out})
            sgd_optimizer = optimizer.SGDOptimizer(learning_rate=0.01)
            opts, _ = sgd_optimizer.minimize(mean_out, init_program)
            return opts
        opts = check_sgd_optimizer({'learning_rate': 1.1})
        self.assertEqual(len(opts), 3)
        self.assertEqual([op.type for op in opts],
                         ["fill_constant", "elementwise_mul", "sgd"])
        opts = check_sgd_optimizer({'learning_rate': 1.0})
        self.assertEqual(len(opts), 1)
        self.assertEqual([op.type for op in opts], ["sgd"])
 class TestMomentumOptimizer(unittest.TestCase):
    class MockMomentum(optimizer.MomentumOptimizer):
@ -60,7 +72,11 @@ class TestMomentumOptimizer(unittest.TestCase):
        program = framework.Program()
        block = program.global_block()
        mul_x = block.create_parameter(
-            dtype="float32", shape=[5, 10], lod_level=0, name="mul.x")
+            dtype="float32",
            shape=[5, 10],
            lod_level=0,
            name="mul.x",
            optimize_attr={'learning_rate': 1.1})
        mul_y = block.create_var(
            dtype="float32", shape=[10, 8], lod_level=0, name="mul.y")
        mul_out = block.create_var(
@ -110,7 +126,11 @@ class TestMomentumOptimizer(unittest.TestCase):
        program = framework.Program()
        block = program.global_block()
        mul_x = block.create_parameter(
-            dtype="float32", shape=[5, 10], lod_level=0, name="mul.x")
+            dtype="float32",
            shape=[5, 10],
            lod_level=0,
            name="mul.x",
            optimize_attr={'learning_rate': 1.1})
        mul_y = block.create_var(
            dtype="float32", shape=[10, 8], lod_level=0, name="mul.y")
        mul_out = block.create_var(
@ -169,7 +189,11 @@ class TestAdagradOptimizer(unittest.TestCase):
        program = framework.Program()
        block = program.global_block()
        mul_x = block.create_parameter(
-            dtype="float32", shape=[5, 10], lod_level=0, name="mul.x")
+            dtype="float32",
            shape=[5, 10],
            lod_level=0,
            name="mul.x",
            optimize_attr={'learning_rate': 1.1})
        mul_y = block.create_var(
            dtype="float32", shape=[10, 8], lod_level=0, name="mul.y")
        mul_out = block.create_var(
@ -229,7 +253,11 @@ class TestAdamOptimizer(unittest.TestCase):
        program = framework.Program()
        block = program.global_block()
        mul_x = block.create_parameter(
-            dtype="float32", shape=[5, 10], lod_level=0, name="mul.x")
+            dtype="float32",
            shape=[5, 10],
            lod_level=0,
            name="mul.x",
            optimize_attr={'learning_rate': 1.1})
        mul_y = block.create_var(
            dtype="float32", shape=[10, 8], lod_level=0, name="mul.y")
        mul_out = block.create_var(
@ -292,7 +320,11 @@ class TestAdamaxOptimizer(unittest.TestCase):
        program = framework.Program()
        block = program.global_block()
        mul_x = block.create_parameter(
-            dtype="float32", shape=[5, 10], lod_level=0, name="mul.x")
+            dtype="float32",
            shape=[5, 10],
            lod_level=0,
            name="mul.x",
            optimize_attr={'learning_rate': 1.1})
        mul_y = block.create_var(
            dtype="float32", shape=[10, 8], lod_level=0, name="mul.y")
        mul_out = block.create_var(
@ -352,7 +384,11 @@ class TestDecayedAdagradOptimizer(unittest.TestCase):
        program = framework.Program()
        block = program.global_block()
        mul_x = block.create_parameter(
-            dtype="float32", shape=[5, 10], lod_level=0, name="mul.x")
+            dtype="float32",
            shape=[5, 10],
            lod_level=0,
            name="mul.x",
            optimize_attr={'learning_rate': 1.1})
        mul_y = block.create_var(
            dtype="float32", shape=[10, 8], lod_level=0, name="mul.y")
        mul_out = block.create_var(