FTRL with sparse update, test=develop (#22092)

5 years ago · a6beb96dd0
parent 6aae034f8d
commit a6beb96dd0
3 changed files with 316 additions and 100 deletions
--- a/paddle/fluid/operators/optimizers/ftrl_op.cc
+++ b/paddle/fluid/operators/optimizers/ftrl_op.cc
@ -32,20 +32,6 @@ class FTRLOp : public framework::OperatorWithKernel {
    OP_INOUT_CHECK(ctx->HasInput("Grad"), "Input", "Grad", "FTRL");
    OP_INOUT_CHECK(ctx->HasInput("LearningRate"), "Input", "LearningRate",
                   "FTRL");
-    PADDLE_ENFORCE_EQ(
-        ctx->GetInputsVarType("Param").front(),
-        framework::proto::VarType::LOD_TENSOR,
-        platform::errors::InvalidArgument(
-            "The input var's type should be LoDTensor, but the received is %s",
-            ctx->Inputs("Param").front(),
-            ctx->GetInputsVarType("Param").front()));
-    PADDLE_ENFORCE_EQ(
-        ctx->GetInputsVarType("Grad").front(),
-        framework::proto::VarType::LOD_TENSOR,
-        platform::errors::InvalidArgument(
-            "The input var's type should be LoDTensor, but the received is %s",
-            ctx->Inputs("Grad").front(),
-            ctx->GetInputsVarType("Grad").front()));

    OP_INOUT_CHECK(ctx->HasOutput("ParamOut"), "Output", "ParamOut", "FTRL");
    OP_INOUT_CHECK(ctx->HasOutput("SquaredAccumOut"), "Output",
--- a/paddle/fluid/operators/optimizers/ftrl_op.h
+++ b/paddle/fluid/operators/optimizers/ftrl_op.h
--- a/python/paddle/fluid/tests/unittests/test_ftrl_op.py
+++ b/python/paddle/fluid/tests/unittests/test_ftrl_op.py
@ -16,16 +16,62 @@ from __future__ import print_function

 import unittest
 import numpy as np
+import paddle.fluid.core as core
+from paddle.fluid.op import Operator
 from op_test import OpTest


+def ftrl_step(param, grad, rows, sq_accum, lin_accum, lr, l1, l2, lr_power):
+    l1 += 1e-10
+    l2 += 1e-10
+
+    param_hit = param[rows]
+    sq_accum_hit = sq_accum[rows]
+    lin_accum_hit = lin_accum[rows]
+
+    new_accum = sq_accum_hit + grad * grad
+    if lr_power == -0.5:
+        lin_accum_updated = lin_accum_hit + grad - (
+            (np.sqrt(new_accum) - np.sqrt(sq_accum_hit)) / lr) * param_hit
+    else:
+        lin_accum_updated = lin_accum_hit + grad - (
+            (np.power(new_accum, -lr_power) - np.power(sq_accum_hit, -lr_power)
+             ) / lr) * param_hit
+
+    x = l1 * np.sign(lin_accum_updated) - lin_accum_updated
+    if lr_power == -0.5:
+        y = (np.sqrt(new_accum) / lr) + (2 * l2)
+        pre_shrink = x / y
+        param_updated = np.where(
+            np.abs(lin_accum_updated) > l1, pre_shrink, 0.0)
+    else:
+        y = (np.power(new_accum, -lr_power) / lr) + (2 * l2)
+        pre_shrink = x / y
+        param_updated = np.where(
+            np.abs(lin_accum_updated) > l1, pre_shrink, 0.0)
+
+    sq_accum_updated = sq_accum_hit + grad * grad
+
+    param_out = param.copy()
+    sq_accum_out = sq_accum.copy()
+    lin_accum_out = lin_accum.copy()
+
+    for i in range(len(rows)):
+        param_out[rows[i]] = param_updated[i]
+        sq_accum_out[rows[i]] = sq_accum_updated[i]
+        lin_accum_out[rows[i]] = lin_accum_updated[i]
+
+    return param_out, sq_accum_out, lin_accum_out
+
+
 class TestFTRLOp(OpTest):
    def setUp(self):
        self.op_type = "ftrl"
-        w = np.random.random((102, 105)).astype("float32")
-        g = np.random.random((102, 105)).astype("float32")
-        sq_accum = np.full((102, 105), 0.1).astype("float32")
-        linear_accum = np.full((102, 105), 0.1).astype("float32")
+        rows = 102
+        w = np.random.random((rows, 105)).astype("float32")
+        g = np.random.random((rows, 105)).astype("float32")
+        sq_accum = np.full((rows, 105), 0.1).astype("float32")
+        linear_accum = np.full((rows, 105), 0.1).astype("float32")
        lr = np.array([0.01]).astype("float32")
        l1 = 0.1
        l2 = 0.2
@ -44,35 +90,115 @@ class TestFTRLOp(OpTest):
            'lr_power': lr_power,
            'learning_rate': lr
        }
-        new_accum = sq_accum + g * g
-        if lr_power == -0.5:
-            linear_out = linear_accum + g - (
-                (np.sqrt(new_accum) - np.sqrt(sq_accum)) / lr) * w
-        else:
-            linear_out = linear_accum + g - ((np.power(
-                new_accum, -lr_power) - np.power(sq_accum, -lr_power)) / lr) * w
-
-        x = (l1 * np.sign(linear_out) - linear_out)
-        if lr_power == -0.5:
-            y = (np.sqrt(new_accum) / lr) + (2 * l2)
-            pre_shrink = x / y
-            param_out = np.where(np.abs(linear_out) > l1, pre_shrink, 0.0)
-        else:
-            y = (np.power(new_accum, -lr_power) / lr) + (2 * l2)
-            pre_shrink = x / y
-            param_out = np.where(np.abs(linear_out) > l1, pre_shrink, 0.0)
-
-        sq_accum_out = sq_accum + g * g
+
+        param_out, sq_accum_out, lin_accum_out = ftrl_step(
+            w, g, range(rows), sq_accum, linear_accum, lr, l1, l2, lr_power)

        self.outputs = {
            'ParamOut': param_out,
            'SquaredAccumOut': sq_accum_out,
-            'LinearAccumOut': linear_out
+            'LinearAccumOut': lin_accum_out
        }

    def test_check_output(self):
        self.check_output()


+class TestSparseFTRLOp(unittest.TestCase):
+    def setUp(self):
+        self.lr_power = -0.5
+
+    def check_with_place(self, place):
+        self.init_kernel()
+        scope = core.Scope()
+
+        height = 10
+        rows = [0, 4, 7]
+        row_numel = 12
+        l1 = 0.1
+        l2 = 0.2
+        lr_power = self.lr_power
+
+        # create and initialize Param Variable
+        param = scope.var('Param').get_tensor()
+        param_array = np.random.random((height, row_numel)).astype("float32")
+        param.set(param_array, place)
+
+        # create and initialize Grad Variable
+        grad = scope.var('Grad').get_selected_rows()
+        grad.set_height(height)
+        grad.set_rows(rows)
+        grad_array = np.random.random((len(rows), row_numel)).astype("float32")
+
+        grad_tensor = grad.get_tensor()
+        grad_tensor.set(grad_array, place)
+
+        # create and initialize SquaredAccumulator Variable
+        sq_accum = scope.var('SquaredAccumulator').get_tensor()
+        sq_accum_array = np.full((height, row_numel), 0.1).astype("float32")
+        sq_accum.set(sq_accum_array, place)
+
+        # create and initialize LinearAccumulator Variable
+        lin_accum = scope.var('LinearAccumulator').get_tensor()
+        lin_accum_array = np.full((height, row_numel), 0.1).astype("float32")
+        lin_accum.set(lin_accum_array, place)
+
+        # create and initialize LeraningRate Variable
+        lr = scope.var('LearningRate').get_tensor()
+        lr_array = np.array([0.01]).astype("float32")
+        lr.set(lr_array, place)
+
+        # calculate ground-truth answer
+        param_out, sq_accum_out, lin_accum_out = ftrl_step(
+            param_array, grad_array, rows, sq_accum_array, lin_accum_array, lr,
+            l1, l2, lr_power)
+
+        # create and run operator
+        op = Operator(
+            "ftrl",
+            Param='Param',
+            Grad='Grad',
+            ParamOut='Param',
+            SquaredAccumulator='SquaredAccumulator',
+            SquaredAccumOut='SquaredAccumulator',
+            LinearAccumulator='LinearAccumulator',
+            LinearAccumOut='LinearAccumulator',
+            LearningRate='LearningRate',
+            l1=l1,
+            l2=l2,
+            lr_power=lr_power)
+
+        op.run(scope, place)
+
+        # get and compare param result
+        param_array = np.array(param)
+        sq_accum_array = np.array(sq_accum)
+        lin_accum_array = np.array(lin_accum)
+
+        for i in range(height):
+            for j in range(row_numel):
+                self.assertAlmostEqual(
+                    param_out[i][j], param_array[i][j], places=4)
+                self.assertAlmostEqual(
+                    sq_accum_out[i][j], sq_accum_array[i][j], places=4)
+                self.assertAlmostEqual(
+                    lin_accum_out[i][j], lin_accum_array[i][j], places=4)
+
+    def init_kernel(self):
+        pass
+
+    def test_sparse_ftrl(self):
+        places = [core.CPUPlace()]
+        if core.is_compiled_with_cuda():
+            places.append(core.CUDAPlace(0))
+        for place in places:
+            self.check_with_place(place)
+
+
+class TestSparseFTRLOp2(TestSparseFTRLOp):
+    def init_kernel(self):
+        self.lr_power = -0.6
+
+
 if __name__ == "__main__":
    unittest.main()