Add grad of sort.

5 years ago · aacad990c3
parent 3945bdcabb
commit aacad990c3
2 changed files with 89 additions and 1 deletions
--- a/mindspore/ops/_grad/grad_array_ops.py
+++ b/mindspore/ops/_grad/grad_array_ops.py
@ -15,8 +15,10 @@

 """array_ops"""

+import numpy as np
 import mindspore as ms
 from mindspore.ops import composite as C
+from mindspore.common.tensor import Tensor
 from .. import operations as P
 from ..operations import _grad_ops as G
 from ..operations import _inner_ops as inner
@ -459,6 +461,87 @@ def get_bprop_sparse_gather_v2(self):
    return bprop


+@constexpr
+def _range_op(start, limit, delta, dtype):
+    """helper function for grad of Sort"""
+    output_tensor = Tensor(list(range(start, limit, delta)), dtype)
+    return output_tensor
+
+@constexpr
+def _get_1d_shape(in_shape):
+    """helper function for grad of Sort"""
+    out_shape = 1
+    for i in in_shape:
+        out_shape *= i
+    return (out_shape,)
+
+@constexpr
+def _get_transposition(axis, rank):
+    """helper function for grad of Sort"""
+    if axis < 0:
+        axis += rank
+    transposition = np.r_[np.arange(axis), [rank - 1], np.arange(axis + 1, rank - 1), [axis]]
+    trans = tuple(transposition.tolist())
+    return trans
+
+@bprop_getters.register(P.Sort)
+def get_bprop_sort(self):
+    """Grad definition for `Sort` operation."""
+    axis = self.axis
+    descending = self.descending
+    scatter = P.ScatterNd()
+    expand_dims = P.ExpandDims()
+    reshape_op = P.Reshape()
+    dtype = P.DType()
+    topk = P.TopK()
+    neg = P.Neg()
+    tranpose = P.Transpose()
+
+    def bprop(input_x, out, dout):
+        x_shape = input_x.shape
+        k = x_shape[axis]
+        rank = F.rank(input_x)
+        dvalue = dout[0]
+        if not descending:
+            input_x = neg(input_x)
+            dvalue = neg(dvalue)
+        if axis == -1 or (axis + 1) == rank:
+            transposition = None
+            top_k_input = input_x
+        else:
+            transposition = _get_transposition(axis, rank)
+            top_k_input = tranpose(input_x, transposition)
+
+        _, indices = topk(top_k_input, k)
+        ind_shape = indices.shape
+        top_k_input_shape = top_k_input.shape
+        in_lastdim = top_k_input_shape[-1]
+        ind_lastdim = ind_shape[-1]
+        ind_2d = reshape_op(indices, (-1, ind_lastdim))
+        outer_dim = ind_2d.shape[0]
+
+        # [0, outterdim, 2*outerdim, ..., (k-1)*outerdim]
+        indices_dtype = dtype(indices)
+        range_flatten_index = _range_op(0, outer_dim * in_lastdim, in_lastdim, indices_dtype)
+
+        # expand_dims to (k, 1), then broadcast
+        ind = reshape_op(ind_2d + expand_dims(range_flatten_index, -1), (-1,))
+        x_shape_1d = _get_1d_shape(top_k_input_shape)
+
+        if transposition is not None:
+            dvalue = tranpose(dvalue, invert_permutation(transposition))
+            out_grad = reshape_op(
+                scatter(expand_dims(ind, -1), reshape_op(dvalue, (-1,)), x_shape_1d), top_k_input_shape)
+            dx = tranpose(out_grad, invert_permutation(transposition))
+        else:
+            dx = reshape_op(scatter(expand_dims(ind, -1), reshape_op(dvalue, (-1,)), x_shape_1d), top_k_input_shape)
+        if not descending:
+            dx = neg(dx)
+        return (dx,)
+
+    return bprop
+
+
@bprop_getters.register(P.Identity)
 def get_bprop_identity(self):
    """Generate bprop for Identity"""
@ -475,6 +558,7 @@ def get_bprop_range(self):

    def bprop(x, out, dout):
        return (zeros_like(x),)
+
    return bprop


@ -506,7 +590,7 @@ def get_bprop_reverse_v2(self):
        dx = reverse_grad(dout)
        return (dx,)

-    return  bprop
+    return bprop

@bprop_getters.register(P.Unpack)
 def get_bprop_unpack(self):
--- a/tests/ut/python/ops/test_ops.py
+++ b/tests/ut/python/ops/test_ops.py
@ -1708,6 +1708,10 @@ test_case_nn_ops = [
        'desc_inputs': [[20, 20, 10]],
        'desc_bprop': [[20, 20, 5]],
        'skip': ['backward']}),
+    ('Sort', {
+        'block': P.Sort(),
+        'desc_inputs': [[2, 3, 4]],
+        'desc_bprop': [[2, 3, 4], ([2, 3, 4], {'dtype': np.int32})]}),
    ('GatherV2_0', {
        'block': P.GatherV2(),
        'desc_const': [0],