Paddle/python/paddle/v2/fluid/backward.py

from paddle.v2.fluid import framework as framework
from . import core
import collections

__all__ = ['append_backward']


def _rename_arg_(op_descs, old_name, new_name, begin_idx=None, end_idx=None):
    """
    Traverse all ops in op_descs[begin_idx : end_idx],
    if any op has inputs/outputs named "old_name", rename it as 'new_name'
    """
    if begin_idx is None:
        begin_idx = 0
    if end_idx is None:
        end_idx = len(op_descs)
    for i in range(begin_idx, end_idx):
        op_desc = op_descs[i]
        if isinstance(op_desc, tuple):
            op_desc = op_desc[0]
        op_desc.rename_input(old_name, new_name)
        op_desc.rename_output(old_name, new_name)


def _create_op_desc_(op_type, inputs, outputs, attrs):
    """
    Create a C++ OpDesc object with specified inputs, outputs and attributes.
    """
    op_desc = core.OpDesc()
    op_desc.set_type(op_type)
    for para, args in inputs.iteritems():
        op_desc.set_input(para, args)
    for para, args in outputs.iteritems():
        op_desc.set_output(para, args)
    for name, val in attrs.iteritems():
        if isinstance(val, framework.Block):
            op_desc.set_block_attr(name, val.desc)
        else:
            op_desc.set_attr(name, val)
    return op_desc


def _infer_var_data_type_(grad_var_name, block):
    """
    Infer the data type of given grad variable
    """
    grad_var = block.desc.find_var(grad_var_name.encode("ascii"))
    fwd_name = _strip_grad_suffix_(grad_var_name.encode("ascii"))
    if block.desc.has_var_recursive(fwd_name):
        fwd_var = block.desc.find_var_recursive(fwd_name.encode("ascii"))
        grad_var.set_dtype(fwd_var.dtype())
    else:
        grad_var.set_dtype(core.DataType.FP32)


def _all_in_set_(cands, s):
    """
    Test if all elements of 'cands' are in set 's'
    """
    if len(cands) == 0:
        return False
    for c in cands:
        if not c in s:
            return False
    return True


def _strip_grad_suffix_(name):
    """
    Strip the grad suffix from the given varibale name
    e.g. x@GRAD ==> x
         y@GRAD@RENAME@1 ==> y
    """
    pos = name.find(core.grad_var_suffix())
    return name[:pos] if pos != -1 else name


def _append_grad_suffix_(name):
    """
    Append grad suffix to the given variable name
    e.g. x ==> x@GRAD
    """
    return name + core.grad_var_suffix()


def _addup_repetitive_outputs_(op_descs):
    """
    In backward part, an variable may be the output of more than one ops.
    In this case, the variable should be the accumulation of all the outputs.
    `sum_op`s are added to implement the accumulate.
    """
    pending_sum_ops = []
    var_rename_count = collections.defaultdict(int)
    renamed_vars = collections.defaultdict(list)
    for idx, op_desc in enumerate(op_descs):
        for var_name in op_desc.input_arg_names():
            if len(renamed_vars[var_name]) > 1:
                pending_sum_ops.append(
                    (_create_op_desc_("sum", {"X": renamed_vars[var_name]},
                                      {"Out": [var_name]}, {}), idx))
                renamed_vars[var_name] = [var_name]
        for var_name in op_desc.output_arg_names():
            if var_name == core.empty_var_name(
            ) or var_name in op_desc.input_arg_names():
                # empty variable or inplace op
                continue
            if len(renamed_vars[var_name]) == 0:
                # it's the first time we get the variable
                renamed_vars[var_name] = [var_name]
            else:
                if len(renamed_vars[var_name]) == 1:
                    new_name = var_name + "@RENAME@" + \
                        str(var_rename_count[var_name])
                    var_rename_count[var_name] += 1
                    # rename original var_name
                    renamed_vars[var_name][0] = new_name
                    _rename_arg_(op_descs, var_name, new_name, 0, idx)
                    _rename_arg_(pending_sum_ops, var_name, new_name)

                new_name = var_name + "@RENAME@" + \
                    str(var_rename_count[var_name])
                var_rename_count[var_name] += 1
                op_desc.rename_output(var_name, new_name)
                renamed_vars[var_name].append(new_name)
    for var_name, inputs in renamed_vars.iteritems():
        if len(inputs) > 1:
            pending_sum_ops.append((_create_op_desc_(
                "sum", {"X": inputs}, {"Out": [var_name]}, {}), len(op_descs)))
    # sum_op descs are sorted according to their insert position
    for p in reversed(pending_sum_ops):
        op_descs.insert(p[1], p[0])

    return op_descs


def _remove_no_grad_branch_(op_descs, no_grad_set):
    """
    Remove unnecessary grad ops
    A grad op can be removed in two cases:
        1. all outputs of the grad op are in 'no_grad_set'
        2. all grad inputs of the grad op are in 'no_grad_set'
    """

    def _op_can_be_removed_(op_desc, no_grad_set):
        out_arg_names = op_desc.output_arg_names()
        if len(out_arg_names) == 0 or _all_in_set_(out_arg_names, no_grad_set):
            return True
        if _all_in_set_(
                filter(lambda name: name.find(core.grad_var_suffix()) != -1,
                       op_desc.input_arg_names()), no_grad_set):
            no_grad_set.union(out_arg_names)
            return True
        return False

    # Remove ops whose outputs are all in no_grad_dict
    op_descs = filter(
        lambda op_desc: not _op_can_be_removed_(op_desc, no_grad_set), op_descs)
    # Insert fill_zeros_like_op
    to_insert = []
    for idx, op_desc in enumerate(op_descs):
        for arg in op_desc.input_arg_names():
            if core.grad_var_suffix() in arg and arg in no_grad_set:
                to_insert.append((_create_op_desc_("fill_zeros_like", {
                    "X": [_strip_grad_suffix_(arg)]
                }, {"Out": [arg]}, {}), idx))

    map(lambda p: op_descs.insert(p[1], p[0]), reversed(to_insert))

    return op_descs


def _append_backward_ops_(target,
                          block,
                          target_block,
                          no_grad_dict,
                          grad_to_var,
                          callback=None):
    """
    Create all grad ops, and insert them into given block

    Args:
        target(Variable): the target variable of forward pass
        block(Block): the block where forward ops are
        target_block(Block): the block which is going to hold new generated grad ops
        no_grad_dict(dict):
            key(int)  block index
            val(set) a set of varibale names. These varibales have no gradient
        grad_to_var(dict)(output argument):
            key(str): grad variable name
            val(str): corresponding forward variable name
        callback(callable object): a callable object used to decorate new generated grad ops
    """
    if callback is None:

        def empty_callback(block, context):
            pass

        callback = empty_callback
    elif not hasattr(callback, '__call__'):
        raise ValueError("'callback' must be a callable object.")

    # grad_op_descs holds created grad_op, and will be appended to target_block
    grad_op_descs = []
    program = block.program
    for op in reversed(block.ops):
        grad_sub_block_list = []
        # If the op has its own sub-block, deal with the sub-block first
        if op.has_attr("sub_block"):
            sub_block = program.block(op.block_attr("sub_block"))
            grad_sub_block = program.create_block(parent_idx=sub_block.idx)
            _append_backward_ops_(target, sub_block, grad_sub_block,
                                  no_grad_dict, grad_to_var, callback)
            grad_sub_block_list.append(grad_sub_block.desc)

        # Getting op's corresponding grad_op
        grad_op_desc, op_grad_to_var = core.get_grad_op_desc(
            op.desc, no_grad_dict[block.idx], grad_sub_block_list)

        grad_op_descs.extend(grad_op_desc)
        grad_to_var.update(op_grad_to_var)

    grad_op_descs = _addup_repetitive_outputs_(grad_op_descs)

    grad_op_descs = _remove_no_grad_branch_(grad_op_descs,
                                            no_grad_dict[block.idx])

    if target_block.idx == 0:
        grad_op_descs.insert(
            0,
            _create_op_desc_("fill_constant", {}, {
                "Out": [_append_grad_suffix_(target.name)]
            }, {"shape": [1],
                "value": 1.0,
                "dtype": target.dtype}))
    # append op_desc in grad_op_descs to target_block
    for op_desc in grad_op_descs:
        new_op_desc = target_block.desc.append_op()
        new_op_desc.copy_from(op_desc)
        callback(block=target_block, context=grad_to_var)


def _append_backward_vars_(block, start_op_idx, grad_to_var, grad_info_map):
    """
    Create new variables required by backward pass.

    Args:
        block(Block): the block where new variables will be created
        start_op_idx(int): Only variables required by ops in block.ops[start_op_idx : ] will be created
        grad_to_var(dict):
            key(str): grad variable name
            val(str): corresponding forward variable name
            In most cases, this dict is generated by _append_backward_ops_()
        grad_info_map(dict)(output argument):
            key(str): forward variable name
            val(tuple): a tuple of (str, int), str is the corresponding grad name, int is the block index
    """
    for op_idx in range(start_op_idx, block.desc.op_size()):
        op_desc = block.desc.op(op_idx)
        if op_desc.has_attr("sub_block"):
            sub_block = block.program.block(op_desc.block_attr("sub_block"))
            _append_backward_vars_(sub_block, 0, grad_to_var, grad_info_map)
        new_vars = set()
        # create new gradient variables
        for grad_var_name in op_desc.output_arg_names():
            grad_var_name = grad_var_name.encode("ascii")
            if block.desc.has_var_recursive(
                    grad_var_name) or grad_var_name == core.empty_var_name():
                continue
            block.desc.var(grad_var_name)
            new_vars.add(grad_var_name)
            if not grad_to_var.has_key(grad_var_name):
                continue
            grad_info_map[grad_to_var[grad_var_name]] = (grad_var_name, block)
        # infer_shape and infer_type
        op_desc.infer_var_type(block.desc)
        op_desc.infer_shape(block.desc)
        for arg in op_desc.output_arg_names():
            if arg in new_vars:
                _infer_var_data_type_(arg, block)


def append_backward(loss, parameter_list=None, no_grad_set=None, callback=None):
    """
    Append backward part to main_program

    Args:
        loss(Variable): The variable generated by cost function.
        parameter_list(list): Parameters that need to be updated by optimizer.
            If None, it means all parameters need to be updated.
        no_grad_set(set): Variables that have no gradients in Block 0.
            If None, the set will be generated inside the function and
            contains all variables with `step_gradient=True` from all blocks.

    Return:
        (list[Variable]): list of (parameters, gradients) pair.
    """
    assert isinstance(loss, framework.Variable)

    program = loss.block.program
    no_grad_dict = dict()
    if no_grad_set is None:
        assert isinstance(program, framework.Program)
        for block in program.blocks:
            assert isinstance(block, framework.Block)
            block_no_grad_set = set()
            for var in block.vars.itervalues():
                assert isinstance(var, framework.Variable)
                if var.stop_gradient:
                    block_no_grad_set.add(_append_grad_suffix_(var.name))
            no_grad_dict[block.idx] = block_no_grad_set
    elif isinstance(no_grad_set, set):
        no_grad_dict = {
            0: set([_append_grad_suffix_(name) for name in no_grad_set])
        }
    else:
        raise ValueError("'no_grad_set' should be a set or None.")

    grad_info_map = dict()
    root_block = program.block(0)

    fwd_op_num = root_block.desc.op_size()
    current_block_idx = program.current_block_idx
    grad_to_var = dict()

    _append_backward_ops_(loss, root_block, root_block, no_grad_dict,
                          grad_to_var, callback)
    _append_backward_vars_(root_block, fwd_op_num, grad_to_var, grad_info_map)

    program.current_block_idx = current_block_idx
    program.sync_with_cpp()

    if parameter_list is not None:
        parameters = parameter_list
    else:
        params = program.global_block().all_parameters()
        parameters = [param.name for param in params]
    params_and_grads = []
    for param in parameters:
        if param not in grad_info_map:
            raise ValueError("param %s is not in map" % param)
        grad_info = grad_info_map[param]
        grad_block = grad_info[1]
        if not grad_block.has_var(grad_info[0]):
            raise ValueError("grad block[{0}] did not have grad var {1}".format(
                grad_info[1], grad_info[0]))
        # Get the param var from the global block
        param_var = program.global_block().var(param)
        grad_var = grad_block.var(grad_info[0])
        if loss.block.has_var(grad_info[0]):
            params_and_grads.append((param_var, grad_var))
        else:
            params_and_grads.append((param_var, None))
    return params_and_grads
Change framework to fluid (#5637) * init commit * change some dir name 7 years ago			`from paddle.v2.fluid import framework as framework`
update 7 years ago			`from . import core`
update 7 years ago			`import collections`
Extract apply_backward_pass to backward.py (#5026) * Extract apply_backward_pass to backward.py Rename apply_backward_pass to append_backward_ops * Fix CI * Update design doc 7 years ago
pass test_machine_translation.py 7 years ago			`__all__ = ['append_backward']`
Extract apply_backward_pass to backward.py (#5026) * Extract apply_backward_pass to backward.py Rename apply_backward_pass to append_backward_ops * Fix CI * Update design doc 7 years ago

Add comments for functions in backward.py 7 years ago			`def _rename_arg_(op_descs, old_name, new_name, begin_idx=None, end_idx=None):`
			`"""`
Bug fix when inserting fill_zeros_like_op. 7 years ago			`Traverse all ops in op_descs[begin_idx : end_idx],`
Add comments for functions in backward.py 7 years ago			`if any op has inputs/outputs named "old_name", rename it as 'new_name'`
			`"""`
update 7 years ago			`if begin_idx is None:`
			`begin_idx = 0`
			`if end_idx is None:`
Add comments for functions in backward.py 7 years ago			`end_idx = len(op_descs)`
update 7 years ago			`for i in range(begin_idx, end_idx):`
Add comments for functions in backward.py 7 years ago			`op_desc = op_descs[i]`
fix a bug 7 years ago			`if isinstance(op_desc, tuple):`
			`op_desc = op_desc[0]`
			`op_desc.rename_input(old_name, new_name)`
			`op_desc.rename_output(old_name, new_name)`
update 7 years ago

Compelete basic framework 7 years ago			`def _create_op_desc_(op_type, inputs, outputs, attrs):`
Add comments for functions in backward.py 7 years ago			`"""`
			`Create a C++ OpDesc object with specified inputs, outputs and attributes.`
			`"""`
Compelete basic framework 7 years ago			`op_desc = core.OpDesc()`
			`op_desc.set_type(op_type)`
			`for para, args in inputs.iteritems():`
			`op_desc.set_input(para, args)`
			`for para, args in outputs.iteritems():`
			`op_desc.set_output(para, args)`
			`for name, val in attrs.iteritems():`
			`if isinstance(val, framework.Block):`
			`op_desc.set_block_attr(name, val.desc)`
			`else:`
			`op_desc.set_attr(name, val)`
			`return op_desc`


Add comments for functions in backward.py 7 years ago			`def _infer_var_data_type_(grad_var_name, block):`
			`"""`
			`Infer the data type of given grad variable`
			`"""`
			`grad_var = block.desc.find_var(grad_var_name.encode("ascii"))`
			`fwd_name = _strip_grad_suffix_(grad_var_name.encode("ascii"))`
Pass test_dyn_rnn.py 7 years ago			`if block.desc.has_var_recursive(fwd_name):`
			`fwd_var = block.desc.find_var_recursive(fwd_name.encode("ascii"))`
			`grad_var.set_dtype(fwd_var.dtype())`
			`else:`
			`grad_var.set_dtype(core.DataType.FP32)`


code clean 7 years ago			`def _all_in_set_(cands, s):`
Add comments for functions in backward.py 7 years ago			`"""`
			`Test if all elements of 'cands' are in set 's'`
			`"""`
enhance no_grad_var handling 7 years ago			`if len(cands) == 0:`
			`return False`
Add the simple support of no_grad_set 7 years ago			`for c in cands:`
			`if not c in s:`
			`return False`
			`return True`


			`def _strip_grad_suffix_(name):`
Add comments for functions in backward.py 7 years ago			`"""`
			`Strip the grad suffix from the given varibale name`
			`e.g. x@GRAD ==> x`
			`y@GRAD@RENAME@1 ==> y`
			`"""`
fix an error 7 years ago			`pos = name.find(core.grad_var_suffix())`
			`return name[:pos] if pos != -1 else name`
Add the simple support of no_grad_set 7 years ago

			`def _append_grad_suffix_(name):`
Add comments for functions in backward.py 7 years ago			`"""`
			`Append grad suffix to the given variable name`
			`e.g. x ==> x@GRAD`
			`"""`
Add the simple support of no_grad_set 7 years ago			`return name + core.grad_var_suffix()`


code clean 7 years ago			`def _addup_repetitive_outputs_(op_descs):`
Add comments for functions in backward.py 7 years ago			`"""`
			`In backward part, an variable may be the output of more than one ops.`
			`In this case, the variable should be the accumulation of all the outputs.`
			`sum_op`s are added to implement the accumulate.
			`"""`
update 7 years ago			`pending_sum_ops = []`
			`var_rename_count = collections.defaultdict(int)`
code clean 7 years ago			`renamed_vars = collections.defaultdict(list)`
			`for idx, op_desc in enumerate(op_descs):`
update 7 years ago			`for var_name in op_desc.input_arg_names():`
code clean 7 years ago			`if len(renamed_vars[var_name]) > 1:`
			`pending_sum_ops.append(`
			`(_create_op_desc_("sum", {"X": renamed_vars[var_name]},`
			`{"Out": [var_name]}, {}), idx))`
			`renamed_vars[var_name] = [var_name]`
update 7 years ago			`for var_name in op_desc.output_arg_names():`
code clean 7 years ago			`if var_name == core.empty_var_name(`
			`) or var_name in op_desc.input_arg_names():`
			`# empty variable or inplace op`
fix a bug of inplace 7 years ago			`continue`
code clean 7 years ago			`if len(renamed_vars[var_name]) == 0:`
update 7 years ago			`# it's the first time we get the variable`
code clean 7 years ago			`renamed_vars[var_name] = [var_name]`
update 7 years ago			`else:`
code clean 7 years ago			`if len(renamed_vars[var_name]) == 1:`
update 7 years ago			`new_name = var_name + "@RENAME@" + \`
			`str(var_rename_count[var_name])`
code clean 7 years ago			`var_rename_count[var_name] += 1`
update 7 years ago			`# rename original var_name`
code clean 7 years ago			`renamed_vars[var_name][0] = new_name`
			`_rename_arg_(op_descs, var_name, new_name, 0, idx)`
Compelete basic framework 7 years ago			`_rename_arg_(pending_sum_ops, var_name, new_name)`
update 7 years ago
			`new_name = var_name + "@RENAME@" + \`
			`str(var_rename_count[var_name])`
code clean 7 years ago			`var_rename_count[var_name] += 1`
update 7 years ago			`op_desc.rename_output(var_name, new_name)`
code clean 7 years ago			`renamed_vars[var_name].append(new_name)`
			`for var_name, inputs in renamed_vars.iteritems():`
update 7 years ago			`if len(inputs) > 1:`
Compelete basic framework 7 years ago			`pending_sum_ops.append((_create_op_desc_(`
code clean 7 years ago			`"sum", {"X": inputs}, {"Out": [var_name]}, {}), len(op_descs)))`
pass test_understand_sentiment_lstm.py 7 years ago			`# sum_op descs are sorted according to their insert position`
update 7 years ago			`for p in reversed(pending_sum_ops):`
code clean 7 years ago			`op_descs.insert(p[1], p[0])`

			`return op_descs`


			`def _remove_no_grad_branch_(op_descs, no_grad_set):`
Add comments for functions in backward.py 7 years ago			`"""`
			`Remove unnecessary grad ops`
			`A grad op can be removed in two cases:`
			`1. all outputs of the grad op are in 'no_grad_set'`
update backward doc 7 years ago			`2. all grad inputs of the grad op are in 'no_grad_set'`
Add comments for functions in backward.py 7 years ago			`"""`
enhance no_grad_var handling 7 years ago
			`def _op_can_be_removed_(op_desc, no_grad_set):`
fix bugs 7 years ago			`out_arg_names = op_desc.output_arg_names()`
			`if len(out_arg_names) == 0 or _all_in_set_(out_arg_names, no_grad_set):`
enhance no_grad_var handling 7 years ago			`return True`
			`if _all_in_set_(`
			`filter(lambda name: name.find(core.grad_var_suffix()) != -1,`
			`op_desc.input_arg_names()), no_grad_set):`
fix bugs 7 years ago			`no_grad_set.union(out_arg_names)`
enhance no_grad_var handling 7 years ago			`return True`
			`return False`

code clean 7 years ago			`# Remove ops whose outputs are all in no_grad_dict`
			`op_descs = filter(`
enhance no_grad_var handling 7 years ago			`lambda op_desc: not _op_can_be_removed_(op_desc, no_grad_set), op_descs)`
Add the simple support of no_grad_set 7 years ago			`# Insert fill_zeros_like_op`
			`to_insert = []`
code clean 7 years ago			`for idx, op_desc in enumerate(op_descs):`
Add the simple support of no_grad_set 7 years ago			`for arg in op_desc.input_arg_names():`
code clean 7 years ago			`if core.grad_var_suffix() in arg and arg in no_grad_set:`
			`to_insert.append((_create_op_desc_("fill_zeros_like", {`
			`"X": [_strip_grad_suffix_(arg)]`
Bug fix when inserting fill_zeros_like_op. 7 years ago			`}, {"Out": [arg]}, {}), idx))`
code clean 7 years ago
			`map(lambda p: op_descs.insert(p[1], p[0]), reversed(to_insert))`

			`return op_descs`


			`def _append_backward_ops_(target,`
			`block,`
			`target_block,`
			`no_grad_dict,`
			`grad_to_var,`
			`callback=None):`
Add comments for functions in backward.py 7 years ago			`"""`
			`Create all grad ops, and insert them into given block`

			`Args:`
			`target(Variable): the target variable of forward pass`
			`block(Block): the block where forward ops are`
			`target_block(Block): the block which is going to hold new generated grad ops`
Bug fix when inserting fill_zeros_like_op. 7 years ago			`no_grad_dict(dict):`
Add comments for functions in backward.py 7 years ago			`key(int) block index`
			`val(set) a set of varibale names. These varibales have no gradient`
			`grad_to_var(dict)(output argument):`
			`key(str): grad variable name`
			`val(str): corresponding forward variable name`
Support callback 7 years ago			`callback(callable object): a callable object used to decorate new generated grad ops`
Add comments for functions in backward.py 7 years ago			`"""`
update error clip 7 years ago			`if callback is None:`

fix bug 7 years ago			`def empty_callback(block, context):`
update error clip 7 years ago			`pass`

			`callback = empty_callback`
			`elif not hasattr(callback, '__call__'):`
Support callback 7 years ago			`raise ValueError("'callback' must be a callable object.")`
update error clip 7 years ago
update backward doc 7 years ago			`# grad_op_descs holds created grad_op, and will be appended to target_block`
code clean 7 years ago			`grad_op_descs = []`
			`program = block.program`
			`for op in reversed(block.ops):`
			`grad_sub_block_list = []`
			`# If the op has its own sub-block, deal with the sub-block first`
			`if op.has_attr("sub_block"):`
			`sub_block = program.block(op.block_attr("sub_block"))`
			`grad_sub_block = program.create_block(parent_idx=sub_block.idx)`
			`_append_backward_ops_(target, sub_block, grad_sub_block,`
			`no_grad_dict, grad_to_var, callback)`
			`grad_sub_block_list.append(grad_sub_block.desc)`

update backward doc 7 years ago			`# Getting op's corresponding grad_op`
code clean 7 years ago			`grad_op_desc, op_grad_to_var = core.get_grad_op_desc(`
			`op.desc, no_grad_dict[block.idx], grad_sub_block_list)`
Refine parallel_do 7 years ago
code clean 7 years ago			`grad_op_descs.extend(grad_op_desc)`
			`grad_to_var.update(op_grad_to_var)`

			`grad_op_descs = _addup_repetitive_outputs_(grad_op_descs)`

			`grad_op_descs = _remove_no_grad_branch_(grad_op_descs,`
			`no_grad_dict[block.idx])`
pass test_machine_translation.py 7 years ago
update 7 years ago			`if target_block.idx == 0:`
			`grad_op_descs.insert(`
			`0,`
code clean 7 years ago			`_create_op_desc_("fill_constant", {}, {`
			`"Out": [_append_grad_suffix_(target.name)]`
			`}, {"shape": [1],`
			`"value": 1.0,`
			`"dtype": target.dtype}))`
			`# append op_desc in grad_op_descs to target_block`
update 7 years ago			`for op_desc in grad_op_descs:`
Pass test_dyn_rnn.py 7 years ago			`new_op_desc = target_block.desc.append_op()`
			`new_op_desc.copy_from(op_desc)`
update error clip 7 years ago			`callback(block=target_block, context=grad_to_var)`
update 7 years ago
pass test_machine_translation.py 7 years ago
			`def _append_backward_vars_(block, start_op_idx, grad_to_var, grad_info_map):`
Add comments for functions in backward.py 7 years ago			`"""`
			`Create new variables required by backward pass.`

			`Args:`
			`block(Block): the block where new variables will be created`
			`start_op_idx(int): Only variables required by ops in block.ops[start_op_idx : ] will be created`
			`grad_to_var(dict):`
			`key(str): grad variable name`
			`val(str): corresponding forward variable name`
			`In most cases, this dict is generated by _append_backward_ops_()`
			`grad_info_map(dict)(output argument):`
			`key(str): forward variable name`
			`val(tuple): a tuple of (str, int), str is the corresponding grad name, int is the block index`
			`"""`
pass test_machine_translation.py 7 years ago			`for op_idx in range(start_op_idx, block.desc.op_size()):`
			`op_desc = block.desc.op(op_idx)`
			`if op_desc.has_attr("sub_block"):`
			`sub_block = block.program.block(op_desc.block_attr("sub_block"))`
			`_append_backward_vars_(sub_block, 0, grad_to_var, grad_info_map)`
			`new_vars = set()`
			`# create new gradient variables`
			`for grad_var_name in op_desc.output_arg_names():`
			`grad_var_name = grad_var_name.encode("ascii")`
			`if block.desc.has_var_recursive(`
			`grad_var_name) or grad_var_name == core.empty_var_name():`
			`continue`
			`block.desc.var(grad_var_name)`
			`new_vars.add(grad_var_name)`
			`if not grad_to_var.has_key(grad_var_name):`
			`continue`
			`grad_info_map[grad_to_var[grad_var_name]] = (grad_var_name, block)`
			`# infer_shape and infer_type`
			`op_desc.infer_var_type(block.desc)`
			`op_desc.infer_shape(block.desc)`
			`for arg in op_desc.output_arg_names():`
			`if arg in new_vars:`
			`_infer_var_data_type_(arg, block)`
update 7 years ago

update error clip 7 years ago			`def append_backward(loss, parameter_list=None, no_grad_set=None, callback=None):`
Extract apply_backward_pass to backward.py (#5026) * Extract apply_backward_pass to backward.py Rename apply_backward_pass to append_backward_ops * Fix CI * Update design doc 7 years ago			`"""`
update backward doc 7 years ago			`Append backward part to main_program`

			`Args:`
			`loss(Variable): The variable generated by cost function.`
			`parameter_list(list): Parameters that need to be updated by optimizer.`
			`If None, it means all parameters need to be updated.`
Bug fix when inserting fill_zeros_like_op. 7 years ago			`no_grad_set(set): Variables that have no gradients in Block 0.`
			`If None, the set will be generated inside the function and`
update backward doc 7 years ago			contains all variables with `step_gradient=True` from all blocks.

			`Return:`
			`(list[Variable]): list of (parameters, gradients) pair.`
Extract apply_backward_pass to backward.py (#5026) * Extract apply_backward_pass to backward.py Rename apply_backward_pass to append_backward_ops * Fix CI * Update design doc 7 years ago			`"""`
			`assert isinstance(loss, framework.Variable)`
Add stop_gradient in Variable (#5361) 7 years ago
pass test_machine_translation.py 7 years ago			`program = loss.block.program`
fix errors 7 years ago			`no_grad_dict = dict()`
			`if no_grad_set is None:`
Add stop_gradient in Variable (#5361) 7 years ago			`assert isinstance(program, framework.Program)`
			`for block in program.blocks:`
			`assert isinstance(block, framework.Block)`
update 7 years ago			`block_no_grad_set = set()`
Add stop_gradient in Variable (#5361) 7 years ago			`for var in block.vars.itervalues():`
			`assert isinstance(var, framework.Variable)`
			`if var.stop_gradient:`
Add the simple support of no_grad_set 7 years ago			`block_no_grad_set.add(_append_grad_suffix_(var.name))`
code clean 7 years ago			`no_grad_dict[block.idx] = block_no_grad_set`
fix errors 7 years ago			`elif isinstance(no_grad_set, set):`
fix bugs 7 years ago			`no_grad_dict = {`
			`0: set([_append_grad_suffix_(name) for name in no_grad_set])`
			`}`
fix errors 7 years ago			`else:`
			`raise ValueError("'no_grad_set' should be a set or None.")`
Add stop_gradient in Variable (#5361) 7 years ago
update 7 years ago			`grad_info_map = dict()`
pass test_machine_translation.py 7 years ago			`root_block = program.block(0)`
Add the simple support of no_grad_set 7 years ago
pass test_machine_translation.py 7 years ago			`fwd_op_num = root_block.desc.op_size()`
			`current_block_idx = program.current_block_idx`
code clean 7 years ago			`grad_to_var = dict()`

			`_append_backward_ops_(loss, root_block, root_block, no_grad_dict,`
update error clip 7 years ago			`grad_to_var, callback)`
pass test_machine_translation.py 7 years ago			`_append_backward_vars_(root_block, fwd_op_num, grad_to_var, grad_info_map)`
code clean 7 years ago
pass test_machine_translation.py 7 years ago			`program.current_block_idx = current_block_idx`
			`program.sync_with_cpp()`
Add the simple support of no_grad_set 7 years ago
Extract apply_backward_pass to backward.py (#5026) * Extract apply_backward_pass to backward.py Rename apply_backward_pass to append_backward_ops * Fix CI * Update design doc 7 years ago			`if parameter_list is not None:`
			`parameters = parameter_list`
			`else:`
pass test_machine_translation.py 7 years ago			`params = program.global_block().all_parameters()`
Extract apply_backward_pass to backward.py (#5026) * Extract apply_backward_pass to backward.py Rename apply_backward_pass to append_backward_ops * Fix CI * Update design doc 7 years ago			`parameters = [param.name for param in params]`
			`params_and_grads = []`
			`for param in parameters:`
update 7 years ago			`if param not in grad_info_map:`
Extract apply_backward_pass to backward.py (#5026) * Extract apply_backward_pass to backward.py Rename apply_backward_pass to append_backward_ops * Fix CI * Update design doc 7 years ago			`raise ValueError("param %s is not in map" % param)`
update 7 years ago			`grad_info = grad_info_map[param]`
Compelete basic framework 7 years ago			`grad_block = grad_info[1]`
Extract apply_backward_pass to backward.py (#5026) * Extract apply_backward_pass to backward.py Rename apply_backward_pass to append_backward_ops * Fix CI * Update design doc 7 years ago			`if not grad_block.has_var(grad_info[0]):`
			`raise ValueError("grad block[{0}] did not have grad var {1}".format(`
			`grad_info[1], grad_info[0]))`
			`# Get the param var from the global block`
pass test_machine_translation.py 7 years ago			`param_var = program.global_block().var(param)`
Extract apply_backward_pass to backward.py (#5026) * Extract apply_backward_pass to backward.py Rename apply_backward_pass to append_backward_ops * Fix CI * Update design doc 7 years ago			`grad_var = grad_block.var(grad_info[0])`
			`if loss.block.has_var(grad_info[0]):`
			`params_and_grads.append((param_var, grad_var))`
			`else:`
			`params_and_grads.append((param_var, None))`
			`return params_and_grads`