Paddle/python/paddle/v2/trainer.py

"""
Module Trainer
"""
import collections
from topology import Topology
from . import event as v2_event
from . import optimizer as v2_optimizer
from . import parameters as v2_parameters

__all__ = ['SGD']


def default_event_handler(event):
    """
    Default event handler. It will print some log and save mode.

    TODO(yuyang18): Complete it!
    :param event:
    :return:
    """
    pass


class SGD(object):
    """
    Simple SGD Trainer.
    SGD Trainer combines data reader, network topolopy and update_equation together
    to train/test a neural network.

    :param cost: Target cost that neural network should be optimized.
    :type cost: paddle.v2.config_base.Layer
    :param parameters: The parameters dictionary.
    :type parameters: paddle.v2.parameters.Parameters
    :param update_equation: The optimizer object.
    :type update_equation: paddle.v2.optimizer.Optimizer
    :param extra_layers: Some layers in the neural network graph are not
                         in the path of cost layer.
    :type extra_layers: paddle.v2.config_base.Layer
    :param is_local: Whether trainning locally
    :type is_local: bool
    :param pserver_spec: comma string for pserver location,
                         eg:127.10.0.10:3000,127.10.0.11:3000,
                         and this parameter is only used for fault
                         tolerant mode cluster training.
    :type pserver_spec: string
    :param use_etcd: Whether using etcd pserver.
    :param use_etcd: bool
    """

    def __init__(self,
                 cost,
                 parameters,
                 update_equation,
                 extra_layers=None,
                 is_local=True,
                 pserver_spec=None,
                 use_etcd=True):

        if not isinstance(parameters, v2_parameters.Parameters):
            raise TypeError('parameters should be parameters')

        if not isinstance(update_equation, v2_optimizer.Optimizer):
            raise TypeError("update equation parameter must be "
                            "paddle.v2.optimizer.Optimizer")
        import py_paddle.swig_paddle as api
        topology = Topology(cost, extra_layers=extra_layers)
        self.__optimizer__ = update_equation
        self.__topology__ = topology
        self.__parameters__ = parameters
        self.__topology_in_proto__ = topology.proto()
        self.__is_local__ = is_local
        self.__pserver_spec__ = pserver_spec
        self.__use_etcd__ = use_etcd

        self.__use_sparse_updater__ = self.__topology__.use_sparse_updater()
        # # In local mode, disable sparse_remote_update.
        if is_local:
            for param in self.__topology_in_proto__.parameters:
                if param.sparse_remote_update:
                    param.sparse_remote_update = False

        self.__gm_create_mode__ = api.CREATE_MODE_NORMAL if not \
            self.__use_sparse_updater__ else api.CREATE_MODE_SGD_SPARSE_CPU_TRAINING
        self.__data_types__ = topology.data_type()
        gm = api.GradientMachine.createFromConfigProto(
            self.__topology_in_proto__, self.__gm_create_mode__,
            self.__optimizer__.enable_types())
        assert isinstance(gm, api.GradientMachine)
        self.__gradient_machine__ = gm
        self.__gradient_machine__.randParameters()
        self.__parameters__.append_gradient_machine(gm)
        self.__parameter_updater__ = None

    def __use_remote_sparse_updater__(self):
        return self.__use_sparse_updater__ and not self.__is_local__

    def __prepare_parameter__(self, in_args):
        """
        prepare parameter before forward backward.
        1. When use remote sparse updater, parameters should be got
        from ps according to input arguments.
        :param in_args: input arguments of this batch.
        :return:
        """
        if self.__use_remote_sparse_updater__():
            self.__gradient_machine__.prefetch(in_args)
            self.__parameter_updater__.getParametersRemote()

    def save_parameter_to_tar(self, f):
        self.__parameter_updater__.catchUpWith()
        self.__parameter_updater__.apply()
        self.__parameter_updater__.getParametersRemote(True, True)
        self.__parameters__.to_tar(f)
        self.__parameter_updater__.restore()

    def train(self, reader, num_passes=1, event_handler=None, feeding=None):
        """
        Training method. Will train num_passes of input data.

        :param reader: A reader that reads and yeilds data items. Usually we use a
                       batched reader to do mini-batch training.
        :type reader: collections.Iterable
        :param num_passes: The total train passes.
        :param event_handler: Event handler. A method will be invoked when event
                              occurred.
        :type event_handler: (BaseEvent) => None
        :param feeding: Feeding is a map of neural network input name and array
                        index that reader returns.
        :type feeding: dict|list
        :return:
        """
        import py_paddle.swig_paddle as api
        from data_feeder import DataFeeder
        if event_handler is None:
            event_handler = default_event_handler
        __check_train_args__(**locals())

        self.__parameter_updater__ = self.__optimizer__.create_updater(
            self.__is_local__, num_passes, self.__use_sparse_updater__,
            self.__pserver_spec__, self.__use_etcd__)
        self.__parameter_updater__.init(self.__gradient_machine__)

        self.__gradient_machine__.start()
        batch_evaluator = self.__gradient_machine__.makeEvaluator()
        assert isinstance(batch_evaluator, api.Evaluator)
        pass_evaluator = self.__gradient_machine__.makeEvaluator()
        assert isinstance(pass_evaluator, api.Evaluator)
        out_args = api.Arguments.createArguments(0)
        feeder = DataFeeder(self.__data_types__, feeding)
        for pass_id in xrange(num_passes):
            event_handler(v2_event.BeginPass(pass_id))
            pass_evaluator.start()
            self.__parameter_updater__.startPass()
            for batch_id, data_batch in enumerate(reader()):
                batch_evaluator.start()
                event_handler(
                    v2_event.BeginIteration(
                        pass_id=pass_id, batch_id=batch_id))
                pass_type = self.__parameter_updater__.startBatch(
                    len(data_batch))
                in_args = feeder(data_batch)
                self.__prepare_parameter__(in_args)
                self.__gradient_machine__.forwardBackward(in_args, out_args,
                                                          pass_type)
                self.__gradient_machine__.eval(pass_evaluator)
                self.__gradient_machine__.eval(batch_evaluator)
                for each_param in self.__gradient_machine__.getNonStaticParameters(
                ):
                    self.__parameter_updater__.update(each_param)
                cost_sum = out_args.sum()
                cost = cost_sum / len(data_batch)
                event_handler(
                    v2_event.EndIteration(
                        pass_id=pass_id,
                        batch_id=batch_id,
                        cost=cost,
                        evaluator=batch_evaluator,
                        gm=self.__gradient_machine__))
                self.__parameter_updater__.finishBatch(cost)
                batch_evaluator.finish()

            self.__parameter_updater__.finishPass()
            pass_evaluator.finish()
            event_handler(
                v2_event.EndPass(
                    pass_id,
                    evaluator=pass_evaluator,
                    gm=self.__gradient_machine__))
        self.__gradient_machine__.finish()

    def test(self, reader, feeding=None):
        """
        Testing method. Will test input data.

        :param reader: A reader that reads and yeilds data items.
        :type reader: collections.Iterable
        :param feeding: Feeding is a map of neural network input name and array
                        index that reader returns.
        :type feeding: dict
        :return:
        """
        import py_paddle.swig_paddle as api
        from data_feeder import DataFeeder
        feeder = DataFeeder(self.__data_types__, feeding)
        evaluator = self.__gradient_machine__.makeEvaluator()
        out_args = api.Arguments.createArguments(0)
        evaluator.start()
        total_cost = 0
        num_samples = 0.0
        for data_batch in reader():
            num_samples += len(data_batch)
            in_args = feeder(data_batch)
            self.__prepare_parameter__(in_args)
            self.__gradient_machine__.forward(in_args, out_args, api.PASS_TEST)
            total_cost += out_args.sum()
            self.__gradient_machine__.eval(evaluator)

        evaluator.finish()
        return v2_event.TestResult(
            evaluator=evaluator, cost=total_cost / num_samples)


def __check_train_args__(reader, event_handler, **kwargs):
    """
    Check train function's argument types
    """
    if not callable(reader) or not isinstance(reader(), collections.Iterator):
        raise TypeError('train_data_reader should be a function, '
                        'which can return a iterator')
    if not callable(event_handler):
        raise TypeError('event handler should be a function')
add doc for some v2/dataset 8 years ago			`"""`
follow comments 8 years ago			`Module Trainer`
add doc for some v2/dataset 8 years ago			`"""`
Draft for new API 8 years ago			`import collections`
refine code 8 years ago			`from topology import Topology`
change topology to layer 8 years ago			`from . import event as v2_event`
Draft for parameters 8 years ago			`from . import optimizer as v2_optimizer`
			`from . import parameters as v2_parameters`

remove ITrainer interface since parameters for train is already getting out of sync. Currently there is no benefit of having a interface. 8 years ago			`__all__ = ['SGD']`
add doc for some v2/dataset 8 years ago
Draft for new API 8 years ago
			`def default_event_handler(event):`
Add comments 8 years ago			`"""`
			`Default event handler. It will print some log and save mode.`

			`TODO(yuyang18): Complete it!`
			`:param event:`
			`:return:`
			`"""`
Draft for new API 8 years ago			`pass`


Complete documentation for v2. 8 years ago			`class SGD(object):`
			`"""`
			`Simple SGD Trainer.`
add v2 run logic doc 8 years ago			`SGD Trainer combines data reader, network topolopy and update_equation together`
			`to train/test a neural network.`
Complete documentation for v2. 8 years ago
			`:param cost: Target cost that neural network should be optimized.`
			`:type cost: paddle.v2.config_base.Layer`
			`:param parameters: The parameters dictionary.`
			`:type parameters: paddle.v2.parameters.Parameters`
Fix document error. 8 years ago			`:param update_equation: The optimizer object.`
			`:type update_equation: paddle.v2.optimizer.Optimizer`
add comments 8 years ago			`:param extra_layers: Some layers in the neural network graph are not`
			`in the path of cost layer.`
			`:type extra_layers: paddle.v2.config_base.Layer`
Fix document error. 8 years ago			`:param is_local: Whether trainning locally`
			`:type is_local: bool`
Modify pserver_spec's doc. 8 years ago			`:param pserver_spec: comma string for pserver location,`
			`eg:127.10.0.10:3000,127.10.0.11:3000,`
			`and this parameter is only used for fault`
			`tolerant mode cluster training.`
Fix document error. 8 years ago			`:type pserver_spec: string`
			`:param use_etcd: Whether using etcd pserver.`
			`:param use_etcd: bool`
Complete documentation for v2. 8 years ago			`"""`
Add comments for functions 8 years ago
fix style probelm 8 years ago			`def __init__(self,`
			`cost,`
			`parameters,`
			`update_equation,`
			`extra_layers=None,`
new parameterupdater use paddle pserver cclient of go 8 years ago			`is_local=True,`
Fault tolerant distributed training, just work version, with etcd (#2849) * using etcd as fault tolerant training * update * workable version, ft not tested * small fix * update * remove TODO 8 years ago			`pserver_spec=None,`
			`use_etcd=True):`
Merge branch 'feature/clean_mnist_v2' into feature/tester 8 years ago
V2.testing complete 8 years ago			`if not isinstance(parameters, v2_parameters.Parameters):`
			`raise TypeError('parameters should be parameters')`

Remove NAG optimizer 8 years ago			`if not isinstance(update_equation, v2_optimizer.Optimizer):`
V2.testing complete 8 years ago			`raise TypeError("update equation parameter must be "`
			`"paddle.v2.optimizer.Optimizer")`
Get OpProtos in Python * PyBind and SWIG of paddle cannot be load in a single Python process, lazy import all SWIG library of Paddle. Otherwise, the glog, gflags are imported twice in a same Python process. * Note that all PyBind11 return C++ std::string as an unicode. For protobuf, it is need be cast to `str` before use them. * Add unit test for Get `OpProtos` 8 years ago			`import py_paddle.swig_paddle as api`
Add extra_layers in paddle.trainer.SGD. 8 years ago			`topology = Topology(cost, extra_layers=extra_layers)`
Draft for new API 8 years ago			`self.__optimizer__ = update_equation`
V2.testing complete 8 years ago			`self.__topology__ = topology`
			`self.__parameters__ = parameters`
Merge branch 'feature/clean_mnist_v2' into feature/tester 8 years ago			`self.__topology_in_proto__ = topology.proto()`
init support remote updater 8 years ago			`self.__is_local__ = is_local`
new parameterupdater use paddle pserver cclient of go 8 years ago			`self.__pserver_spec__ = pserver_spec`
Fault tolerant distributed training, just work version, with etcd (#2849) * using etcd as fault tolerant training * update * workable version, ft not tested * small fix * update * remove TODO 8 years ago			`self.__use_etcd__ = use_etcd`
Disable sparse_remote_update when local in paddle.v2 8 years ago
init support remote updater 8 years ago			`self.__use_sparse_updater__ = self.__topology__.use_sparse_updater()`
			`# # In local mode, disable sparse_remote_update.`
			`if is_local:`
			`for param in self.__topology_in_proto__.parameters:`
			`if param.sparse_remote_update:`
			`param.sparse_remote_update = False`
Disable sparse_remote_update when local in paddle.v2 8 years ago
init support remote updater 8 years ago			`self.__gm_create_mode__ = api.CREATE_MODE_NORMAL if not \`
			`self.__use_sparse_updater__ else api.CREATE_MODE_SGD_SPARSE_CPU_TRAINING`
Make api_train_v2 runnable 8 years ago			`self.__data_types__ = topology.data_type()`
V2.testing complete 8 years ago			`gm = api.GradientMachine.createFromConfigProto(`
init support remote updater 8 years ago			`self.__topology_in_proto__, self.__gm_create_mode__,`
V2.testing complete 8 years ago			`self.__optimizer__.enable_types())`
			`assert isinstance(gm, api.GradientMachine)`
			`self.__gradient_machine__ = gm`
			`self.__gradient_machine__.randParameters()`
refine code 8 years ago			`self.__parameters__.append_gradient_machine(gm)`
add prefetch for trainer.test 8 years ago			`self.__parameter_updater__ = None`

refine code 8 years ago			`def __use_remote_sparse_updater__(self):`
add prefetch for trainer.test 8 years ago			`return self.__use_sparse_updater__ and not self.__is_local__`
V2.testing complete 8 years ago
refine code 8 years ago			`def __prepare_parameter__(self, in_args):`
			`"""`
			`prepare parameter before forward backward.`
			`1. When use remote sparse updater, parameters should be got`
			`from ps according to input arguments.`
			`:param in_args: input arguments of this batch.`
			`:return:`
			`"""`
			`if self.__use_remote_sparse_updater__():`
			`self.__gradient_machine__.prefetch(in_args)`
			`self.__parameter_updater__.getParametersRemote()`

save_parameter_to_tar to fd 8 years ago			`def save_parameter_to_tar(self, f):`
support save parameter in trainer 8 years ago			`self.__parameter_updater__.catchUpWith()`
			`self.__parameter_updater__.apply()`
			`self.__parameter_updater__.getParametersRemote(True, True)`
save_parameter_to_tar to fd 8 years ago			`self.__parameters__.to_tar(f)`
support save parameter in trainer 8 years ago			`self.__parameter_updater__.restore()`
V2.testing complete 8 years ago
Rename reader_dict to feeding * Also fix some other bugs. * Fix #1495 8 years ago			`def train(self, reader, num_passes=1, event_handler=None, feeding=None):`
Add comments for functions 8 years ago			`"""`
			`Training method. Will train num_passes of input data.`

add v2 run logic doc 8 years ago			`:param reader: A reader that reads and yeilds data items. Usually we use a`
			`batched reader to do mini-batch training.`
			`:type reader: collections.Iterable`
Add comments for functions 8 years ago			`:param num_passes: The total train passes.`
			`:param event_handler: Event handler. A method will be invoked when event`
			`occurred.`
			`:type event_handler: (BaseEvent) => None`
Rename reader_dict to feeding * Also fix some other bugs. * Fix #1495 8 years ago			`:param feeding: Feeding is a map of neural network input name and array`
			`index that reader returns.`
Change feeding comments. 8 years ago			`:type feeding: dict\|list`
Add comments for functions 8 years ago			`:return:`
			`"""`
Get OpProtos in Python * PyBind and SWIG of paddle cannot be load in a single Python process, lazy import all SWIG library of Paddle. Otherwise, the glog, gflags are imported twice in a same Python process. * Note that all PyBind11 return C++ std::string as an unicode. For protobuf, it is need be cast to `str` before use them. * Add unit test for Get `OpProtos` 8 years ago			`import py_paddle.swig_paddle as api`
			`from data_feeder import DataFeeder`
Draft for new API 8 years ago			`if event_handler is None:`
			`event_handler = default_event_handler`
			`__check_train_args__(**locals())`

optimizer parameter_updater 8 years ago			`self.__parameter_updater__ = self.__optimizer__.create_updater(`
new parameterupdater use paddle pserver cclient of go 8 years ago			`self.__is_local__, num_passes, self.__use_sparse_updater__,`
Fault tolerant distributed training, just work version, with etcd (#2849) * using etcd as fault tolerant training * update * workable version, ft not tested * small fix * update * remove TODO 8 years ago			`self.__pserver_spec__, self.__use_etcd__)`
optimizer parameter_updater 8 years ago			`self.__parameter_updater__.init(self.__gradient_machine__)`
Draft for new API 8 years ago
V2.testing complete 8 years ago			`self.__gradient_machine__.start()`
			`batch_evaluator = self.__gradient_machine__.makeEvaluator()`
Complete Event, Add Metric to Event. 8 years ago			`assert isinstance(batch_evaluator, api.Evaluator)`
V2.testing complete 8 years ago			`pass_evaluator = self.__gradient_machine__.makeEvaluator()`
Complete Event, Add Metric to Event. 8 years ago			`assert isinstance(pass_evaluator, api.Evaluator)`
Add comments for functions 8 years ago			`out_args = api.Arguments.createArguments(0)`
Rename reader_dict to feeding * Also fix some other bugs. * Fix #1495 8 years ago			`feeder = DataFeeder(self.__data_types__, feeding)`
Draft for new API 8 years ago			`for pass_id in xrange(num_passes):`
Complete Event, Add Metric to Event. 8 years ago			`event_handler(v2_event.BeginPass(pass_id))`
			`pass_evaluator.start()`
optimizer parameter_updater 8 years ago			`self.__parameter_updater__.startPass()`
Follow qq's comments 8 years ago			`for batch_id, data_batch in enumerate(reader()):`
Complete Event, Add Metric to Event. 8 years ago			`batch_evaluator.start()`
			`event_handler(`
			`v2_event.BeginIteration(`
			`pass_id=pass_id, batch_id=batch_id))`
optimizer parameter_updater 8 years ago			`pass_type = self.__parameter_updater__.startBatch(`
			`len(data_batch))`
add prefetch for trainer.test 8 years ago			`in_args = feeder(data_batch)`
refine code 8 years ago			`self.__prepare_parameter__(in_args)`
add prefetch for trainer.test 8 years ago			`self.__gradient_machine__.forwardBackward(in_args, out_args,`
			`pass_type)`
V2.testing complete 8 years ago			`self.__gradient_machine__.eval(pass_evaluator)`
			`self.__gradient_machine__.eval(batch_evaluator)`
Merge conflict with develop branch 8 years ago			`for each_param in self.__gradient_machine__.getNonStaticParameters(`
			`):`
optimizer parameter_updater 8 years ago			`self.__parameter_updater__.update(each_param)`
Refine serialize 8 years ago			`cost_sum = out_args.sum()`
Add testing cost. 8 years ago			`cost = cost_sum / len(data_batch)`
Draft for new API 8 years ago			`event_handler(`
Rearrange event. 8 years ago			`v2_event.EndIteration(`
Complete Event, Add Metric to Event. 8 years ago			`pass_id=pass_id,`
			`batch_id=batch_id,`
			`cost=cost,`
Get output when training (#3978) * get output when training * follow comments 8 years ago			`evaluator=batch_evaluator,`
			`gm=self.__gradient_machine__))`
able to print gradients in event_handler (#3085) 8 years ago			`self.__parameter_updater__.finishBatch(cost)`
			`batch_evaluator.finish()`
Draft for new API 8 years ago
optimizer parameter_updater 8 years ago			`self.__parameter_updater__.finishPass()`
Complete Event, Add Metric to Event. 8 years ago			`pass_evaluator.finish()`
Get output when training (#3978) * get output when training * follow comments 8 years ago			`event_handler(`
			`v2_event.EndPass(`
			`pass_id,`
			`evaluator=pass_evaluator,`
			`gm=self.__gradient_machine__))`
V2.testing complete 8 years ago			`self.__gradient_machine__.finish()`

Rename reader_dict to feeding * Also fix some other bugs. * Fix #1495 8 years ago			`def test(self, reader, feeding=None):`
add v2 run logic doc 8 years ago			`"""`
			`Testing method. Will test input data.`

			`:param reader: A reader that reads and yeilds data items.`
Add Sqrt and Reciprocal activation 8 years ago			`:type reader: collections.Iterable`
add v2 run logic doc 8 years ago			`:param feeding: Feeding is a map of neural network input name and array`
			`index that reader returns.`
			`:type feeding: dict`
			`:return:`
			`"""`
Get OpProtos in Python * PyBind and SWIG of paddle cannot be load in a single Python process, lazy import all SWIG library of Paddle. Otherwise, the glog, gflags are imported twice in a same Python process. * Note that all PyBind11 return C++ std::string as an unicode. For protobuf, it is need be cast to `str` before use them. * Add unit test for Get `OpProtos` 8 years ago			`import py_paddle.swig_paddle as api`
			`from data_feeder import DataFeeder`
Rename reader_dict to feeding * Also fix some other bugs. * Fix #1495 8 years ago			`feeder = DataFeeder(self.__data_types__, feeding)`
V2.testing complete 8 years ago			`evaluator = self.__gradient_machine__.makeEvaluator()`
			`out_args = api.Arguments.createArguments(0)`
			`evaluator.start()`
Add testing cost. 8 years ago			`total_cost = 0`
			`num_samples = 0.0`
V2.testing complete 8 years ago			`for data_batch in reader():`
Add testing cost. 8 years ago			`num_samples += len(data_batch)`
add prefetch for trainer.test 8 years ago			`in_args = feeder(data_batch)`
refine code 8 years ago			`self.__prepare_parameter__(in_args)`
add prefetch for trainer.test 8 years ago			`self.__gradient_machine__.forward(in_args, out_args, api.PASS_TEST)`
Refine serialize 8 years ago			`total_cost += out_args.sum()`
V2.testing complete 8 years ago			`self.__gradient_machine__.eval(evaluator)`
Draft for new API 8 years ago
V2.testing complete 8 years ago			`evaluator.finish()`
Add testing cost. 8 years ago			`return v2_event.TestResult(`
			`evaluator=evaluator, cost=total_cost / num_samples)`
V2.testing complete 8 years ago

			`def __check_train_args__(reader, event_handler, **kwargs):`
Add comments for functions 8 years ago			`"""`
			`Check train function's argument types`
			`"""`
Follow qq's comments 8 years ago			`if not callable(reader) or not isinstance(reader(), collections.Iterator):`
Rise type error because of python. 8 years ago			`raise TypeError('train_data_reader should be a function, '`
			`'which can return a iterator')`
Draft for new API 8 years ago			`if not callable(event_handler):`
Rise type error because of python. 8 years ago			`raise TypeError('event handler should be a function')`