Paddle/python/paddle/v2/layer.py

# Copyright (c) 2016 PaddlePaddle Authors. All Rights Reserved
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.
"""
`paddle.v2.layer` is a part of model config packages in paddle.v2. In API v2,
we want to make Paddle a plain Python package. The model config package defines
the way how to configure a neural network topology in Paddle Python code.

The primary usage shows below.

..  code-block:: python

    import paddle.v2 as paddle

    img = paddle.layer.data(name='img', type=paddle.data_type.dense_vector(784))
    hidden = paddle.layer.fc(input=img, size=200)
    prediction = paddle.layer.fc(input=hidden, size=10,
                                 act=paddle.activation.Softmax())

    # use prediction instance where needed.
    parameters = paddle.parameters.create(cost)
"""
import collections
import copy
import re
import paddle.trainer_config_helpers.layers as v1_layers
import paddle.trainer.config_parser as cp
from paddle.proto.ModelConfig_pb2 import ModelConfig, SubModelConfig
from config_base import __convert_to_v2__
import config_base

__all__ = ['data', 'parse_network']


def __need_to_keep__(name):
    return name in [
        'StaticInput', 'SubsequenceInput', 'GeneratedInput', 'LayerType',
        'layer_support'
    ]


def __need_to_wrap__(name):
    return name not in ['AggregateLevel', 'ExpandLevel']


def __convert_name__(inname):
    if __need_to_keep__(inname):
        return inname
    if inname == 'maxid_layer':
        return 'max_id'
    elif inname.endswith('memory') or inname.endswith(
            '_seq') or inname.endswith('_sim') or inname == 'hsigmoid':
        return inname
    elif inname in [
            'cross_entropy', 'multi_binary_label_cross_entropy',
            'cross_entropy_with_selfnorm'
    ]:
        return inname + "_cost"
    elif inname.endswith('_cost'):
        return inname
    elif inname.endswith("_layer"):
        return inname[:-len("_layer")]
    else:
        return inname


for name in v1_layers.__all__:
    obj = getattr(v1_layers, name)
    new_name = __convert_name__(name)
    if callable(obj) and __need_to_wrap__(name):
        globals()[new_name] = __convert_to_v2__(obj, new_name, __name__)
    else:
        globals()[new_name] = obj
    __all__.append(new_name)


def __data_layer__(name, type, **kwargs):
    l = v1_layers.data_layer(name, type.dim, **kwargs)
    l.data_type = type
    return l


def __map_data_docstr__(doc):
    doc = re.sub(r'(data = [^\)]+)\).*',
                 "data = paddle.layer.data(name=\"input\", "
                 "type=paddle.data_type.dense_vector(1000))", doc)

    doc = re.sub(r':param size:.*', ':param type: Data type of this data layer',
                 doc)
    doc = re.sub(r':type size:.*', ":type size: paddle.v2.data_type.InputType",
                 doc)
    return doc


__data_layer__.__doc__ = __map_data_docstr__(v1_layers.data_layer.__doc__)

data = __convert_to_v2__(__data_layer__, 'name', __name__)


def __get_used_layers__(output_layers):
    layer_names = set()
    parents = {}

    def add_parent(child, parent):
        if child in parents:
            parents[child].append(parent)
        else:
            parents[child] = [parent]

    def add_additional_parents():
        for sub_model in cp.g_config.model_config.sub_models:
            if sub_model.name == 'root':
                continue
            for link in sub_model.in_links:
                add_parent(link.link_name, link.layer_name)
                add_parent(sub_model.name, link.layer_name)
            for link in sub_model.out_links:
                add_parent(link.link_name, link.layer_name)
                add_parent(link.link_name, sub_model.name)
            for mem in sub_model.memories:
                if mem.boot_layer_name:
                    add_parent(mem.layer_name, mem.boot_layer_name)
                add_parent(mem.link_name, mem.layer_name)

    def dfs_travel(layer_name):
        if layer_name in layer_names:
            return
        layer_names.add(layer_name)
        layer = cp.g_layer_map[layer_name]

        for inp in layer.inputs:
            dfs_travel(inp.input_layer_name)
        if layer.name in parents:
            for p in parents[layer.name]:
                dfs_travel(p)

    add_additional_parents()

    for layer in output_layers:
        dfs_travel(layer.full_name)

    return layer_names


def __get_used_parameters__(layer_names, sub_models):
    parameter_names = set()
    for name in layer_names:
        l = cp.g_layer_map[name]
        for inp in l.inputs:
            if inp.input_parameter_name:
                parameter_names.add(inp.input_parameter_name)
        if l.bias_parameter_name:
            parameter_names.add(l.bias_parameter_name)

    for sub_model in sub_models:
        for mem in sub_model.memories:
            if mem.HasField("boot_bias_parameter_name"):
                parameter_names.add(mem.boot_bias_parameter_name)

    return parameter_names


def __get_used_submodels__(layer_names):
    submodel_names = set()
    for submodel in cp.g_config.model_config.sub_models:
        if submodel.name in layer_names:
            submodel_names.add(submodel.name)
            if submodel.is_recurrent_layer_group:
                layer_names |= set(submodel.layer_names)
    return submodel_names


def __get_used_evaluators__(layer_names):
    evaluator_names = set()
    for e in cp.g_config.model_config.evaluators:
        used = True
        for name in e.input_layers:
            if name not in layer_names:
                used = False
                break
        if used:
            evaluator_names.add(e.name)
    return evaluator_names


def __trim_submodel__(old_submodel, layer_names, input_layer_names,
                      output_layer_names, evaluator_names):

    submodel = SubModelConfig()
    submodel.name = old_submodel.name
    submodel.layer_names.extend(
        filter(lambda x: x in layer_names, old_submodel.layer_names))
    submodel.input_layer_names.extend(
        filter(lambda x: x in input_layer_names, submodel.layer_names))
    submodel.output_layer_names.extend(
        filter(lambda x: x in output_layer_names, submodel.layer_names))
    submodel.evaluator_names.extend(
        filter(lambda x: x in evaluator_names, old_submodel.evaluator_names))

    submodel.is_recurrent_layer_group = old_submodel.is_recurrent_layer_group
    submodel.reversed = old_submodel.reversed

    submodel.memories.extend(
        filter(lambda x: x.link_name in layer_names, old_submodel.memories))
    target_inlinkid = (old_submodel.target_inlinkid
                       if old_submodel.HasField('target_inlinkid') else -1)
    in_links = []
    for i, link in enumerate(old_submodel.in_links):
        if link.link_name in layer_names or i == target_inlinkid:
            in_links.append(link)
            if i == target_inlinkid:
                target_inlinkid = len(in_links) - 1
    submodel.in_links.extend(in_links)

    submodel.out_links.extend(
        filter(lambda x: x.link_name in layer_names, old_submodel.out_links))
    if old_submodel.HasField('generator'):
        submodel.generator.CopyFrom(old_submodel.generator)

    if old_submodel.HasField('target_inlinkid'):
        submodel.target_inlinkid = target_inlinkid
    return submodel


def parse_network(output_layers, extra_layers=None):
    if not isinstance(output_layers, collections.Sequence):
        output_layers = [output_layers]
    if extra_layers is not None and not isinstance(extra_layers,
                                                   collections.Sequence):
        extra_layers = [extra_layers]
    else:
        extra_layers = []

    layer_names = __get_used_layers__(output_layers + extra_layers)
    submodel_names = __get_used_submodels__(layer_names)
    submodel_names.add('root')
    evaluator_names = __get_used_evaluators__(layer_names)
    input_layer_names = set()
    output_layer_names = set()

    model_config = ModelConfig()
    model_config.type = cp.g_config.model_config.type

    for layer in output_layers:
        model_config.output_layer_names.append(layer.full_name)
        output_layer_names.add(layer.full_name)

    for l in cp.g_config.model_config.layers:
        if l.name not in layer_names:
            continue
        model_config.layers.extend([l])
        if l.type == 'data':
            if l.name in model_config.output_layer_names:
                continue
            model_config.input_layer_names.append(l.name)
            input_layer_names.add(l.name)

    for e in cp.g_config.model_config.evaluators:
        if e.name in evaluator_names:
            model_config.evaluators.extend([e])

    for s in cp.g_config.model_config.sub_models:
        if s.name in submodel_names:
            s = __trim_submodel__(s, layer_names, input_layer_names,
                                  output_layer_names, evaluator_names)
            model_config.sub_models.extend([s])

    parameter_names = __get_used_parameters__(layer_names,
                                              model_config.sub_models)

    for p in cp.g_config.model_config.parameters:
        if p.name in parameter_names:
            model_config.parameters.extend([p])

    return model_config


def get_layer(name):
    return config_base.__layer_map__.get(name)


cp.begin_parse()
add v2-layers 8 years ago			`# Copyright (c) 2016 PaddlePaddle Authors. All Rights Reserved`
			`#`
			`# Licensed under the Apache License, Version 2.0 (the "License");`
			`# you may not use this file except in compliance with the License.`
			`# You may obtain a copy of the License at`
			`#`
			`# http://www.apache.org/licenses/LICENSE-2.0`
			`#`
			`# Unless required by applicable law or agreed to in writing, software`
			`# distributed under the License is distributed on an "AS IS" BASIS,`
			`# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.`
			`# See the License for the specific language governing permissions and`
			`# limitations under the License.`
add v2 activation, add comment for v2 layer 8 years ago			`"""`
auto deployment paddle documentation * Change build process to generate v2 documentation * Add directory for v2 api * Correct sphinx index soft-link 8 years ago			`paddle.v2.layer` is a part of model config packages in paddle.v2. In API v2,
add missing configuration functions in v2 API. 8 years ago			`we want to make Paddle a plain Python package. The model config package defines`
auto deployment paddle documentation * Change build process to generate v2 documentation * Add directory for v2 api * Correct sphinx index soft-link 8 years ago			`the way how to configure a neural network topology in Paddle Python code.`
add v2 activation, add comment for v2 layer 8 years ago
auto deployment paddle documentation * Change build process to generate v2 documentation * Add directory for v2 api * Correct sphinx index soft-link 8 years ago			`The primary usage shows below.`
add v2 activation, add comment for v2 layer 8 years ago
auto deployment paddle documentation * Change build process to generate v2 documentation * Add directory for v2 api * Correct sphinx index soft-link 8 years ago			`.. code-block:: python`
add v2 activation, add comment for v2 layer 8 years ago
auto deployment paddle documentation * Change build process to generate v2 documentation * Add directory for v2 api * Correct sphinx index soft-link 8 years ago			`import paddle.v2 as paddle`
add v2 activation, add comment for v2 layer 8 years ago
auto deployment paddle documentation * Change build process to generate v2 documentation * Add directory for v2 api * Correct sphinx index soft-link 8 years ago			`img = paddle.layer.data(name='img', type=paddle.data_type.dense_vector(784))`
			`hidden = paddle.layer.fc(input=img, size=200)`
			`prediction = paddle.layer.fc(input=hidden, size=10,`
			`act=paddle.activation.Softmax())`
add v2 activation, add comment for v2 layer 8 years ago
auto deployment paddle documentation * Change build process to generate v2 documentation * Add directory for v2 api * Correct sphinx index soft-link 8 years ago			`# use prediction instance where needed.`
Follow comments 8 years ago			`parameters = paddle.parameters.create(cost)`
add v2 activation, add comment for v2 layer 8 years ago			`"""`
optimize code 8 years ago			`import collections`
Fix V2 API 8 years ago			`import copy`
Add docs and clean up unused code 8 years ago			`import re`
Fix V2 API 8 years ago			`import paddle.trainer_config_helpers.layers as v1_layers`
			`import paddle.trainer.config_parser as cp`
			`from paddle.proto.ModelConfig_pb2 import ModelConfig, SubModelConfig`
Add docs and clean up unused code 8 years ago			`from config_base import __convert_to_v2__`
			`import config_base`
use v2.layer in api_train_v2 8 years ago
Fix V2 API 8 years ago			`__all__ = ['data', 'parse_network']`
change layers to layer 8 years ago
Fix style 8 years ago
Fix V2 API 8 years ago			`def __need_to_keep__(name):`
add missing configuration functions in v2 API. 8 years ago			`return name in [`
			`'StaticInput', 'SubsequenceInput', 'GeneratedInput', 'LayerType',`
			`'layer_support'`
			`]`
change layers to layer 8 years ago

Fix V2 API 8 years ago			`def __need_to_wrap__(name):`
			`return name not in ['AggregateLevel', 'ExpandLevel']`
add type to datalayer 8 years ago

Fix V2 API 8 years ago			`def __convert_name__(inname):`
add missing configuration functions in v2 API. 8 years ago			`if __need_to_keep__(inname):`
			`return inname`
Fix V2 API 8 years ago			`if inname == 'maxid_layer':`
Simplify layer.v2 8 years ago			`return 'max_id'`
			`elif inname.endswith('memory') or inname.endswith(`
			`'_seq') or inname.endswith('_sim') or inname == 'hsigmoid':`
			`return inname`
			`elif inname in [`
			`'cross_entropy', 'multi_binary_label_cross_entropy',`
			`'cross_entropy_with_selfnorm'`
			`]:`
			`return inname + "_cost"`
			`elif inname.endswith('_cost'):`
			`return inname`
			`elif inname.endswith("_layer"):`
			`return inname[:-len("_layer")]`
Fix V2 API 8 years ago			`else:`
			`return inname`
Simplify layer.v2 8 years ago

Fix V2 API 8 years ago			`for name in v1_layers.__all__:`
			`obj = getattr(v1_layers, name)`
			`new_name = __convert_name__(name)`
			`if callable(obj) and __need_to_wrap__(name):`
Add docs and clean up unused code 8 years ago			`globals()[new_name] = __convert_to_v2__(obj, new_name, __name__)`
support calculate size 8 years ago			`else:`
Fix V2 API 8 years ago			`globals()[new_name] = obj`
			`__all__.append(new_name)`


			`def __data_layer__(name, type, **kwargs):`
			`l = v1_layers.data_layer(name, type.dim, **kwargs)`
			`l.data_type = type`
			`return l`
refine code, remove beam_search.py 8 years ago
Fix style 8 years ago
Add docs and clean up unused code 8 years ago			`def __map_data_docstr__(doc):`
			`doc = re.sub(r'(data = [^\)]+)\).*',`
			`"data = paddle.layer.data(name=\"input\", "`
			`"type=paddle.data_type.dense_vector(1000))", doc)`

			`doc = re.sub(r':param size:.*', ':param type: Data type of this data layer',`
			`doc)`
			`doc = re.sub(r':type size:.*', ":type size: paddle.v2.data_type.InputType",`
			`doc)`
			`return doc`


			`__data_layer__.__doc__ = __map_data_docstr__(v1_layers.data_layer.__doc__)`
refine code, remove beam_search.py 8 years ago
Add docs and clean up unused code 8 years ago			`data = __convert_to_v2__(__data_layer__, 'name', __name__)`
refine code, remove beam_search.py 8 years ago

add missing configuration functions in v2 API. 8 years ago			`def __get_used_layers__(output_layers):`
Fix V2 API 8 years ago			`layer_names = set()`
			`parents = {}`
Fix style 8 years ago
Fix V2 API 8 years ago			`def add_parent(child, parent):`
			`if child in parents:`
			`parents[child].append(parent)`
			`else:`
			`parents[child] = [parent]`

			`def add_additional_parents():`
			`for sub_model in cp.g_config.model_config.sub_models:`
			`if sub_model.name == 'root':`
			`continue`
			`for link in sub_model.in_links:`
			`add_parent(link.link_name, link.layer_name)`
			`add_parent(sub_model.name, link.layer_name)`
			`for link in sub_model.out_links:`
			`add_parent(link.link_name, link.layer_name)`
			`add_parent(link.link_name, sub_model.name)`
			`for mem in sub_model.memories:`
			`if mem.boot_layer_name:`
			`add_parent(mem.layer_name, mem.boot_layer_name)`
			`add_parent(mem.link_name, mem.layer_name)`

			`def dfs_travel(layer_name):`
			`if layer_name in layer_names:`
			`return`
			`layer_names.add(layer_name)`
			`layer = cp.g_layer_map[layer_name]`

			`for inp in layer.inputs:`
			`dfs_travel(inp.input_layer_name)`
			`if layer.name in parents:`
			`for p in parents[layer.name]:`
			`dfs_travel(p)`

			`add_additional_parents()`

			`for layer in output_layers:`
			`dfs_travel(layer.full_name)`

			`return layer_names`


Fix handling of boot_bias_layer for recurrent_group in v2 API 8 years ago			`def __get_used_parameters__(layer_names, sub_models):`
Fix V2 API 8 years ago			`parameter_names = set()`
			`for name in layer_names:`
			`l = cp.g_layer_map[name]`
			`for inp in l.inputs:`
			`if inp.input_parameter_name:`
			`parameter_names.add(inp.input_parameter_name)`
			`if l.bias_parameter_name:`
			`parameter_names.add(l.bias_parameter_name)`
Fix handling of boot_bias_layer for recurrent_group in v2 API 8 years ago
			`for sub_model in sub_models:`
			`for mem in sub_model.memories:`
			`if mem.HasField("boot_bias_parameter_name"):`
			`parameter_names.add(mem.boot_bias_parameter_name)`

Fix V2 API 8 years ago			`return parameter_names`


			`def __get_used_submodels__(layer_names):`
			`submodel_names = set()`
			`for submodel in cp.g_config.model_config.sub_models:`
			`if submodel.name in layer_names:`
			`submodel_names.add(submodel.name)`
add missing configuration functions in v2 API. 8 years ago			`if submodel.is_recurrent_layer_group:`
			`layer_names \|= set(submodel.layer_names)`
Fix V2 API 8 years ago			`return submodel_names`


			`def __get_used_evaluators__(layer_names):`
			`evaluator_names = set()`
			`for e in cp.g_config.model_config.evaluators:`
			`used = True`
			`for name in e.input_layers:`
			`if name not in layer_names:`
			`used = False`
			`break`
			`if used:`
			`evaluator_names.add(e.name)`
			`return evaluator_names`


Fix style 8 years ago			`def __trim_submodel__(old_submodel, layer_names, input_layer_names,`
			`output_layer_names, evaluator_names):`
Fix V2 API 8 years ago
			`submodel = SubModelConfig()`
			`submodel.name = old_submodel.name`
Fix style 8 years ago			`submodel.layer_names.extend(`
			`filter(lambda x: x in layer_names, old_submodel.layer_names))`
			`submodel.input_layer_names.extend(`
			`filter(lambda x: x in input_layer_names, submodel.layer_names))`
			`submodel.output_layer_names.extend(`
			`filter(lambda x: x in output_layer_names, submodel.layer_names))`
			`submodel.evaluator_names.extend(`
			`filter(lambda x: x in evaluator_names, old_submodel.evaluator_names))`
Fix V2 API 8 years ago
			`submodel.is_recurrent_layer_group = old_submodel.is_recurrent_layer_group`
			`submodel.reversed = old_submodel.reversed`

Fix style 8 years ago			`submodel.memories.extend(`
			`filter(lambda x: x.link_name in layer_names, old_submodel.memories))`
Fix V2 API 8 years ago			`target_inlinkid = (old_submodel.target_inlinkid`
			`if old_submodel.HasField('target_inlinkid') else -1)`
			`in_links = []`
			`for i, link in enumerate(old_submodel.in_links):`
			`if link.link_name in layer_names or i == target_inlinkid:`
			`in_links.append(link)`
			`if i == target_inlinkid:`
			`target_inlinkid = len(in_links) - 1`
			`submodel.in_links.extend(in_links)`

Fix style 8 years ago			`submodel.out_links.extend(`
			`filter(lambda x: x.link_name in layer_names, old_submodel.out_links))`
Fix V2 API 8 years ago			`if old_submodel.HasField('generator'):`
			`submodel.generator.CopyFrom(old_submodel.generator)`

			`if old_submodel.HasField('target_inlinkid'):`
			`submodel.target_inlinkid = target_inlinkid`
			`return submodel`
refine code, remove beam_search.py 8 years ago

Fix V2 API 8 years ago			`def parse_network(output_layers, extra_layers=None):`
			`if not isinstance(output_layers, collections.Sequence):`
			`output_layers = [output_layers]`
			`if extra_layers is not None and not isinstance(extra_layers,`
			`collections.Sequence):`
			`extra_layers = [extra_layers]`
			`else:`
			`extra_layers = []`
refine code, remove beam_search.py 8 years ago
Fix V2 API 8 years ago			`layer_names = __get_used_layers__(output_layers + extra_layers)`
			`submodel_names = __get_used_submodels__(layer_names)`
			`submodel_names.add('root')`
			`evaluator_names = __get_used_evaluators__(layer_names)`
			`input_layer_names = set()`
			`output_layer_names = set()`
refine code, remove beam_search.py 8 years ago
Fix V2 API 8 years ago			`model_config = ModelConfig()`
			`model_config.type = cp.g_config.model_config.type`
add missing configuration functions in v2 API. 8 years ago
			`for layer in output_layers:`
			`model_config.output_layer_names.append(layer.full_name)`
			`output_layer_names.add(layer.full_name)`

Fix V2 API 8 years ago			`for l in cp.g_config.model_config.layers:`
			`if l.name not in layer_names:`
			`continue`
			`model_config.layers.extend([l])`
			`if l.type == 'data':`
add missing configuration functions in v2 API. 8 years ago			`if l.name in model_config.output_layer_names:`
			`continue`
Fix V2 API 8 years ago			`model_config.input_layer_names.append(l.name)`
			`input_layer_names.add(l.name)`
refine code, remove beam_search.py 8 years ago
Fix V2 API 8 years ago			`for e in cp.g_config.model_config.evaluators:`
			`if e.name in evaluator_names:`
			`model_config.evaluators.extend([e])`
refine code, remove beam_search.py 8 years ago
Fix V2 API 8 years ago			`for s in cp.g_config.model_config.sub_models:`
			`if s.name in submodel_names:`
Fix style 8 years ago			`s = __trim_submodel__(s, layer_names, input_layer_names,`
			`output_layer_names, evaluator_names)`
Fix V2 API 8 years ago			`model_config.sub_models.extend([s])`
add missing doc of v2 api 8 years ago
Fix handling of boot_bias_layer for recurrent_group in v2 API 8 years ago			`parameter_names = __get_used_parameters__(layer_names,`
			`model_config.sub_models)`

			`for p in cp.g_config.model_config.parameters:`
			`if p.name in parameter_names:`
			`model_config.parameters.extend([p])`

Fix V2 API 8 years ago			`return model_config`
Complete Layers documentation 8 years ago

Fix V2 API 8 years ago			`def get_layer(name):`
Add docs and clean up unused code 8 years ago			`return config_base.__layer_map__.get(name)`
Complete Layers documentation 8 years ago

Fix V2 API 8 years ago			`cp.begin_parse()`