Add input_spec & output_spec for TranslatedLayer (#27284)

* add input_spec & output_spec for translated_layer * update error message
5 years ago · 950301bfa1
parent 18fc927562
commit 950301bfa1
2 changed files with 86 additions and 16 deletions
--- a/python/paddle/fluid/dygraph/io.py
+++ b/python/paddle/fluid/dygraph/io.py
@ -19,6 +19,7 @@ import six
 import pickle
 import numpy as np

+import paddle
 from paddle import compat as cpt
 from paddle.fluid import core
 from paddle.fluid import framework
@ -182,9 +183,9 @@ class _ProgramHolder(object):
        super(_ProgramHolder, self).__init__()

        # input, output, persistable var info
-        self._input_names = []
-        self._persistable_names = []
+        self._input_descs = []
        self._output_descs = []
+        self._persistable_names = []

        # execution scope
        self._inner_scope = core.Scope()
@ -207,11 +208,11 @@ class _ProgramHolder(object):
        return self._train_program_desc

    @property
-    def input_names(self):
-        return self._input_names
+    def input_descs(self):
+        return self._input_descs

    @property
-    def output_decs(self):
+    def output_descs(self):
        return self._output_descs

    @property
@ -233,7 +234,8 @@ class _ProgramHolder(object):
                ops_to_remove.append(i)
                feed_var_name = cpt.to_bytes(op.input('X')[0])
                root_block._remove_var(feed_var_name)
-                self._input_names.append(cpt.to_bytes(op.output('Out')[0]))
+                self._input_descs.append(
+                    root_block.find_var(cpt.to_bytes(op.output('Out')[0])))
            elif op.type() == 'scale' and op.output('Out')[0].startswith(
                    'save_infer_model/scale_'):
                ops_to_remove.append(i)
@ -257,7 +259,7 @@ class _ProgramHolder(object):
            root_block._remove_op(op_idx, op_idx + 1)

        # 2. Input processing, reverse feed vars
-        self._input_names.reverse()
+        self._input_descs.reverse()

        # 3. Output processing, add scale for outputs
        tmp_program = _build_program_by_desc(program_desc)
@ -738,7 +740,7 @@ class TranslatedLayer(layers.Layer):
                if isinstance(value, np.ndarray):
                    var = core.VarBase(
                        value=value,
-                        name=program_holder.input_names[i],
+                        name=program_holder.input_descs[i].name(),
                        persistable=False,
                        place=framework._current_expected_place(),
                        zero_copy=True)
@ -746,7 +748,7 @@ class TranslatedLayer(layers.Layer):
                    var = value
                    # NOTE: we changed var name here, 
                    # but it may be an important name set by user
-                    var.name = program_holder.input_names[i]
+                    var.name = program_holder.input_descs[i].name()
                input_vars.append(var)

            persistable_vars = []
@ -762,7 +764,7 @@ class TranslatedLayer(layers.Layer):
                        % var_name)

            output_vars = []
-            for var_desc in program_holder.output_decs:
+            for var_desc in program_holder.output_descs:
                var = core.VarBase(var_desc.dtype(),
                                   var_desc.shape(),
                                   var_desc.name(), var_desc.type(), False)
@ -913,11 +915,7 @@ class TranslatedLayer(layers.Layer):
                program = translated_layer.program()
        """
        # 1. get program holder
-        program_holder = self._program_holder_dict.get(method_name, None)
-        if program_holder is None:
-            raise ValueError(
-                "The method `%s` is not exists in loaded TranslatedLayer." %
-                method_name)
+        program_holder = self._get_program_holder(method_name)

        # 2. get inference program desc
        program_desc = program_holder.infer_program
@ -925,3 +923,44 @@ class TranslatedLayer(layers.Layer):
        # 3. construct program
        program = _build_program_by_desc(program_desc)
        return program
+
+    def _get_program_holder(self, method_name='forward'):
+        program_holder = self._program_holder_dict.get(method_name, None)
+        if program_holder is None:
+            raise ValueError(
+                "The method `%s` does not exist in loaded TranslatedLayer." %
+                method_name)
+        return program_holder
+
+    def _input_spec(self, method_name='forward'):
+        # 1. get program holder
+        program_holder = self._get_program_holder(method_name)
+
+        # 2. build input spec by input desc
+        input_spec = []
+        for var_desc in program_holder.input_descs:
+            spec = paddle.static.InputSpec(
+                shape=var_desc.shape(),
+                dtype=var_desc.dtype(),
+                name=var_desc.name())
+            input_spec.append(spec)
+
+        return input_spec
+
+    def _output_spec(self, method_name='forward'):
+        # 1. get program holder
+        program_holder = self._get_program_holder(method_name)
+
+        # 2. build output spec by output desc
+        output_spec = []
+        for var_desc in program_holder.output_descs:
+            # NOTE(chenweihang): InputSpec describes a tensor, not just input. 
+            # Maybe the name is not good enough. Here we use InputSpec to 
+            # construct the description of Output tensor
+            spec = paddle.static.InputSpec(
+                shape=var_desc.shape(),
+                dtype=var_desc.dtype(),
+                name=var_desc.name())
+            output_spec.append(spec)
+
+        return output_spec
--- a/python/paddle/fluid/tests/unittests/test_translated_layer.py
+++ b/python/paddle/fluid/tests/unittests/test_translated_layer.py
@ -49,7 +49,10 @@ class LinearNet(nn.Layer):
        super(LinearNet, self).__init__()
        self._linear = nn.Linear(IMAGE_SIZE, CLASS_NUM)

-    @paddle.jit.to_static
+    @paddle.jit.to_static(input_spec=[
+        paddle.static.InputSpec(
+            shape=[None, IMAGE_SIZE], dtype='float32', name='x')
+    ])
    def forward(self, x):
        return self._linear(x)

@ -152,6 +155,34 @@ class TestTranslatedLayer(unittest.TestCase):
        with self.assertRaises(ValueError):
            program = translated_layer.program('not_exists')

+    def test_get_input_spec(self):
+        # load
+        translated_layer = paddle.jit.load(self.model_path)
+
+        expect_spec = [
+            paddle.static.InputSpec(
+                shape=[None, IMAGE_SIZE], dtype='float32', name='x')
+        ]
+        actual_spec = translated_layer._input_spec()
+
+        for spec_x, spec_y in zip(expect_spec, actual_spec):
+            self.assertEqual(spec_x, spec_y)
+
+    def test_get_output_spec(self):
+        # load
+        translated_layer = paddle.jit.load(self.model_path)
+
+        expect_spec = [
+            paddle.static.InputSpec(
+                shape=[None, CLASS_NUM],
+                dtype='float32',
+                name='translated_layer/scale_0.tmp_1')
+        ]
+        actual_spec = translated_layer._output_spec()
+
+        for spec_x, spec_y in zip(expect_spec, actual_spec):
+            self.assertEqual(spec_x, spec_y)
+

 if __name__ == '__main__':
    unittest.main()