Merge branch 'develop' of github.com:baidu/Paddle into feature/complete_variable_bind

8 years ago · 83dbc15055
parent 569616b329 a281b38393
commit 83dbc15055
49 changed files with 2424 additions and 57 deletions
--- a/paddle/framework/backward.cc
+++ b/paddle/framework/backward.cc
@ -302,7 +302,7 @@ std::vector<std::unique_ptr<OpDescBind>> MakeOpGrad(
    return grad_op_descs;  // empty vector
  }
-  grad_op_descs = OpRegistry::CreateGradOpDescs(*op_desc);
+  grad_op_descs = OpRegistry::CreateGradOpDescs(op_desc.get());
  std::list<std::unique_ptr<OpDescBind>> pending_fill_zeros_ops;
  for (auto& desc : grad_op_descs) {
--- a/paddle/framework/backward_test.cc
+++ b/paddle/framework/backward_test.cc
@ -58,6 +58,8 @@ class MulOpMaker : public OpProtoAndCheckerMaker {
    AddInput("X", "A");
    AddInput("Y", "B");
    AddOutput("Out", "Out");
    AddAttr<int>("x_num_col_dims", "").SetDefault(1).EqualGreaterThan(1);
    AddAttr<int>("y_num_col_dims", "").SetDefault(1).EqualGreaterThan(1);
    AddComment("Mul");
  }
 };
@ -440,6 +442,28 @@ TEST(Backward, simple_single_op) {
            std::vector<std::string>({f::GradVarName("b")}));
 }
 TEST(Backward, default_attribute) {
  f::ProgramDesc *program_desc = GetNewProgramDesc();
  f::ProgramDescBind &program = f::ProgramDescBind::Instance(program_desc);
  f::BlockDescBind *block = program.Block(0);
  f::OpDescBind *op = block->AppendOp();
  op->SetType("mul");
  op->SetInput("X", {"x"});
  op->SetInput("Y", {"y"});
  op->SetOutput("Out", {"out"});
  AppendBackward(program, {});
  ASSERT_EQ(block->AllOps().size(), 2UL);
  EXPECT_EQ(boost::get<int>(op->GetAttr("x_num_col_dims")), 1);
  EXPECT_EQ(boost::get<int>(op->GetAttr("y_num_col_dims")), 1);
  f::OpDescBind *grad_op = block->AllOps()[1];
  ASSERT_EQ(grad_op->Type(), "mul_grad");
  EXPECT_EQ(boost::get<int>(grad_op->GetAttr("x_num_col_dims")), 1);
  EXPECT_EQ(boost::get<int>(grad_op->GetAttr("y_num_col_dims")), 1);
 }
 TEST(Backward, simple_mult_op) {
  f::ProgramDesc *program_desc = GetNewProgramDesc();
  f::ProgramDescBind &program = f::ProgramDescBind::Instance(program_desc);
--- a/paddle/framework/block_desc.h
+++ b/paddle/framework/block_desc.h
@ -15,6 +15,7 @@ limitations under the License. */
 #pragma once
 #include <deque>
 #include <memory>
 #include <unordered_map>
 #include <vector>
 #include "paddle/framework/op_desc.h"
--- a/paddle/framework/data_type.h
+++ b/paddle/framework/data_type.h
@ -28,7 +28,6 @@ inline DataType ToDataType(std::type_index type) {
    return DataType::INT32;
  } else {
    PADDLE_THROW("Not supported");
    return static_cast<DataType>(-1);
  }
 }
--- a/paddle/framework/framework.proto
+++ b/paddle/framework/framework.proto
@ -13,6 +13,7 @@ See the License for the specific language governing permissions and
 limitations under the License. */
 syntax = "proto2";
 option optimize_for = LITE_RUNTIME;
 package paddle.framework;
 enum AttrType {
--- a/paddle/framework/op_desc.cc
+++ b/paddle/framework/op_desc.cc
@ -25,6 +25,7 @@ OpDescBind::OpDescBind(const std::string &type, const VariableNameMap &inputs,
  inputs_ = inputs;
  outputs_ = outputs;
  attrs_ = attrs;
  need_update_ = true;
 }
 OpDesc *OpDescBind::Proto() {
--- a/paddle/framework/op_desc.h
+++ b/paddle/framework/op_desc.h
@ -52,8 +52,6 @@ class OpDescBind {
  void SetOutput(const std::string &param_name,
                 const std::vector<std::string> &args);
  std::string DebugString() { return this->Proto()->DebugString(); }
  bool HasAttr(const std::string &name) const {
    return attrs_.find(name) != attrs_.end();
  }
@ -97,6 +95,11 @@ class OpDescBind {
  const VariableNameMap &Outputs() const { return outputs_; }
  AttributeMap *MutableAttrMap() {
    this->need_update_ = true;
    return &this->attrs_;
  }
 private:
  template <typename MapType>
  static std::vector<typename MapType::key_type> MapKeys(const MapType &map) {
--- a/paddle/framework/op_registry.cc
+++ b/paddle/framework/op_registry.cc
@ -60,9 +60,14 @@ std::unique_ptr<OperatorBase> OpRegistry::CreateOp(const OpDescBind& op_desc) {
 }
 std::vector<std::unique_ptr<OpDescBind>> OpRegistry::CreateGradOpDescs(
-    const OpDescBind& op_desc) {
+    OpDescBind* op_desc) {
-  auto& info = OpInfoMap::Instance().Get(op_desc.Type());
+  auto& info = OpInfoMap::Instance().Get(op_desc->Type());
-  return info.grad_op_maker_(op_desc);
+
  if (info.Checker() != nullptr) {
    info.Checker()->Check(*op_desc->MutableAttrMap());
  }
  return info.grad_op_maker_(*op_desc);
 }
 }  // namespace framework
--- a/paddle/framework/op_registry.h
+++ b/paddle/framework/op_registry.h
@ -80,7 +80,7 @@ class OpRegistry {
  static std::unique_ptr<OperatorBase> CreateOp(const OpDesc& op_desc);
  static std::vector<std::unique_ptr<OpDescBind>> CreateGradOpDescs(
-      const OpDescBind& op_desc);
+      OpDescBind* op_desc);
  static std::unique_ptr<OperatorBase> CreateOp(const OpDescBind& op_desc);
 };
--- a/paddle/framework/program_desc.h
+++ b/paddle/framework/program_desc.h
@ -14,6 +14,7 @@ limitations under the License. */
 #pragma once
 #include <memory>
 #include <vector>
 #include "paddle/framework/framework.pb.h"
 #include "paddle/platform/macros.h"
@ -31,8 +32,6 @@ class ProgramDescBind {
  BlockDescBind *Block(size_t idx) { return blocks_[idx].get(); }
  std::string DebugString() { return Proto()->DebugString(); }
  size_t Size() const { return blocks_.size(); }
  ProgramDesc *Proto();
--- a/paddle/framework/tensor.h
+++ b/paddle/framework/tensor.h
@ -95,6 +95,19 @@ class Tensor {
  template <typename T>
  inline void CopyFrom(const Tensor& src, const platform::Place& dst_place);
  /**
   * @brief   Copy the content of an external vector to a tensor.
   *
   * @param[in] src   The external vector.
   * @param[in] ctx   The device context contains place where to store.
   *
   * * @note    CopyFromVector assumes that the tensor has been resized
   *            before invoking.
   */
  template <typename T>
  inline void CopyFromVector(const std::vector<T>& src,
                             const platform::Place& dst_place);
  /**
   * @brief   Return the slice of the tensor.
   *
--- a/paddle/framework/tensor_impl.h
+++ b/paddle/framework/tensor_impl.h
@ -123,6 +123,29 @@ inline void Tensor::CopyFrom(const Tensor& src,
 #endif
 }
 template <typename T>
 inline void Tensor::CopyFromVector(const std::vector<T>& src,
                                   const platform::Place& dst_place) {
  auto src_ptr = static_cast<const void*>(src.data());
  platform::CPUPlace src_place;
  auto dst_ptr = static_cast<void*>(mutable_data<T>(dst_place));
  auto size = src.size() * sizeof(T);
  if (platform::is_cpu_place(dst_place)) {
    memory::Copy(boost::get<platform::CPUPlace>(dst_place), dst_ptr, src_place,
                 src_ptr, size);
  }
 #ifdef PADDLE_WITH_CUDA
  else if (platform::is_gpu_place(dst_place)) {
    memory::Copy(boost::get<platform::GPUPlace>(dst_place), dst_ptr, src_place,
                 src_ptr, size, 0);
  }
  PADDLE_ENFORCE(cudaStreamSynchronize(0),
                 "cudaStreamSynchronize failed in Tensor CopyFromVector");
 #endif
 }
 template <typename T>
 inline Tensor Tensor::Slice(const int& begin_idx, const int& end_idx) const {
  check_memory_size<T>();
--- a/paddle/framework/tensor_test.cc
+++ b/paddle/framework/tensor_test.cc
@ -263,6 +263,93 @@ TEST(Tensor, CopyFrom) {
 #endif
 }
 TEST(Tensor, CopyFromVector) {
  using namespace paddle::framework;
  using namespace paddle::platform;
  {
    std::vector<int> src_vec = {1, 2, 3, 4, 5, 6, 7, 8, 9};
    Tensor cpu_tensor;
    // Copy to CPU Tensor
    cpu_tensor.Resize(make_ddim({3, 3}));
    auto cpu_place = new paddle::platform::CPUPlace();
    cpu_tensor.CopyFromVector<int>(src_vec, *cpu_place);
    // Compare Tensors
    const int* cpu_ptr = cpu_tensor.data<int>();
    const int* src_ptr = src_vec.data();
    ASSERT_NE(src_ptr, cpu_ptr);
    for (size_t i = 0; i < 9; ++i) {
      EXPECT_EQ(src_ptr[i], cpu_ptr[i]);
    }
    src_vec.erase(src_vec.begin(), src_vec.begin() + 5);
    cpu_tensor.Resize(make_ddim({2, 2}));
    cpu_tensor.CopyFromVector<int>(src_vec, *cpu_place);
    cpu_ptr = cpu_tensor.data<int>();
    src_ptr = src_vec.data();
    ASSERT_NE(src_ptr, cpu_ptr);
    for (size_t i = 0; i < 5; ++i) {
      EXPECT_EQ(src_ptr[i], cpu_ptr[i]);
    }
    delete cpu_place;
  }
 #ifdef PADDLE_WITH_CUDA
  {
    std::vector<int> src_vec = {1, 2, 3, 4, 5, 6, 7, 8, 9};
    Tensor cpu_tensor;
    Tensor gpu_tensor;
    Tensor dst_tensor;
    // Copy to CPU Tensor
    cpu_tensor.Resize(make_ddim({3, 3}));
    auto cpu_place = new paddle::platform::CPUPlace();
    cpu_tensor.CopyFromVector<int>(src_vec, *cpu_place);
    // Copy to GPUTensor
    gpu_tensor.Resize(make_ddim({3, 3}));
    auto gpu_place = new paddle::platform::GPUPlace();
    gpu_tensor.CopyFromVector<int>(src_vec, *gpu_place);
    // Copy from GPU to CPU tensor for comparison
    dst_tensor.CopyFrom<int>(gpu_tensor, *cpu_place);
    // Compare Tensors
    const int* src_ptr = src_vec.data();
    const int* cpu_ptr = cpu_tensor.data<int>();
    const int* dst_ptr = dst_tensor.data<int>();
    ASSERT_NE(src_ptr, cpu_ptr);
    ASSERT_NE(src_ptr, dst_ptr);
    for (size_t i = 0; i < 9; ++i) {
      EXPECT_EQ(src_ptr[i], cpu_ptr[i]);
      EXPECT_EQ(src_ptr[i], dst_ptr[i]);
    }
    src_vec.erase(src_vec.begin(), src_vec.begin() + 5);
    cpu_tensor.Resize(make_ddim({2, 2}));
    cpu_tensor.CopyFromVector<int>(src_vec, *cpu_place);
    gpu_tensor.Resize(make_ddim({2, 2}));
    gpu_tensor.CopyFromVector<int>(src_vec, *gpu_place);
    dst_tensor.CopyFrom<int>(gpu_tensor, *cpu_place);
    src_ptr = src_vec.data();
    cpu_ptr = cpu_tensor.data<int>();
    dst_ptr = dst_tensor.data<int>();
    ASSERT_NE(src_ptr, cpu_ptr);
    ASSERT_NE(src_ptr, dst_ptr);
    for (size_t i = 0; i < 5; ++i) {
      EXPECT_EQ(src_ptr[i], cpu_ptr[i]);
      EXPECT_EQ(src_ptr[i], dst_ptr[i]);
    }
    delete cpu_place;
    delete gpu_place;
  }
 #endif
 }
 TEST(Tensor, ReshapeToMatrix) {
  using namespace paddle::framework;
  using namespace paddle::platform;
--- a/paddle/framework/type_defs.h
+++ b/paddle/framework/type_defs.h
@ -15,6 +15,7 @@
 #pragma once
 #include <functional>
 #include <map>
 #include <memory>
 #include "paddle/platform/variant.h"
 namespace paddle {
--- a/paddle/math/tests/test_GpuProfiler.cpp
+++ b/paddle/math/tests/test_GpuProfiler.cpp
@ -162,4 +162,4 @@ int main(int argc, char** argv) {
  return RUN_ALL_TESTS();
 }
-#endif /* PADDLE_ONLY_CPU */
+#endif
--- a/paddle/memory/detail/buddy_allocator.cc
+++ b/paddle/memory/detail/buddy_allocator.cc
@ -182,7 +182,7 @@ BuddyAllocator::PoolSet::iterator BuddyAllocator::RefillPool() {
      max_chunk_size_ = platform::GpuMaxChunkSize();
    }
  }
-#endif  // PADDLE_ONLY_CPU
+#endif
  // Allocate a new maximum sized block
  size_t index = 0;
--- a/paddle/memory/detail/system_allocator.cc
+++ b/paddle/memory/detail/system_allocator.cc
@ -134,7 +134,7 @@ void GPUAllocator::Free(void* p, size_t size, size_t index) {
 bool GPUAllocator::UseGpu() const { return true; }
-#endif  // PADDLE_ONLY_CPU
+#endif
 }  // namespace detail
 }  // namespace memory
--- a/paddle/memory/detail/system_allocator.h
+++ b/paddle/memory/detail/system_allocator.h
@ -51,7 +51,7 @@ class GPUAllocator : public SystemAllocator {
  size_t gpu_alloc_size_ = 0;
  size_t fallback_alloc_size_ = 0;
 };
-#endif  // PADDLE_ONLY_CPU
+#endif
 }  // namespace detail
 }  // namespace memory
--- a/paddle/memory/detail/system_allocator_test.cc
+++ b/paddle/memory/detail/system_allocator_test.cc
@ -62,4 +62,4 @@ TEST(GPUAllocator, Alloc) {
  TestAllocator(a, 2048);
  TestAllocator(a, 0);
 }
-#endif  // PADDLE_ONLY_CPU
+#endif
--- a/paddle/memory/memcpy.cc
+++ b/paddle/memory/memcpy.cc
@ -89,7 +89,7 @@ void Copy<platform::GPUPlace, platform::GPUPlace>(platform::GPUPlace dst_place,
  platform::GpuMemcpySync(dst, src, num, cudaMemcpyDeviceToDevice);
 }
-#endif  // PADDLE_ONLY_CPU
+#endif
 }  // namespace memory
 }  // namespace paddle
--- a/paddle/memory/memcpy.h
+++ b/paddle/memory/memcpy.h
@ -53,7 +53,7 @@ template <typename DstPlace, typename SrcPlace>
 void Copy(DstPlace, void* dst, SrcPlace, const void* src, size_t num,
          cudaStream_t stream);
-#endif  // PADDLE_ONLY_CPU
+#endif
 }  // namespace memory
 }  // namespace paddle
--- a/paddle/memory/memory.cc
+++ b/paddle/memory/memory.cc
@ -111,7 +111,7 @@ size_t Used<platform::GPUPlace>(platform::GPUPlace place) {
  return GetGPUBuddyAllocator(place.device)->Used();
 }
-#endif  // PADDLE_ONLY_CPU
+#endif
 }  // namespace memory
 }  // namespace paddle
--- a/paddle/memory/memory_test.cc
+++ b/paddle/memory/memory_test.cc
@ -135,4 +135,4 @@ TEST(BuddyAllocator, GPUMultAlloc) {
  }
 }
-#endif  // PADDLE_ONLY_CPU
+#endif
--- a/paddle/operators/CMakeLists.txt
+++ b/paddle/operators/CMakeLists.txt
@ -55,12 +55,20 @@ function(op_library TARGET)
        set(pybind_flag 1)
    endif()
    # pool_op contains several operators
    if ("${TARGET}" STREQUAL "pool_op")
        set(pybind_flag 1)
        # It's enough to just adding one operator to pybind
        file(APPEND ${pybind_file} "USE_OP(pool2d);\n")
    endif()
    # pool_with_index_op contains several operators
    if ("${TARGET}" STREQUAL "pool_with_index_op")
        set(pybind_flag 1)
        # It's enough to just adding one operator to pybind
        file(APPEND ${pybind_file} "USE_OP(max_pool2d_with_index);\n")
    endif()
    # activation_op contains several operators
    if ("${TARGET}" STREQUAL "activation_op")
        set(pybind_flag 1)
--- a/paddle/operators/activation_op.cc
+++ b/paddle/operators/activation_op.cc
@ -201,6 +201,27 @@ class SoftReluOpMaker : public framework::OpProtoAndCheckerMaker {
  }
 };
 template <typename AttrType>
 class ELUOpMaker : public framework::OpProtoAndCheckerMaker {
 public:
  ELUOpMaker(framework::OpProto *proto, framework::OpAttrChecker *op_checker)
      : OpProtoAndCheckerMaker(proto, op_checker) {
    AddInput("X",
             "(Tensor) The input of ELU operator, it shouldn't be empty. Input "
             "is flattened and treated as a 1D array.");
    AddOutput("Y",
              "(Tensor) The output of ELU operator. It has the same shape as "
              "the input.");
    AddAttr<AttrType>(
        "alpha", "(float, default 1.0) Alpha value in the elu formulation.")
        .SetDefault(static_cast<AttrType>(1.));
    AddComment(R"DOC(
        ELU activation operator. It applies this element-wise computation on
        the input: f(x) = max(0, x) + min(0, alpha * (exp(x) - 1)).
        Check .. _Link: https://arxiv.org/abs/1511.07289 for more details.)DOC");
  }
 };
 template <typename AttrType>
 class Relu6OpMaker : public framework::OpProtoAndCheckerMaker {
 public:
@ -289,6 +310,9 @@ REGISTER_OP(leaky_relu, ops::ActivationOp, ops::LeakyReluOpMaker<float>,
 REGISTER_OP(soft_relu, ops::ActivationOp, ops::SoftReluOpMaker<float>,
            soft_relu_grad, ops::ActivationOpGrad);
 REGISTER_OP(elu, ops::ActivationOp, ops::ELUOpMaker<float>, elu_grad,
            ops::ActivationOpGrad);
 REGISTER_OP(relu6, ops::ActivationOp, ops::Relu6OpMaker<float>, relu6_grad,
            ops::ActivationOpGrad);
--- a/Show More
+++ b/Show More