From 82801f24e5e314579b963ace057d80c949379b23 Mon Sep 17 00:00:00 2001
From: caoying03 <caoying03@baidu.com>
Date: Mon, 10 Jul 2017 10:06:50 +0800
Subject: [PATCH 01/36] save log probabilty for every generated words.

---
 .../RecurrentGradientMachine.cpp              | 26 ++++++++++++++-----
 .../RecurrentGradientMachine.h                | 12 +++++++--
 2 files changed, 29 insertions(+), 9 deletions(-)
diff --git a/paddle/gserver/gradientmachines/RecurrentGradientMachine.cpp b/paddle/gserver/gradientmachines/RecurrentGradientMachine.cpp
index 9a972466d6..41e0929959 100644
--- a/paddle/gserver/gradientmachines/RecurrentGradientMachine.cpp
+++ b/paddle/gserver/gradientmachines/RecurrentGradientMachine.cpp
@@ -967,8 +967,9 @@ void RecurrentGradientMachine::generateSequence() {
   size_t numSequences = getGenBatchSize();
 
   resizeBootFrame(numSequences);
-  // We create only two sub-network in generation for alternate use.
-  // Thus, we can reduce total memory of output_ in layer forward.
+  // We create only two sub-network in generation, one stores states of all
+  // layers in previous time step and the other storing the states at current
+  // time step.
   resizeOrCreateFrames(2);
 
   // outFrameLines_.size() > 1UL
@@ -1001,10 +1002,9 @@ void RecurrentGradientMachine::generateSequence() {
 
   // init outArg
   size_t resultNum = generator_.config.num_results_per_sample();
-  IVector::resizeOrCreate(
-      generator_.outArg.ids,
-      generator_.config.max_num_frames() * numSequences * resultNum,
-      false);
+  size_t maxGenWordCount =
+      generator_.config.max_num_frames() * numSequences * resultNum;
+  IVector::resizeOrCreate(generator_.outArg.ids, maxGenWordCount, false);
   if (resultNum > 1) {
     CHECK_LE(resultNum, static_cast<size_t>(generator_.config.beam_size()));
     Matrix::resizeOrCreate(generator_.outArg.in,
@@ -1012,6 +1012,11 @@ void RecurrentGradientMachine::generateSequence() {
                            /* width */ resultNum,
                            false,
                            /* useGpu */ false);
+    Matrix::resizeOrCreate(generator_.outArg.value,
+                           /* height */ maxGenWordCount,
+                           /* width */ 1,
+                           false,
+                           /* useGpu */ false);
   }
   ICpuGpuVector::resizeOrCreate(generator_.outArg.sequenceStartPositions,
                                 numSequences + 1,
@@ -1313,13 +1318,20 @@ void RecurrentGradientMachine::fillGenOutputs() {
   starts[0] = 0;
   if (numResults > 1) {
     real* probs = generator_.outArg.in->getData();
+    real* idsProb = generator_.outArg.value->getData();
+    size_t curPos = 0;
     for (size_t i = 0; i < finalPaths_.size(); ++i) {
       for (size_t j = 0; j < finalPaths_[i].size(); ++j) {
         Path& path = finalPaths_[i][j];
-        generator_.ids.push_back(path.ids.size());  // sequence size
+        size_t genLen = path.ids.size();
+        generator_.ids.push_back(genLen);  // sequence size
         generator_.ids.insert(
             generator_.ids.end(), path.ids.begin(), path.ids.end());
         generator_.ids.push_back(-1);  // end of sequence
+
+        memcpy(idsProb + curPos, path.idsProb.data(), sizeof(real) * genLen);
+        curPos += genLen;
+        idsProb[curPos++] = -1.0;
         probs[i * numResults + j] = path.logProb;
 
         if (!j && dataArgsSize_) {
diff --git a/paddle/gserver/gradientmachines/RecurrentGradientMachine.h b/paddle/gserver/gradientmachines/RecurrentGradientMachine.h
index f245620cf6..fb3fc5877a 100644
--- a/paddle/gserver/gradientmachines/RecurrentGradientMachine.h
+++ b/paddle/gserver/gradientmachines/RecurrentGradientMachine.h
@@ -189,6 +189,11 @@ public:
      */
     std::vector<int> ids;
 
+    /**
+     * @brief idsProb, log probability of each generated words.
+     */
+    std::vector<real> idsProb;
+
     /**
      * @brief logProb, current probability of path.
      */
@@ -228,11 +233,13 @@ public:
      */
     Path(Path& old, int newId, real logProb, int machineId, int topIndex)
         : ids(old.ids),
+          idsProb(old.idsProb),
           logProb(old.logProb + logProb),
           machineId(machineId),
           topIndex(topIndex),
           seqId(old.seqId) {
       ids.push_back(newId);
+      idsProb.push_back(logProb);
       if (!old.probHistory.empty()) {
         this->probHistory = old.probHistory;
         // probHistory store current prob, not sum
@@ -411,8 +418,9 @@ protected:
 
   struct Generator {
     GeneratorConfig config;
-    std::vector<int> ids;  // store generated sequences
-    Argument outArg;       // final output argument
+    std::vector<int> ids;       // store generated sequences
+    std::vector<real> idsProb;  // log probability of each generated word
+    Argument outArg;            // final output argument
   };
   bool generating_;
   Generator generator_;

From 7c42aad412e634c7e8853d170c3f516fc3e6b2bf Mon Sep 17 00:00:00 2001
From: Yu Yang <yuyang18@baidu.com>
Date: Wed, 2 Aug 2017 16:07:51 +0800
Subject: [PATCH 02/36] Initialize Gradient Checker

Add get_numeric_gradient API and its unittest.
---
 paddle/pybind/pybind.cc                       | 10 ++-
 .../paddle/v2/framework/tests/CMakeLists.txt  |  3 +-
 .../v2/framework/tests/gradient_checker.py    | 69 +++++++++++++++++++
 3 files changed, 79 insertions(+), 3 deletions(-)
 create mode 100644 python/paddle/v2/framework/tests/gradient_checker.py

diff --git a/paddle/pybind/pybind.cc b/paddle/pybind/pybind.cc
index ee5f675e25..e79ad49b6d 100644
--- a/paddle/pybind/pybind.cc
+++ b/paddle/pybind/pybind.cc
@@ -77,8 +77,14 @@ PYBIND11_PLUGIN(core) {
            })
       .def("set", paddle::pybind::PyTensorSetFromArray<float>)
       .def("set", paddle::pybind::PyTensorSetFromArray<int>)
-      .def("shape",
-           [](pd::Tensor& self) { return pd::vectorize(self.dims()); });
+      .def("shape", [](pd::Tensor& self) { return pd::vectorize(self.dims()); })
+      .def("set_float_element",
+           [](pd::Tensor& self, size_t offset, float f) {
+             self.data<float>()[offset] = f;
+           })
+      .def("get_float_element", [](pd::Tensor& self, size_t offset) -> float {
+        return self.data<float>()[offset];
+      });
 
   py::class_<pd::Variable>(m, "Variable", R"DOC(Variable Class.
 
diff --git a/python/paddle/v2/framework/tests/CMakeLists.txt b/python/paddle/v2/framework/tests/CMakeLists.txt
index cdaaa60674..494c517a9b 100644
--- a/python/paddle/v2/framework/tests/CMakeLists.txt
+++ b/python/paddle/v2/framework/tests/CMakeLists.txt
@@ -13,4 +13,5 @@ add_python_test(test_framework
     test_sigmoid_op.py
     test_softmax_op.py
     test_rowwise_add_op.py
-    test_network.py)
+    test_network.py
+    gradient_checker.py)
diff --git a/python/paddle/v2/framework/tests/gradient_checker.py b/python/paddle/v2/framework/tests/gradient_checker.py
new file mode 100644
index 0000000000..d7e5de8252
--- /dev/null
+++ b/python/paddle/v2/framework/tests/gradient_checker.py
@@ -0,0 +1,69 @@
+import paddle.v2.framework.core as core
+from paddle.v2.framework.create_op_creation_methods import op_creations
+import numpy
+import unittest
+
+
+def get_numeric_gradient(op,
+                         input_values,
+                         output_name,
+                         input_to_check,
+                         delta=1e-5,
+                         local_scope=None):
+    if local_scope is None:
+        local_scope = core.Scope()
+    for var_name in input_values:
+        var = local_scope.new_var(var_name)
+        tensor = var.get_tensor()
+        tensor.set_dims(input_values[var_name].shape)
+        tensor.alloc_float()
+        tensor.set(input_values[var_name])
+
+    for output in op.outputs():
+        local_scope.new_var(output).get_tensor()
+
+    op.infer_shape(local_scope)
+
+    for output in op.outputs():
+        local_scope.find_var(output).get_tensor().alloc_float()
+
+    cpu_ctx = core.DeviceContext.cpu_context()
+
+    def get_output():
+        op.run(local_scope, cpu_ctx)
+        return numpy.array(local_scope.find_var(output_name).get_tensor()).sum()
+
+    def product(dim):
+        return reduce(lambda a, b: a * b, dim, 1)
+
+    tensor_to_check = local_scope.find_var(input_to_check).get_tensor()
+    tensor_size = product(tensor_to_check.get_dims())
+    gradient_flat = numpy.zeros(shape=(tensor_size, ), dtype='float32')
+    for i in xrange(tensor_size):
+        origin = tensor_to_check.get_float_element(i)
+        x_pos = origin + delta
+        tensor_to_check.set_float_element(i, x_pos)
+        y_pos = get_output()
+
+        x_neg = origin - delta
+        tensor_to_check.set_float_element(i, x_neg)
+        y_neg = get_output()
+
+        tensor_to_check.set_float_element(i, origin)  # restore old value
+        gradient_flat[i] = (y_pos - y_neg) / delta / 2
+    return gradient_flat.reshape(tensor_to_check.get_dims())
+
+
+if __name__ == '__main__':
+
+    class GetNumericGradientTest(unittest.TestCase):
+        def test_add_op(self):
+            add_op = op_creations.add_two(X="X", Y="Y", Out="Z")
+            x = numpy.random.random((10, 1)).astype("float32")
+            y = numpy.random.random((10, 1)).astype("float32")
+
+            arr = get_numeric_gradient(add_op, {'X': x, "Y": y}, 'Z', 'X')
+
+            self.assertAlmostEqual(arr.mean(), 1.0, delta=1e-2)
+
+    unittest.main()

From fcc28ccea220ab2be166ea824dca3504dd3fc2c6 Mon Sep 17 00:00:00 2001
From: Yu Yang <yuyang18@baidu.com>
Date: Wed, 2 Aug 2017 16:18:59 +0800
Subject: [PATCH 03/36] Add comments

---
 .../v2/framework/tests/gradient_checker.py    | 22 ++++++++++++++++++-
 1 file changed, 21 insertions(+), 1 deletion(-)

diff --git a/python/paddle/v2/framework/tests/gradient_checker.py b/python/paddle/v2/framework/tests/gradient_checker.py
index d7e5de8252..e7fca05d6f 100644
--- a/python/paddle/v2/framework/tests/gradient_checker.py
+++ b/python/paddle/v2/framework/tests/gradient_checker.py
@@ -10,8 +10,24 @@ def get_numeric_gradient(op,
                          input_to_check,
                          delta=1e-5,
                          local_scope=None):
+    """
+    Get Numeric Gradient for an operator's input.
+    
+    :param op: C++ operator instance, could be an network 
+    :param input_values: The input variables. Should be an dictionary, key is 
+    variable name. Value is numpy array.
+    :param output_name: The final output variable name. 
+    :param input_to_check: The input variable need to get gradient.
+    :param delta: The perturbation value for numeric gradient method. The 
+    smaller delta is, the more accurate result will get. But if that delta is
+     too small, it could occur numerical stability problem.
+    :param local_scope: The local scope used for get_numeric_gradient.
+    :return: The gradient array in numpy format.
+    """
     if local_scope is None:
         local_scope = core.Scope()
+
+    # Create all input variable in local_scope
     for var_name in input_values:
         var = local_scope.new_var(var_name)
         tensor = var.get_tensor()
@@ -19,14 +35,18 @@ def get_numeric_gradient(op,
         tensor.alloc_float()
         tensor.set(input_values[var_name])
 
+    # Create all output variable in local_scope
     for output in op.outputs():
-        local_scope.new_var(output).get_tensor()
+        if local_scope.find_var(output) is None:
+            local_scope.new_var(output).get_tensor()
 
     op.infer_shape(local_scope)
 
+    # allocate output memory
     for output in op.outputs():
         local_scope.find_var(output).get_tensor().alloc_float()
 
+    # TODO(yuyang18): Only CPU is support now.
     cpu_ctx = core.DeviceContext.cpu_context()
 
     def get_output():

From a0590004ceae3fb769a87b55e03833523451a34a Mon Sep 17 00:00:00 2001
From: Yu Yang <yuyang18@baidu.com>
Date: Wed, 2 Aug 2017 16:28:41 +0800
Subject: [PATCH 04/36] Add __all__ in `gradient_checker.py`

---
 python/paddle/v2/framework/tests/gradient_checker.py | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/python/paddle/v2/framework/tests/gradient_checker.py b/python/paddle/v2/framework/tests/gradient_checker.py
index e7fca05d6f..0ee7e8fb49 100644
--- a/python/paddle/v2/framework/tests/gradient_checker.py
+++ b/python/paddle/v2/framework/tests/gradient_checker.py
@@ -3,6 +3,8 @@ from paddle.v2.framework.create_op_creation_methods import op_creations
 import numpy
 import unittest
 
+__all__ = ['get_numeric_gradient']
+
 
 def get_numeric_gradient(op,
                          input_values,

From a404d9abb4e57b9c903ad98becca45b43d7d92d6 Mon Sep 17 00:00:00 2001
From: Yu Yang <yuyang18@baidu.com>
Date: Wed, 2 Aug 2017 17:43:17 +0800
Subject: [PATCH 05/36] Add todo comments

---
 paddle/pybind/pybind.cc | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/paddle/pybind/pybind.cc b/paddle/pybind/pybind.cc
index fa76da67f2..dc6f29d026 100644
--- a/paddle/pybind/pybind.cc
+++ b/paddle/pybind/pybind.cc
@@ -81,9 +81,11 @@ PYBIND11_PLUGIN(core) {
       .def("shape", [](pd::Tensor& self) { return pd::vectorize(self.dims()); })
       .def("set_float_element",
            [](pd::Tensor& self, size_t offset, float f) {
+             // TODO(yuyang18): Only support GPU now.
              self.data<float>()[offset] = f;
            })
       .def("get_float_element", [](pd::Tensor& self, size_t offset) -> float {
+        // TODO(yuyang18): Only support GPU now.
         return self.data<float>()[offset];
       });
 

From a560aee3180ea7ecea8af24c5bf9632b52023dd5 Mon Sep 17 00:00:00 2001
From: Yu Yang <yuyang18@baidu.com>
Date: Thu, 3 Aug 2017 12:55:19 +0800
Subject: [PATCH 06/36] Fix code style

---
 paddle/math/BaseMatrix.cu | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/paddle/math/BaseMatrix.cu b/paddle/math/BaseMatrix.cu
index 6db5965789..344cad496a 100644
--- a/paddle/math/BaseMatrix.cu
+++ b/paddle/math/BaseMatrix.cu
@@ -442,7 +442,8 @@ DEFINE_MATRIX_UNARY_PARAMETER_OP(Clip, TWO_PARAMETER,
 template<class T>
 void BaseMatrixT<T>::clip(T p1, T p2) { applyUnary(unary::Clip<T>(p1, p2)); }
 
-DEFINE_MATRIX_BINARY_PARAMETER_OP(ClipDerivative, TWO_PARAMETER, a = b < p1 ? 0 : (b > p2 ? 0 : 1));
+DEFINE_MATRIX_BINARY_PARAMETER_OP(ClipDerivative, TWO_PARAMETER,
+		a = b < p1 ? 0 : (b > p2 ? 0 : 1));
 template<class T>
 void BaseMatrixT<T>::clipDerivative(BaseMatrixT& b, T p1, T p2) {
   applyBinary(binary::ClipDerivative<T>(p1, p2), b);

From 8544bdbb4986081e392c831ea784b3134a86bac1 Mon Sep 17 00:00:00 2001
From: Yu Yang <yuyang18@baidu.com>
Date: Thu, 3 Aug 2017 12:56:26 +0800
Subject: [PATCH 07/36] `clang-format` for BaseMatrix.cu

---
 paddle/math/BaseMatrix.cu | 985 ++++++++++++++++++++++++--------------
 1 file changed, 619 insertions(+), 366 deletions(-)

diff --git a/paddle/math/BaseMatrix.cu b/paddle/math/BaseMatrix.cu
index 344cad496a..5435808fb7 100644
--- a/paddle/math/BaseMatrix.cu
+++ b/paddle/math/BaseMatrix.cu
@@ -12,21 +12,21 @@ WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 See the License for the specific language governing permissions and
 limitations under the License. */
 
-#include <cmath>
-#include <string.h>
 #include <paddle/utils/Logging.h>
+#include <string.h>
+#include <cmath>
 #include "BaseMatrix.h"
-#include "hl_matrix_ops.cuh"
-#include "hl_matrix_base.cuh"
-#include "hl_matrix_apply.cuh"
-#include "SIMDFunctions.h"
 #include "MathFunctions.h"
+#include "SIMDFunctions.h"
+#include "hl_matrix_apply.cuh"
+#include "hl_matrix_base.cuh"
+#include "hl_matrix_ops.cuh"
 
 namespace paddle {
 
 const char* SPARSE_SUPPORT_ERROR = "Sparse Matrix/Vector is not supported.";
 
-template<class T>
+template <class T>
 template <class Op>
 int BaseMatrixT<T>::applyUnary(Op op) {
   MatrixOffset offset(0, 0);
@@ -34,9 +34,11 @@ int BaseMatrixT<T>::applyUnary(Op op) {
   return 0;
 }
 
-template<class T>
+template <class T>
 template <class Op>
-int BaseMatrixT<T>::applyUnary(Op op, int numRows, int numCols,
+int BaseMatrixT<T>::applyUnary(Op op,
+                               int numRows,
+                               int numCols,
                                MatrixOffset& offset) {
   CHECK(!this->isSparse()) << SPARSE_SUPPORT_ERROR;
   int dimM = numRows;
@@ -56,7 +58,7 @@ int BaseMatrixT<T>::applyUnary(Op op, int numRows, int numCols,
   return 0;
 }
 
-template<class T>
+template <class T>
 template <class Op>
 int BaseMatrixT<T>::applyBinary(Op op, BaseMatrixT& b) {
   CHECK(height_ == b.height_ && width_ == b.width_)
@@ -67,18 +69,23 @@ int BaseMatrixT<T>::applyBinary(Op op, BaseMatrixT& b) {
   return 0;
 }
 
-template<class T>
+template <class T>
 template <class Op>
-int BaseMatrixT<T>::applyBinary(Op op, BaseMatrixT& b, int numRows, int numCols,
-                                MatrixOffset& offset) {
+int BaseMatrixT<T>::applyBinary(
+    Op op, BaseMatrixT& b, int numRows, int numCols, MatrixOffset& offset) {
   applyBinary(op, b, numRows, numCols, offset, false_type(), false_type());
   return 0;
 }
 
-template<class T>
+template <class T>
 template <class Op, class bAsRowVector, class bAsColVector>
-int BaseMatrixT<T>::applyBinary(Op op, BaseMatrixT& b, int numRows, int numCols,
-                            MatrixOffset& offset, bAsRowVector, bAsColVector) {
+int BaseMatrixT<T>::applyBinary(Op op,
+                                BaseMatrixT& b,
+                                int numRows,
+                                int numCols,
+                                MatrixOffset& offset,
+                                bAsRowVector,
+                                bAsColVector) {
   CHECK(!this->isSparse()) << SPARSE_SUPPORT_ERROR;
   CHECK(!b.isSparse()) << SPARSE_SUPPORT_ERROR;
   CHECK(useGpu_ == b.useGpu_) << "Matrix type mismatch";
@@ -91,8 +98,8 @@ int BaseMatrixT<T>::applyBinary(Op op, BaseMatrixT& b, int numRows, int numCols,
   T* A = data_;
   T* B = b.data_;
   CAL_MATRIX_START_ADDRESS(A, height_, width_, lda, offset.aCol_, offset.aRow_);
-  CAL_MATRIX_START_ADDRESS(B, b.height_, b.width_, ldb, offset.bCol_,
-                           offset.bRow_);
+  CAL_MATRIX_START_ADDRESS(
+      B, b.height_, b.width_, ldb, offset.bCol_, offset.bRow_);
   CHECK_LE(dimM + offset.aRow_, this->height_);
   CHECK_LE(dimN + offset.aCol_, this->width_);
   if (!bAsRowVector::value && !bAsColVector::value) {
@@ -115,7 +122,7 @@ int BaseMatrixT<T>::applyBinary(Op op, BaseMatrixT& b, int numRows, int numCols,
   return 0;
 }
 
-template<class T>
+template <class T>
 template <class Op>
 int BaseMatrixT<T>::applyTernary(Op op, BaseMatrixT& b, BaseMatrixT& c) {
   CHECK_EQ(height_, b.height_);
@@ -129,21 +136,29 @@ int BaseMatrixT<T>::applyTernary(Op op, BaseMatrixT& b, BaseMatrixT& c) {
   return 0;
 }
 
-template<class T>
+template <class T>
 template <class Op>
-int BaseMatrixT<T>::applyTernary(Op op, BaseMatrixT& b, BaseMatrixT& c,
-                                 int numRows, int numCols,
+int BaseMatrixT<T>::applyTernary(Op op,
+                                 BaseMatrixT& b,
+                                 BaseMatrixT& c,
+                                 int numRows,
+                                 int numCols,
                                  MatrixOffset& offset) {
   applyTernary(op, b, c, numRows, numCols, offset, false_type(), false_type());
 
   return 0;
 }
 
-template<class T>
+template <class T>
 template <class Op, class cAsRowVector, class cAsColVector>
-int BaseMatrixT<T>::applyTernary(Op op, BaseMatrixT& b, BaseMatrixT& c,
-                                 int numRows, int numCols, MatrixOffset& offset,
-                                 cAsRowVector, cAsColVector) {
+int BaseMatrixT<T>::applyTernary(Op op,
+                                 BaseMatrixT& b,
+                                 BaseMatrixT& c,
+                                 int numRows,
+                                 int numCols,
+                                 MatrixOffset& offset,
+                                 cAsRowVector,
+                                 cAsColVector) {
   CHECK(!this->isSparse()) << SPARSE_SUPPORT_ERROR;
   CHECK(!b.isSparse()) << SPARSE_SUPPORT_ERROR;
   CHECK(!c.isSparse()) << SPARSE_SUPPORT_ERROR;
@@ -160,10 +175,10 @@ int BaseMatrixT<T>::applyTernary(Op op, BaseMatrixT& b, BaseMatrixT& c,
   T* B = b.data_;
   T* C = c.data_;
   CAL_MATRIX_START_ADDRESS(A, height_, width_, lda, offset.aCol_, offset.aRow_);
-  CAL_MATRIX_START_ADDRESS(B, b.height_, b.width_, ldb, offset.bCol_,
-                           offset.bRow_);
-  CAL_MATRIX_START_ADDRESS(C, c.height_, c.width_, ldc, offset.cCol_,
-                           offset.cRow_);
+  CAL_MATRIX_START_ADDRESS(
+      B, b.height_, b.width_, ldb, offset.bCol_, offset.bRow_);
+  CAL_MATRIX_START_ADDRESS(
+      C, c.height_, c.width_, ldc, offset.cCol_, offset.cRow_);
 
   CHECK_LE(dimM + offset.aRow_, this->height_);
   CHECK_LE(dimN + offset.aCol_, this->width_);
@@ -180,21 +195,21 @@ int BaseMatrixT<T>::applyTernary(Op op, BaseMatrixT& b, BaseMatrixT& c,
   }
 
   if (true == useGpu_) {
-    hl_gpu_apply_ternary_op
-      <T, Op, cAsRowVector::value, cAsColVector::value>(
+    hl_gpu_apply_ternary_op<T, Op, cAsRowVector::value, cAsColVector::value>(
         op, A, B, C, dimM, dimN, lda, ldb, ldc);
   } else {
-    hl_cpu_apply_ternary_op
-      <T, Op, cAsRowVector::value, cAsColVector::value>(
+    hl_cpu_apply_ternary_op<T, Op, cAsRowVector::value, cAsColVector::value>(
         op, A, B, C, dimM, dimN, lda, ldb, ldc);
   }
 
   return 0;
 }
 
-template<class T>
+template <class T>
 template <class Op>
-int BaseMatrixT<T>::applyQuaternary(Op op, BaseMatrixT& b, BaseMatrixT& c,
+int BaseMatrixT<T>::applyQuaternary(Op op,
+                                    BaseMatrixT& b,
+                                    BaseMatrixT& c,
                                     BaseMatrixT& d) {
   CHECK_EQ(height_, b.height_);
   CHECK_EQ(width_, b.width_);
@@ -209,10 +224,14 @@ int BaseMatrixT<T>::applyQuaternary(Op op, BaseMatrixT& b, BaseMatrixT& c,
   return 0;
 }
 
-template<class T>
+template <class T>
 template <class Op>
-int BaseMatrixT<T>::applyQuaternary(Op op, BaseMatrixT& b, BaseMatrixT& c,
-                                    BaseMatrixT& d, int numRows, int numCols,
+int BaseMatrixT<T>::applyQuaternary(Op op,
+                                    BaseMatrixT& b,
+                                    BaseMatrixT& c,
+                                    BaseMatrixT& d,
+                                    int numRows,
+                                    int numCols,
                                     MatrixOffset& offset) {
   CHECK(!this->isSparse()) << SPARSE_SUPPORT_ERROR;
   CHECK(!b.isSparse()) << SPARSE_SUPPORT_ERROR;
@@ -234,12 +253,12 @@ int BaseMatrixT<T>::applyQuaternary(Op op, BaseMatrixT& b, BaseMatrixT& c,
   T* C = c.data_;
   T* D = d.data_;
   CAL_MATRIX_START_ADDRESS(A, height_, width_, lda, offset.aCol_, offset.aRow_);
-  CAL_MATRIX_START_ADDRESS(B, b.height_, b.width_, ldb, offset.bCol_,
-                           offset.bRow_);
-  CAL_MATRIX_START_ADDRESS(C, c.height_, c.width_, ldc, offset.cCol_,
-                           offset.cRow_);
-  CAL_MATRIX_START_ADDRESS(D, d.height_, d.width_, ldd, offset.dCol_,
-                           offset.dRow_);
+  CAL_MATRIX_START_ADDRESS(
+      B, b.height_, b.width_, ldb, offset.bCol_, offset.bRow_);
+  CAL_MATRIX_START_ADDRESS(
+      C, c.height_, c.width_, ldc, offset.cCol_, offset.cRow_);
+  CAL_MATRIX_START_ADDRESS(
+      D, d.height_, d.width_, ldd, offset.dCol_, offset.dRow_);
 
   CHECK_LE(dimM + offset.aRow_, this->height_);
   CHECK_LE(dimN + offset.aCol_, this->width_);
@@ -250,22 +269,29 @@ int BaseMatrixT<T>::applyQuaternary(Op op, BaseMatrixT& b, BaseMatrixT& c,
   CHECK_LE(dimM + offset.dRow_, d.height_);
   CHECK_LE(dimN + offset.dCol_, d.width_);
   if (true == useGpu_) {
-    hl_gpu_apply_quaternary_op(op, A, B, C, D, dimM, dimN, lda, ldb,
-                               ldc, ldd);
+    hl_gpu_apply_quaternary_op(op, A, B, C, D, dimM, dimN, lda, ldb, ldc, ldd);
   } else {
-    hl_cpu_apply_quaternary_op(op, A, B, C, D, dimM, dimN, lda, ldb,
-                               ldc, ldd);
+    hl_cpu_apply_quaternary_op(op, A, B, C, D, dimM, dimN, lda, ldb, ldc, ldd);
   }
 
   return 0;
 }
 
-template<class T>
-template <class Agg, class Op, class Saver, class aAsRowVector,
+template <class T>
+template <class Agg,
+          class Op,
+          class Saver,
+          class aAsRowVector,
           class aAsColVector>
-int BaseMatrixT<T>::aggregate(Agg agg, Op op, Saver sv, BaseMatrixT& b,
-                              int numRows, int numCols, MatrixOffset& offset,
-                              aAsRowVector, aAsColVector) {
+int BaseMatrixT<T>::aggregate(Agg agg,
+                              Op op,
+                              Saver sv,
+                              BaseMatrixT& b,
+                              int numRows,
+                              int numCols,
+                              MatrixOffset& offset,
+                              aAsRowVector,
+                              aAsColVector) {
   CHECK_EQ(useGpu_, b.useGpu_);
 
   int ld = stride_;
@@ -273,10 +299,10 @@ int BaseMatrixT<T>::aggregate(Agg agg, Op op, Saver sv, BaseMatrixT& b,
 
   T* dst = data_;
   T* B = b.data_;
-  CAL_MATRIX_START_ADDRESS(dst, height_, width_, ld, offset.aCol_,
-                           offset.aRow_);
-  CAL_MATRIX_START_ADDRESS(B, b.height_, b.width_, ldb, offset.bCol_,
-                           offset.bRow_);
+  CAL_MATRIX_START_ADDRESS(
+      dst, height_, width_, ld, offset.aCol_, offset.aRow_);
+  CAL_MATRIX_START_ADDRESS(
+      B, b.height_, b.width_, ldb, offset.bCol_, offset.bRow_);
 
   if (aAsRowVector::value && !aAsColVector::value) {
     if (useGpu_) {
@@ -297,12 +323,21 @@ int BaseMatrixT<T>::aggregate(Agg agg, Op op, Saver sv, BaseMatrixT& b,
   return 0;
 }
 
-template<class T>
-template <class Agg, class Op, class Saver, class aAsRowVector,
+template <class T>
+template <class Agg,
+          class Op,
+          class Saver,
+          class aAsRowVector,
           class aAsColVector>
-int BaseMatrixT<T>::aggregate(Agg agg, Op op, Saver sv, BaseMatrixT& b,
-                              BaseMatrixT& c, int numRows, int numCols,
-                              MatrixOffset& offset, aAsRowVector,
+int BaseMatrixT<T>::aggregate(Agg agg,
+                              Op op,
+                              Saver sv,
+                              BaseMatrixT& b,
+                              BaseMatrixT& c,
+                              int numRows,
+                              int numCols,
+                              MatrixOffset& offset,
+                              aAsRowVector,
                               aAsColVector) {
   CHECK_EQ(useGpu_, b.useGpu_);
   CHECK_EQ(useGpu_, c.useGpu_);
@@ -314,28 +349,28 @@ int BaseMatrixT<T>::aggregate(Agg agg, Op op, Saver sv, BaseMatrixT& b,
   T* dst = data_;
   T* B = b.data_;
   T* C = c.data_;
-  CAL_MATRIX_START_ADDRESS(dst, height_, width_, ld, offset.aCol_,
-                           offset.aRow_);
-  CAL_MATRIX_START_ADDRESS(B, b.height_, b.width_, ldb, offset.bCol_,
-                           offset.bRow_);
-  CAL_MATRIX_START_ADDRESS(C, c.height_, c.width_, ldc, offset.cCol_,
-                           offset.cRow_);
+  CAL_MATRIX_START_ADDRESS(
+      dst, height_, width_, ld, offset.aCol_, offset.aRow_);
+  CAL_MATRIX_START_ADDRESS(
+      B, b.height_, b.width_, ldb, offset.bCol_, offset.bRow_);
+  CAL_MATRIX_START_ADDRESS(
+      C, c.height_, c.width_, ldc, offset.cCol_, offset.cRow_);
 
   if (aAsRowVector::value && !aAsColVector::value) {
     if (useGpu_) {
-      hl_gpu_matrix_column_op(agg, op, sv, numRows, numCols, dst, B,
-                              ldb, C, ldc);
+      hl_gpu_matrix_column_op(
+          agg, op, sv, numRows, numCols, dst, B, ldb, C, ldc);
     } else {
-      hl_cpu_matrix_column_op(agg, op, sv, numRows, numCols, dst, B,
-                              ldb, C, ldc);
+      hl_cpu_matrix_column_op(
+          agg, op, sv, numRows, numCols, dst, B, ldb, C, ldc);
     }
   } else if (!aAsRowVector::value && aAsColVector::value) {
     if (useGpu_) {
-      hl_gpu_matrix_row_op(agg, op, sv, numRows, numCols, dst, ld, B,
-                           ldb, C, ldc);
+      hl_gpu_matrix_row_op(
+          agg, op, sv, numRows, numCols, dst, ld, B, ldb, C, ldc);
     } else {
-      hl_cpu_matrix_row_op(agg, op, sv, numRows, numCols, dst, ld, B,
-                           ldb, C, ldc);
+      hl_cpu_matrix_row_op(
+          agg, op, sv, numRows, numCols, dst, ld, B, ldb, C, ldc);
     }
   } else {
     LOG(FATAL) << "not supported";
@@ -350,15 +385,19 @@ int BaseMatrixT<T>::aggregate(Agg agg, Op op, Saver sv, BaseMatrixT& b,
  */
 
 DEFINE_MATRIX_UNARY_OP(Neg, a = -a);
-template<class T>
-void BaseMatrixT<T>::neg() { applyUnary(unary::Neg<T>()); }
+template <class T>
+void BaseMatrixT<T>::neg() {
+  applyUnary(unary::Neg<T>());
+}
 
 DEFINE_MATRIX_UNARY_OP(Exp, a = exp(a));
-template<>
-void BaseMatrixT<real>::exp2() { applyUnary(unary::Exp<real>()); }
+template <>
+void BaseMatrixT<real>::exp2() {
+  applyUnary(unary::Exp<real>());
+}
 
 DEFINE_MATRIX_UNARY_OP(Log, a = log(a));
-template<>
+template <>
 void BaseMatrixT<real>::log2() {
   if (useGpu_) {
     applyUnary(unary::Log<real>());
@@ -368,30 +407,42 @@ void BaseMatrixT<real>::log2() {
 }
 
 DEFINE_MATRIX_UNARY_OP(Sqrt, a = sqrt(a));
-template<>
-void BaseMatrixT<real>::sqrt2() { applyUnary(unary::Sqrt<real>()); }
+template <>
+void BaseMatrixT<real>::sqrt2() {
+  applyUnary(unary::Sqrt<real>());
+}
 
 DEFINE_MATRIX_UNARY_OP(Square, a = a * a);
-template<class T>
-void BaseMatrixT<T>::square2() { applyUnary(unary::Square<T>()); }
+template <class T>
+void BaseMatrixT<T>::square2() {
+  applyUnary(unary::Square<T>());
+}
 
 DEFINE_MATRIX_UNARY_OP(Reciprocal, a = 1.0f / a);
-template<class T>
-void BaseMatrixT<T>::reciprocal2() { applyUnary(unary::Reciprocal<T>()); }
+template <class T>
+void BaseMatrixT<T>::reciprocal2() {
+  applyUnary(unary::Reciprocal<T>());
+}
 
 DEFINE_MATRIX_UNARY_OP(Abs, a = a > 0 ? a : -a);
-template<class T>
-void BaseMatrixT<T>::abs2() { applyUnary(unary::Abs<T>()); }
+template <class T>
+void BaseMatrixT<T>::abs2() {
+  applyUnary(unary::Abs<T>());
+}
 
 DEFINE_MATRIX_UNARY_OP(Sign, a = (a > 0) - (a < 0));
-template<class T>
-void BaseMatrixT<T>::sign2() { applyUnary(unary::Sign<T>()); }
+template <class T>
+void BaseMatrixT<T>::sign2() {
+  applyUnary(unary::Sign<T>());
+}
 
 DEFINE_MATRIX_UNARY_OP(Zero, a = 0);
-template<class T>
-void BaseMatrixT<T>::zero() { applyUnary(unary::Zero<T>()); }
+template <class T>
+void BaseMatrixT<T>::zero() {
+  applyUnary(unary::Zero<T>());
+}
 
-template<class T>
+template <class T>
 void BaseMatrixT<T>::zeroAtOffset(int64_t columnOffset, int64_t numColumns) {
   int numRows = height_;
   int numCols = numColumns;
@@ -400,11 +451,13 @@ void BaseMatrixT<T>::zeroAtOffset(int64_t columnOffset, int64_t numColumns) {
 }
 
 DEFINE_MATRIX_UNARY_OP(One, a = 1);
-template<class T>
-void BaseMatrixT<T>::one() { applyUnary(unary::One<T>()); }
+template <class T>
+void BaseMatrixT<T>::one() {
+  applyUnary(unary::One<T>());
+}
 
 DEFINE_MATRIX_UNARY_PARAMETER_OP(Pow, ONE_PARAMETER, a = pow(a, p));
-template<>
+template <>
 void BaseMatrixT<real>::pow2(real p) {
   if (useGpu_) {
     applyUnary(unary::Pow<real>(p));
@@ -414,51 +467,67 @@ void BaseMatrixT<real>::pow2(real p) {
 }
 
 DEFINE_MATRIX_UNARY_PARAMETER_OP(SubScalar, ONE_PARAMETER, a -= p);
-template<class T>
-void BaseMatrixT<T>::subScalar(T p) { applyUnary(unary::SubScalar<T>(p)); }
+template <class T>
+void BaseMatrixT<T>::subScalar(T p) {
+  applyUnary(unary::SubScalar<T>(p));
+}
 
 DEFINE_MATRIX_UNARY_PARAMETER_OP(MulScalar, ONE_PARAMETER, a *= p);
-template<class T>
-void BaseMatrixT<T>::mulScalar(T p) { applyUnary(unary::MulScalar<T>(p)); }
+template <class T>
+void BaseMatrixT<T>::mulScalar(T p) {
+  applyUnary(unary::MulScalar<T>(p));
+}
 
 DEFINE_MATRIX_UNARY_PARAMETER_OP(DivScalar, ONE_PARAMETER, a /= p);
-template<class T>
-void BaseMatrixT<T>::divScalar(T p) { applyUnary(unary::DivScalar<T>(p)); }
+template <class T>
+void BaseMatrixT<T>::divScalar(T p) {
+  applyUnary(unary::DivScalar<T>(p));
+}
 
 DEFINE_MATRIX_UNARY_PARAMETER_OP(Assign, ONE_PARAMETER, a = p);
-template<class T>
-void BaseMatrixT<T>::assign(T p) { applyUnary(unary::Assign<T>(p)); }
+template <class T>
+void BaseMatrixT<T>::assign(T p) {
+  applyUnary(unary::Assign<T>(p));
+}
 
 DEFINE_MATRIX_UNARY_PARAMETER_OP(Add, ONE_PARAMETER, a += p);
-template<class T>
-void BaseMatrixT<T>::add(T p) { applyUnary(unary::Add<T>(p)); }
+template <class T>
+void BaseMatrixT<T>::add(T p) {
+  applyUnary(unary::Add<T>(p));
+}
 
 DEFINE_MATRIX_UNARY_PARAMETER_OP(Add2, TWO_PARAMETER, a = a * p1 + p2);
-template<class T>
-void BaseMatrixT<T>::add(T p1, T p2) { applyUnary(unary::Add2<T>(p1, p2)); }
+template <class T>
+void BaseMatrixT<T>::add(T p1, T p2) {
+  applyUnary(unary::Add2<T>(p1, p2));
+}
 
-DEFINE_MATRIX_UNARY_PARAMETER_OP(Clip, TWO_PARAMETER,
+DEFINE_MATRIX_UNARY_PARAMETER_OP(Clip,
+                                 TWO_PARAMETER,
                                  a = a < p1 ? p1 : (a > p2 ? p2 : a));
-template<class T>
-void BaseMatrixT<T>::clip(T p1, T p2) { applyUnary(unary::Clip<T>(p1, p2)); }
+template <class T>
+void BaseMatrixT<T>::clip(T p1, T p2) {
+  applyUnary(unary::Clip<T>(p1, p2));
+}
 
-DEFINE_MATRIX_BINARY_PARAMETER_OP(ClipDerivative, TWO_PARAMETER,
-		a = b < p1 ? 0 : (b > p2 ? 0 : 1));
-template<class T>
+DEFINE_MATRIX_BINARY_PARAMETER_OP(ClipDerivative,
+                                  TWO_PARAMETER,
+                                  a = b < p1 ? 0 : (b > p2 ? 0 : 1));
+template <class T>
 void BaseMatrixT<T>::clipDerivative(BaseMatrixT& b, T p1, T p2) {
   applyBinary(binary::ClipDerivative<T>(p1, p2), b);
 }
 
-DEFINE_MATRIX_UNARY_PARAMETER_OP(BiggerThanScalar, ONE_PARAMETER,
+DEFINE_MATRIX_UNARY_PARAMETER_OP(BiggerThanScalar,
+                                 ONE_PARAMETER,
                                  a = a > p ? 1.0f : 0.0f);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::biggerThanScalar(T p) {
   applyUnary(unary::BiggerThanScalar<T>(p));
 }
 
-DEFINE_MATRIX_UNARY_PARAMETER_OP(DownClip, ONE_PARAMETER,
-                                 a = a > p ? a : p);
-template<class T>
+DEFINE_MATRIX_UNARY_PARAMETER_OP(DownClip, ONE_PARAMETER, a = a > p ? a : p);
+template <class T>
 void BaseMatrixT<T>::downClip(T p) {
   applyUnary(unary::DownClip<T>(p));
 }
@@ -469,12 +538,12 @@ void BaseMatrixT<T>::downClip(T p) {
  */
 
 DEFINE_MATRIX_BINARY_OP(Add, a += b);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::add(BaseMatrixT& b) {
   applyBinary(binary::Add<T>(), b);
 }
 
-template<>
+template <>
 void BaseMatrixT<real>::add(BaseMatrixT& b) {
   if (useGpu_) {
     applyBinary(binary::Add<real>(), b);
@@ -485,7 +554,7 @@ void BaseMatrixT<real>::add(BaseMatrixT& b) {
   }
 }
 
-template<class T>
+template <class T>
 void BaseMatrixT<T>::addAtOffset(BaseMatrixT& b, int64_t columnOffset) {
   if (columnOffset + b.width_ <= width_) {
     int numRows = height_;
@@ -504,43 +573,53 @@ void BaseMatrixT<T>::addAtOffset(BaseMatrixT& b, int64_t columnOffset) {
   }
 }
 
-template<class T>
+template <class T>
 void BaseMatrixT<T>::addP2P(BaseMatrixT& b) {
   T* A = data_;
   T* B = b.data_;
   int dimM = height_;
   int dimN = width_;
 
-  hl_gpu_apply_binary_op<T, binary::Add<T>, 0, 0>
-    (binary::Add<T>(), A, B, dimM, dimN, dimN, dimN);
+  hl_gpu_apply_binary_op<T, binary::Add<T>, 0, 0>(
+      binary::Add<T>(), A, B, dimM, dimN, dimN, dimN);
 }
 
-template<class T>
+template <class T>
 void BaseMatrixT<T>::addColVector(BaseMatrixT& b) {
   MatrixOffset offset(0, 0, 0, 0);
   int numRows = height_;
   int numCols = width_;
-  applyBinary(binary::Add<T>(), b, numRows, numCols, offset, false_type(),
+  applyBinary(binary::Add<T>(),
+              b,
+              numRows,
+              numCols,
+              offset,
+              false_type(),
               true_type() /* bAsColVector */);
 }
 
-template<class T>
+template <class T>
 void BaseMatrixT<T>::addRowVector(BaseMatrixT& b) {
   MatrixOffset offset(0, 0, 0, 0);
   int numRows = height_;
   int numCols = width_;
-  applyBinary(binary::Add<T>(), b, numRows, numCols, offset,
-              true_type() /* bAsRowVector */, false_type());
+  applyBinary(binary::Add<T>(),
+              b,
+              numRows,
+              numCols,
+              offset,
+              true_type() /* bAsRowVector */,
+              false_type());
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(Add1, ONE_PARAMETER, a += b * p);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::add(BaseMatrixT& b, T p) {
   applyBinary(binary::Add1<T>(p), b);
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(Pow, ONE_PARAMETER, a = pow(b, p));
-template<>
+template <>
 void BaseMatrixT<real>::pow2(BaseMatrixT& b, real p) {
   if (useGpu_) {
     applyBinary(binary::Pow<real>(p), b);
@@ -550,36 +629,45 @@ void BaseMatrixT<real>::pow2(BaseMatrixT& b, real p) {
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(Add2, TWO_PARAMETER, a = p1 * a + p2 * b);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::add(BaseMatrixT& b, T p1, T p2) {
   applyBinary(binary::Add2<T>(p1, p2), b);
 }
 
-template<class T>
+template <class T>
 void BaseMatrixT<T>::addBias(BaseMatrixT& b, T scale) {
   MatrixOffset offset(0, 0, 0, 0);
   int numRows = height_;
   int numCols = width_;
-  applyBinary(binary::Add1<T>(scale), b, numRows, numCols, offset,
-              true_type() /* bAsRowVector */, false_type());
+  applyBinary(binary::Add1<T>(scale),
+              b,
+              numRows,
+              numCols,
+              offset,
+              true_type() /* bAsRowVector */,
+              false_type());
 }
 
 DEFINE_MATRIX_BINARY_OP(Sub, a -= b);
-template<class T>
-void BaseMatrixT<T>::sub(BaseMatrixT& b) { applyBinary(binary::Sub<T>(), b); }
+template <class T>
+void BaseMatrixT<T>::sub(BaseMatrixT& b) {
+  applyBinary(binary::Sub<T>(), b);
+}
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(Sub1, ONE_PARAMETER, a -= b * p);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::sub(BaseMatrixT& b, T p) {
   applyBinary(binary::Sub1<T>(p), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(Relu, b = a > 0.0f ? a : 0.0f);
-template<class T>
-void BaseMatrixT<T>::relu(BaseMatrixT& b) { applyBinary(binary::Relu<T>(), b); }
+template <class T>
+void BaseMatrixT<T>::relu(BaseMatrixT& b) {
+  applyBinary(binary::Relu<T>(), b);
+}
 
 DEFINE_MATRIX_BINARY_OP(ReluDerivative, a *= (b > 0.0f ? 1.0f : 0.0f));
-template<class T>
+template <class T>
 void BaseMatrixT<T>::reluDerivative(BaseMatrixT& b) {
   applyBinary(binary::ReluDerivative<T>(), b);
 }
@@ -589,7 +677,7 @@ DEFINE_MATRIX_BINARY_OP(Softrelu, const T THRESHOLD = 40.0;
                                               ? THRESHOLD
                                               : ((a < -THRESHOLD) ? (-THRESHOLD)
                                                                   : a))));
-template<>
+template <>
 void BaseMatrixT<real>::softrelu(BaseMatrixT& b) {
   applyBinary(binary::Softrelu<real>(), b);
 }
@@ -599,97 +687,100 @@ DEFINE_MATRIX_BINARY_OP(
     a *= (1.0 - exp(-1.0 * ((b > THRESHOLD)
                                 ? THRESHOLD
                                 : ((b < -THRESHOLD) ? (-THRESHOLD) : b)))));
-template<>
+template <>
 void BaseMatrixT<real>::softreluDerivative(BaseMatrixT& b) {
   applyBinary(binary::SoftreluDerivative<real>(), b);
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(Brelu, TWO_PARAMETER, b = a > p1 ? a : p1;
                                   b = b < p2 ? b : p2);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::brelu(BaseMatrixT& b) {
-  int p1 = 0, p2 = 24;    //! TODO(yuyang18): Make p1,p2 configuable.
+  int p1 = 0, p2 = 24;  //! TODO(yuyang18): Make p1,p2 configuable.
   applyBinary(binary::Brelu<T>(p1, p2), b);
 }
 
-DEFINE_MATRIX_BINARY_PARAMETER_OP(BreluDerivative, TWO_PARAMETER,
+DEFINE_MATRIX_BINARY_PARAMETER_OP(BreluDerivative,
+                                  TWO_PARAMETER,
                                   a *= (b > p1 && b < p2) ? 1.0 : 0.0);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::breluDerivative(BaseMatrixT& b) {
   int p1 = 0, p2 = 24;
   applyBinary(binary::BreluDerivative<T>(p1, p2), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(Square, b = a * a);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::square2(BaseMatrixT& b) {
   applyBinary(binary::Square<T>(), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(SquareDerivative, a *= 2.0 * b);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::squareDerivative(BaseMatrixT& b) {
   applyBinary(binary::SquareDerivative<T>(), b);
 }
 
-DEFINE_MATRIX_BINARY_OP(Tanh,
-    T tmp = -2.0 * a;
-    tmp = (tmp > EXP_MAX_INPUT) ? EXP_MAX_INPUT : tmp;
-    b = 2.0 / (1.0 + std::exp(tmp)) - 1.0);
-template<>
+DEFINE_MATRIX_BINARY_OP(Tanh, T tmp = -2.0 * a;
+                        tmp = (tmp > EXP_MAX_INPUT) ? EXP_MAX_INPUT : tmp;
+                        b = 2.0 / (1.0 + std::exp(tmp)) - 1.0);
+template <>
 void BaseMatrixT<real>::tanh(BaseMatrixT& b) {
   applyBinary(binary::Tanh<real>(), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(TanhDerivative, a *= 1 - b * b);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::tanhDerivative(BaseMatrixT& b) {
   applyBinary(binary::TanhDerivative<T>(), b);
 }
 
-DEFINE_MATRIX_BINARY_PARAMETER_OP(ScaledTanh, TWO_PARAMETER,
-                                  b = p1 *
-                                      (2.0 / (1.0 + exp(-2 * p2 * a)) - 1.0));
-template<>
+DEFINE_MATRIX_BINARY_PARAMETER_OP(
+    ScaledTanh, TWO_PARAMETER, b = p1 * (2.0 / (1.0 + exp(-2 * p2 * a)) - 1.0));
+template <>
 void BaseMatrixT<real>::scaledTanh(BaseMatrixT& b, real p1, real p2) {
   applyBinary(binary::ScaledTanh<real>(p1, p2), b);
 }
 
-DEFINE_MATRIX_BINARY_PARAMETER_OP(ScaledTanhDerivative, TWO_PARAMETER,
+DEFINE_MATRIX_BINARY_PARAMETER_OP(ScaledTanhDerivative,
+                                  TWO_PARAMETER,
                                   a *= p2 * (p1 - b * b));
-template<class T>
+template <class T>
 void BaseMatrixT<T>::scaledTanhDerivative(BaseMatrixT& b, T p1, T p2) {
   applyBinary(binary::ScaledTanhDerivative<T>(p1 * p1, p2 / p1), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(Reciprocal, b = 1.0f / a);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::reciprocal2(BaseMatrixT& b) {
   applyBinary(binary::Reciprocal<T>(), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(ReciprocalDerivative, a *= -b * b);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::reciprocalDerivative(BaseMatrixT& b) {
   applyBinary(binary::ReciprocalDerivative<T>(), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(Abs, b = a > 0.0f ? a : -a);
-template<class T>
-void BaseMatrixT<T>::abs2(BaseMatrixT& b) { applyBinary(binary::Abs<T>(), b); }
+template <class T>
+void BaseMatrixT<T>::abs2(BaseMatrixT& b) {
+  applyBinary(binary::Abs<T>(), b);
+}
 
 DEFINE_MATRIX_BINARY_OP(AbsDerivative, a = (b > 0) ? a : (b < 0) ? -a : 0);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::absDerivative(BaseMatrixT& b) {
   applyBinary(binary::AbsDerivative<T>(), b);
 }
 
-DEFINE_MATRIX_BINARY_OP(
-    Sigmoid, const T THRESHOLD_MIN = -40.0; const T THRESHOLD_MAX = 13.0;
-    T tmp = (a < THRESHOLD_MIN) ? THRESHOLD_MIN
-                                   : ((a > THRESHOLD_MAX) ? THRESHOLD_MAX : a);
-    b = 1.0f / (1.0f + exp(-tmp)));
-template<>
+DEFINE_MATRIX_BINARY_OP(Sigmoid, const T THRESHOLD_MIN = -40.0;
+                        const T THRESHOLD_MAX = 13.0;
+                        T tmp = (a < THRESHOLD_MIN)
+                                    ? THRESHOLD_MIN
+                                    : ((a > THRESHOLD_MAX) ? THRESHOLD_MAX : a);
+                        b = 1.0f / (1.0f + exp(-tmp)));
+template <>
 void BaseMatrixT<real>::sigmoid(BaseMatrixT& b) {
   if (useGpu_) {
     applyBinary(binary::Sigmoid<real>(), b);
@@ -723,31 +814,31 @@ void BaseMatrixT<real>::sigmoid(BaseMatrixT& b) {
 }
 
 DEFINE_MATRIX_BINARY_OP(SigmoidDerivative, a *= b * (1 - b));
-template<class T>
+template <class T>
 void BaseMatrixT<T>::sigmoidDerivative(BaseMatrixT& b) {
   applyBinary(binary::SigmoidDerivative<T>(), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(ExpDerivative, a *= b);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::expDerivative(BaseMatrixT& b) {
   applyBinary(binary::ExpDerivative<T>(), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(Sign, b = a > 0.0f ? 1.0f : -1.0f);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::sign2(BaseMatrixT& b) {
   applyBinary(binary::Sign<T>(), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(Exp, a = exp(b));
-template<>
+template <>
 void BaseMatrixT<real>::exp2(BaseMatrixT& b) {
   applyBinary(binary::Exp<real>(), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(Log, a = log(b));
-template<>
+template <>
 void BaseMatrixT<real>::log2(BaseMatrixT& b) {
   if (useGpu_) {
     applyBinary(binary::Log<real>(), b);
@@ -757,13 +848,13 @@ void BaseMatrixT<real>::log2(BaseMatrixT& b) {
 }
 
 DEFINE_MATRIX_BINARY_OP(Sqrt, a = sqrt(b));
-template<>
+template <>
 void BaseMatrixT<real>::sqrt2(BaseMatrixT& b) {
   applyBinary(binary::Sqrt<real>(), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(InvSqrt, a = 1.0f / sqrt(b));
-template<>
+template <>
 void BaseMatrixT<real>::invSqrt(BaseMatrixT& b) {
   if (useGpu_) {
     applyBinary(binary::InvSqrt<real>(), b);
@@ -775,37 +866,37 @@ void BaseMatrixT<real>::invSqrt(BaseMatrixT& b) {
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(IsEqual, ONE_PARAMETER, a = (b == p));
-template<class T>
+template <class T>
 void BaseMatrixT<T>::isEqualTo(BaseMatrixT& b, T value) {
   applyBinary(binary::IsEqual<T>(value), b);
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(AddScalar, ONE_PARAMETER, a = b + p);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::addScalar(BaseMatrixT& b, T p) {
   applyBinary(binary::AddScalar<T>(p), b);
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(SubScalar, ONE_PARAMETER, a = b - p);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::subScalar(BaseMatrixT& b, T p) {
   applyBinary(binary::SubScalar<T>(p), b);
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(MulScalar, ONE_PARAMETER, a = b * p);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::mulScalar(BaseMatrixT& b, T p) {
   applyBinary(binary::MulScalar<T>(p), b);
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(DivScalar, ONE_PARAMETER, a = b / p);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::divScalar(BaseMatrixT& b, T p) {
   applyBinary(binary::DivScalar<T>(p), b);
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(ScalarDiv, ONE_PARAMETER, a = p / b);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::scalarDiv(BaseMatrixT& b, T p) {
   applyBinary(binary::ScalarDiv<T>(p), b);
 }
@@ -817,20 +908,20 @@ void BaseMatrixT<T>::scalarDiv(BaseMatrixT& b, T p) {
 
 DEFINE_MATRIX_TERNARY_OP(SoftCrossEntropy,
                          a = -c * log(b) - (1 - c) * log(1 - b));
-template<>
+template <>
 void BaseMatrixT<real>::softCrossEntropy(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::SoftCrossEntropy<real>(), b, c);
 }
 
 DEFINE_MATRIX_TERNARY_OP(SoftCrossEntropyBp, a += (b - c) / (b * (1 - b)));
-template<class T>
+template <class T>
 void BaseMatrixT<T>::softCrossEntropyBp(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::SoftCrossEntropyBp<T>(), b, c);
 }
 
 DEFINE_MATRIX_TERNARY_OP(BinaryCrossEntropy,
                          a = c > 0.5 ? -log(b) : -log(1.0 - b));
-template<>
+template <>
 void BaseMatrixT<real>::binaryLabelCrossEntropy(BaseMatrixT& b,
                                                 BaseMatrixT& c) {
   if (useGpu_) {
@@ -858,70 +949,73 @@ void BaseMatrixT<real>::binaryLabelCrossEntropy(BaseMatrixT& b,
 
 DEFINE_MATRIX_TERNARY_OP(BinaryCrossEntropyBp,
                          a += c > 0.5 ? -1.0 / b : 1.0 / (1.0 - b));
-template<class T>
+template <class T>
 void BaseMatrixT<T>::binaryLabelCrossEntropyBp(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::BinaryCrossEntropyBp<T>(), b, c);
 }
 
 DEFINE_MATRIX_TERNARY_OP(Add, a = b + c);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::add(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::Add<T>(), b, c);
 }
 
 DEFINE_MATRIX_TERNARY_PARAMETER_OP(Add1, TWO_PARAMETER, a = p1 * b + p2 * c);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::add(BaseMatrixT& b, T p1, BaseMatrixT& c, T p2) {
   applyTernary(ternary::Add1<T>(p1, p2), b, c);
 }
 
 DEFINE_MATRIX_TERNARY_OP(Sub, a = b - c);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::sub(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::Sub<T>(), b, c);
 }
 
 DEFINE_MATRIX_TERNARY_PARAMETER_OP(Sub1, TWO_PARAMETER, a = p1 * b - p2 * c);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::sub(BaseMatrixT& b, T p1, BaseMatrixT& c, T p2) {
   applyTernary(ternary::Sub1<T>(p1, p2), b, c);
 }
 
 DEFINE_MATRIX_TERNARY_OP(Add2, a = a + b + c);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::add2(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::Add2<T>(), b, c);
 }
 
-DEFINE_MATRIX_TERNARY_PARAMETER_OP(Add3, THREE_PARAMETER,
+DEFINE_MATRIX_TERNARY_PARAMETER_OP(Add3,
+                                   THREE_PARAMETER,
                                    a = p1 * a + p2 * b + p3 * c);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::add2(BaseMatrixT& b, BaseMatrixT& c, T p1, T p2, T p3) {
   applyTernary(ternary::Add3<T>(p1, p2, p3), b, c);
 }
 
-DEFINE_MATRIX_TERNARY_PARAMETER_OP(SgdUpdate, THREE_PARAMETER,
+DEFINE_MATRIX_TERNARY_PARAMETER_OP(SgdUpdate,
+                                   THREE_PARAMETER,
                                    c = p2 * c - p1 * (b + p3 * a);
                                    a = a + c);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::sgdUpdate(BaseMatrixT& b,  // grad
                                BaseMatrixT& c,  // mom
-                               T p1,        // learningRate,
-                               T p2,        // momentum,
-                               T p3) {      // decayRate
+                               T p1,            // learningRate,
+                               T p2,            // momentum,
+                               T p3) {          // decayRate
   applyTernary(ternary::SgdUpdate<T>(p1, p2, p3), b, c);
 }
 
-DEFINE_MATRIX_QUATERNARY_PARAMETER_OP(SgdUpdate, THREE_PARAMETER,
+DEFINE_MATRIX_QUATERNARY_PARAMETER_OP(SgdUpdate,
+                                      THREE_PARAMETER,
                                       c = p2 * c - p1 * d * (b + p3 * a);
                                       a += c);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::sgdUpdate(BaseMatrixT& b,  // grad,
                                BaseMatrixT& c,  // mom,
                                BaseMatrixT& d,  // lr,
-                               T p1,        // learningRate,
-                               T p2,        // momentum,
-                               T p3) {      // decayRate
+                               T p1,            // learningRate,
+                               T p2,            // momentum,
+                               T p3) {          // decayRate
   applyQuaternary(quaternary::SgdUpdate<T>(p1, p2, p3), b, c, d);
 }
 
@@ -929,19 +1023,22 @@ DEFINE_MATRIX_BINARY_PARAMETER_OP(ApplyL1, ONE_PARAMETER, T lambda = p * b;
                                   a = (a > lambda)
                                           ? (a - lambda)
                                           : (a < -lambda) ? (a + lambda) : 0);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::applyL1(BaseMatrixT& lr, T learningRate, T decayRate) {
   applyBinary(binary::ApplyL1<T>(learningRate * decayRate), lr);
 }
 
-template<>
+template <>
 void BaseMatrixT<real>::applyL1(BaseMatrixT& lr,
                                 real learningRate,
                                 real decayRate) {
   if (useGpu_) {
     applyBinary(binary::ApplyL1<real>(learningRate * decayRate), lr);
   } else {
-    simd::decayL1(this->data_, this->data_, lr.data_, learningRate * decayRate,
+    simd::decayL1(this->data_,
+                  this->data_,
+                  lr.data_,
+                  learningRate * decayRate,
                   height_ * width_);
   }
 }
@@ -950,24 +1047,25 @@ DEFINE_MATRIX_UNARY_PARAMETER_OP(ApplyL1, ONE_PARAMETER, T lambda = p;
                                  a = (a > lambda)
                                          ? (a - lambda)
                                          : (a < -lambda) ? (a + lambda) : 0);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::applyL1(T learningRate, T decayRate) {
   applyUnary(unary::ApplyL1<T>(learningRate * decayRate));
 }
 
-template<>
+template <>
 void BaseMatrixT<real>::applyL1(real learningRate, real decayRate) {
   if (useGpu_) {
     applyUnary(unary::ApplyL1<real>(learningRate * decayRate));
   } else {
-    simd::decayL1(this->data_, this->data_, learningRate * decayRate,
-                  height_ * width_);
+    simd::decayL1(
+        this->data_, this->data_, learningRate * decayRate, height_ * width_);
   }
 }
 
-DEFINE_MATRIX_BINARY_PARAMETER_OP(ApplyL2, ONE_PARAMETER,
+DEFINE_MATRIX_BINARY_PARAMETER_OP(ApplyL2,
+                                  ONE_PARAMETER,
                                   a *= (1.0f / (1.0f + p * b)));
-template<class T>
+template <class T>
 void BaseMatrixT<T>::applyL2(BaseMatrixT& lr, T learningRate, T decayRate) {
   if (useGpu_) {
     applyBinary(binary::ApplyL2<T>(learningRate * decayRate), lr);
@@ -980,32 +1078,33 @@ void BaseMatrixT<T>::applyL2(BaseMatrixT& lr, T learningRate, T decayRate) {
   }
 }
 
-template<class T>
+template <class T>
 void BaseMatrixT<T>::applyL2(T learningRate, T decayRate) {
   BaseMatrixT<T>::mulScalar(1.0f / (1.0f + learningRate * decayRate));
 }
 
 DEFINE_MATRIX_BINARY_OP(DotMul, a *= b);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::dotMul(BaseMatrixT& b) {
   applyBinary(binary::DotMul<T>(), b);
 }
 
 DEFINE_MATRIX_TERNARY_OP(DotMul, a = b * c);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::dotMul(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::DotMul<T>(), b, c);
 }
 
 DEFINE_MATRIX_TERNARY_OP(DotDiv, a = (b == 0.0) ? 0.0 : b / c);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::dotDiv(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::DotDiv<T>(), b, c);
 }
 
-DEFINE_MATRIX_TERNARY_PARAMETER_OP(DotDiv2P, TWO_PARAMETER,
+DEFINE_MATRIX_TERNARY_PARAMETER_OP(DotDiv2P,
+                                   TWO_PARAMETER,
                                    a = (b + p1) / (c + p2));
-template<class T>
+template <class T>
 void BaseMatrixT<T>::dotDiv(BaseMatrixT& b, BaseMatrixT& c, T p1, T p2) {
   applyTernary(ternary::DotDiv2P<T>(p1, p2), b, c);
 }
@@ -1015,7 +1114,7 @@ DEFINE_MATRIX_QUATERNARY_OP(RankLoss, const T THRESHOLD = 40.0; a = b - c;
                                     ? THRESHOLD
                                     : ((a < -THRESHOLD) ? (-THRESHOLD) : a);
                             a = log(1 + exp(a)) - a * d);
-template<>
+template <>
 void BaseMatrixT<real>::rankLoss(BaseMatrixT& b,
                                  BaseMatrixT& c,
                                  BaseMatrixT& d) {
@@ -1026,8 +1125,9 @@ DEFINE_MATRIX_QUATERNARY_OP(RankLossBp, const T THRESHOLD = 40.0; a = b - c;
                             a = (a > THRESHOLD)
                                     ? THRESHOLD
                                     : ((a < -THRESHOLD) ? (-THRESHOLD) : a);
-                            a = exp(a); a = (a / (1 + a) - d));
-template<>
+                            a = exp(a);
+                            a = (a / (1 + a) - d));
+template <>
 void BaseMatrixT<real>::rankLossBp(BaseMatrixT& b,
                                    BaseMatrixT& c,
                                    BaseMatrixT& d) {
@@ -1040,7 +1140,7 @@ DEFINE_MATRIX_TERNARY_OP(LogisticRegressionLoss, const T THRESHOLD = 40.0;
                                                                  ? -THRESHOLD
                                                                  : b;
                          a = log(1 + exp(x)) - c * x);
-template<>
+template <>
 void BaseMatrixT<real>::logisticRegressionLoss(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::LogisticRegressionLoss<real>(), b, c);
 }
@@ -1050,22 +1150,23 @@ DEFINE_MATRIX_TERNARY_OP(LogisticRegressionLossBp, const T THRESHOLD = 40.0;
                          T x = (b > THRESHOLD) ? THRESHOLD : (b < -THRESHOLD)
                                                                  ? -THRESHOLD
                                                                  : b;
-                         x = exp(x); a = x / (1 + x) - c);
-template<>
+                         x = exp(x);
+                         a = x / (1 + x) - c);
+template <>
 void BaseMatrixT<real>::logisticRegressionLossBp(BaseMatrixT& b,
                                                  BaseMatrixT& c) {
   applyTernary(ternary::LogisticRegressionLossBp<real>(), b, c);
 }
 
 DEFINE_MATRIX_TERNARY_OP(BiggerThan, a = (b > c) ? 1.0f : 0.0f);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::biggerThan(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::BiggerThan<T>(), b, c);
 }
 
 DEFINE_MATRIX_QUATERNARY_OP(
     BiggerThan, a = ((b > c && d > 0.5f) || (b < c && d < 0.5f)) ? 1.0f : 0.0f);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::biggerThan(BaseMatrixT& b,
                                 BaseMatrixT& c,
                                 BaseMatrixT& d) {
@@ -1073,25 +1174,34 @@ void BaseMatrixT<T>::biggerThan(BaseMatrixT& b,
 }
 
 DEFINE_MATRIX_TERNARY_OP(Max, a = (b > c) ? b : c);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::max2(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::Max<T>(), b, c);
 }
 
-DEFINE_MATRIX_TERNARY_PARAMETER_OP(BinaryClassificationError, ONE_PARAMETER,
+DEFINE_MATRIX_TERNARY_PARAMETER_OP(BinaryClassificationError,
+                                   ONE_PARAMETER,
                                    c += ((a > p) == (b > p)) ? 0.0f : 1.0f);
-template<class T>
-void BaseMatrixT<T>::binaryClassificationError2(size_t destCol, BaseMatrixT& b,
-                                                BaseMatrixT& c, T p) {
+template <class T>
+void BaseMatrixT<T>::binaryClassificationError2(size_t destCol,
+                                                BaseMatrixT& b,
+                                                BaseMatrixT& c,
+                                                T p) {
   CHECK(!useGpu_) << "do not support gpu";
   MatrixOffset offset(0, 0, 0, 0, destCol, 0);
   int numRows = b.height_;
   int numCols = b.width_;
-  b.applyTernary(ternary::BinaryClassificationError<T>(p), c, *this, numRows,
-                 numCols, offset, false_type(), true_type() /*cAsColVector*/);
+  b.applyTernary(ternary::BinaryClassificationError<T>(p),
+                 c,
+                 *this,
+                 numRows,
+                 numCols,
+                 offset,
+                 false_type(),
+                 true_type() /*cAsColVector*/);
 }
 
-template<>
+template <>
 void BaseMatrixT<real>::binaryClassificationError(size_t destCol,
                                                   BaseMatrixT& b,
                                                   BaseMatrixT& c,
@@ -1099,127 +1209,148 @@ void BaseMatrixT<real>::binaryClassificationError(size_t destCol,
   MatrixOffset offset(destCol, 0, 0, 0, 0, 0);
   int numRows = b.height_;
   int numCols = b.width_;
-  aggregate(aggregate::sum(), base::binary::classificationError(p),
-            base::binary::add(), b, c, numRows, numCols, offset, false_type(),
+  aggregate(aggregate::sum(),
+            base::binary::classificationError(p),
+            base::binary::add(),
+            b,
+            c,
+            numRows,
+            numCols,
+            offset,
+            false_type(),
             true_type() /*aAsColVector*/);
 }
 
-DEFINE_MATRIX_QUATERNARY_PARAMETER_OP(Add3, THREE_PARAMETER,
+DEFINE_MATRIX_QUATERNARY_PARAMETER_OP(Add3,
+                                      THREE_PARAMETER,
                                       a = p1 * b + p2 * c + p3 * d);
-template<class T>
-void BaseMatrixT<T>::add3(BaseMatrixT& b, BaseMatrixT& c, BaseMatrixT& d, T p1,
-                          T p2, T p3) {
+template <class T>
+void BaseMatrixT<T>::add3(
+    BaseMatrixT& b, BaseMatrixT& c, BaseMatrixT& d, T p1, T p2, T p3) {
   applyQuaternary(quaternary::Add3<T>(p1, p2, p3), b, c, d);
 }
 
 DEFINE_MATRIX_TERNARY_OP(DotMulSquare, a = b * c * c);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::dotMulSquare(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::DotMulSquare<T>(), b, c);
 }
 
 DEFINE_MATRIX_TERNARY_OP(DotSquareSquare, a = b * b * c * c);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::dotSquareSquare(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::DotSquareSquare<T>(), b, c);
 }
 
 DEFINE_MATRIX_BINARY_OP(DotMulSquare, a *= b * b);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::dotMulSquare(BaseMatrixT& b) {
   applyBinary(binary::DotMulSquare<T>(), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(DotSquareMul, a = a * a * b);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::dotSquareMul(BaseMatrixT& b) {
   applyBinary(binary::DotSquareMul<T>(), b);
 }
 
-DEFINE_MATRIX_QUATERNARY_PARAMETER_OP(AddSquareSum, THREE_PARAMETER,
+DEFINE_MATRIX_QUATERNARY_PARAMETER_OP(AddSquareSum,
+                                      THREE_PARAMETER,
                                       T tmp = p1 * b + p2 * c + p3 * d;
                                       a += tmp * tmp);
-template<class T>
-void BaseMatrixT<T>::addSquareSum(BaseMatrixT& b, BaseMatrixT& c, BaseMatrixT d,
-                                  T p1, T p2, T p3) {
+template <class T>
+void BaseMatrixT<T>::addSquareSum(
+    BaseMatrixT& b, BaseMatrixT& c, BaseMatrixT d, T p1, T p2, T p3) {
   applyQuaternary(quaternary::AddSquareSum<T>(p1, p2, p3), b, c, d);
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(AddSquare, ONE_PARAMETER, a += p * b * b);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::addSquare(BaseMatrixT& b, T p) {
   applyBinary(binary::AddSquare<T>(p), b);
 }
 
-DEFINE_MATRIX_BINARY_PARAMETER_OP(DecayAddSquare, TWO_PARAMETER,
+DEFINE_MATRIX_BINARY_PARAMETER_OP(DecayAddSquare,
+                                  TWO_PARAMETER,
                                   a = p1 * a + p2 * b * b);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::decayAddSquare(BaseMatrixT& b, T p1, T p2) {
   applyBinary(binary::DecayAddSquare<T>(p1, p2), b);
 }
 
-DEFINE_MATRIX_TERNARY_PARAMETER_OP(DecayAddSquareMul, TWO_PARAMETER,
+DEFINE_MATRIX_TERNARY_PARAMETER_OP(DecayAddSquareMul,
+                                   TWO_PARAMETER,
                                    a = p1 * a + p2 * b * b * c * c);
-template<class T>
-void BaseMatrixT<T>::decayAddSquareMul(BaseMatrixT& b, BaseMatrixT& c, T p1,
+template <class T>
+void BaseMatrixT<T>::decayAddSquareMul(BaseMatrixT& b,
+                                       BaseMatrixT& c,
+                                       T p1,
                                        T p2) {
   applyTernary(ternary::DecayAddSquareMul<T>(p1, p2), b, c);
 }
 
-DEFINE_MATRIX_TERNARY_PARAMETER_OP(ReciprocalSum, THREE_PARAMETER,
+DEFINE_MATRIX_TERNARY_PARAMETER_OP(ReciprocalSum,
+                                   THREE_PARAMETER,
                                    a = 1 / (p1 * b + p2 * c + p3));
-template<class T>
-void BaseMatrixT<T>::reciprocalSum(BaseMatrixT& b, BaseMatrixT& c, T p1, T p2,
-                                   T p3) {
+template <class T>
+void BaseMatrixT<T>::reciprocalSum(
+    BaseMatrixT& b, BaseMatrixT& c, T p1, T p2, T p3) {
   applyTernary(ternary::ReciprocalSum<T>(p1, p2, p3), b, c);
 }
 
-DEFINE_MATRIX_BINARY_PARAMETER_OP(Reciprocal2, TWO_PARAMETER,
+DEFINE_MATRIX_BINARY_PARAMETER_OP(Reciprocal2,
+                                  TWO_PARAMETER,
                                   a = 1 / (p1 * b + p2));
-template<class T>
+template <class T>
 void BaseMatrixT<T>::reciprocal2(BaseMatrixT& b, T p1, T p2) {
   applyBinary(binary::Reciprocal2<T>(p1, p2), b);
 }
 
-DEFINE_MATRIX_TERNARY_PARAMETER_OP(DotMulSquareSum, TWO_PARAMETER,
+DEFINE_MATRIX_TERNARY_PARAMETER_OP(DotMulSquareSum,
+                                   TWO_PARAMETER,
                                    T tmp = p1 * b + p2 * c;
                                    a *= tmp * tmp);
-template<class T>
-void BaseMatrixT<T>::dotMulSquareSum(BaseMatrixT& b, BaseMatrixT& c, T p1,
+template <class T>
+void BaseMatrixT<T>::dotMulSquareSum(BaseMatrixT& b,
+                                     BaseMatrixT& c,
+                                     T p1,
                                      T p2) {
   applyTernary(ternary::DotMulSquareSum<T>(p1, p2), b, c);
 }
 
-DEFINE_MATRIX_TERNARY_PARAMETER_OP(DotSquareSum, TWO_PARAMETER,
+DEFINE_MATRIX_TERNARY_PARAMETER_OP(DotSquareSum,
+                                   TWO_PARAMETER,
                                    T tmp = p1 * b + p2 * c;
                                    a = tmp * tmp);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::dotSquareSum(BaseMatrixT& b, BaseMatrixT& c, T p1, T p2) {
   applyTernary(ternary::DotSquareSum<T>(p1, p2), b, c);
 }
 
-DEFINE_MATRIX_TERNARY_PARAMETER_OP(DotMulSum, TWO_PARAMETER,
+DEFINE_MATRIX_TERNARY_PARAMETER_OP(DotMulSum,
+                                   TWO_PARAMETER,
                                    a *= p1 * b + p2 * c);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::dotMulSum(BaseMatrixT& b, BaseMatrixT& c, T p1, T p2) {
   applyTernary(ternary::DotMulSum<T>(p1, p2), b, c);
 }
 
 DEFINE_MATRIX_BINARY_OP(CopyAndClear, b = a; a = 0);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::copyAndClear(BaseMatrixT& b) {
   applyBinary(binary::CopyAndClear<T>(), b);
 }
 
-DEFINE_MATRIX_TERNARY_PARAMETER_OP(AddDotMul, TWO_PARAMETER,
+DEFINE_MATRIX_TERNARY_PARAMETER_OP(AddDotMul,
+                                   TWO_PARAMETER,
                                    a = p1 * a + p2 * b * c);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::addDotMul(BaseMatrixT& b, BaseMatrixT& c, T p1, T p2) {
   applyTernary(ternary::AddDotMul<T>(p1, p2), b, c);
 }
 
 DEFINE_MATRIX_BINARY_OP(Assign, a = b;);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::assign(BaseMatrixT& b) {
   if (useGpu_) {
     applyBinary(binary::Assign<T>(), b);
@@ -1230,7 +1361,7 @@ void BaseMatrixT<T>::assign(BaseMatrixT& b) {
   }
 }
 
-template<class T>
+template <class T>
 void BaseMatrixT<T>::assignAtOffset(BaseMatrixT& b, int64_t columnOffset) {
   if (columnOffset + b.width_ <= width_) {
     int numRows = height_;
@@ -1250,24 +1381,31 @@ void BaseMatrixT<T>::assignAtOffset(BaseMatrixT& b, int64_t columnOffset) {
 }
 
 DEFINE_MATRIX_BINARY_OP(DeepSwap, T tmp = a; a = b; b = tmp);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::deepSwap(BaseMatrixT& b) {
-    applyBinary(binary::DeepSwap<T>(), b);
+  applyBinary(binary::DeepSwap<T>(), b);
 }
 
-template<>
+template <>
 void BaseMatrixT<real>::rowDotMul(size_t destCol,
                                   BaseMatrixT& b,
                                   BaseMatrixT& c) {
   int numRows = b.height_;
   int numCols = b.width_;
   MatrixOffset offset(destCol, 0, 0, 0, 0, 0);
-  aggregate(aggregate::sum(), base::binary::mul(), base::binary::add(), b, c,
-            numRows, numCols, offset, false_type(),
+  aggregate(aggregate::sum(),
+            base::binary::mul(),
+            base::binary::add(),
+            b,
+            c,
+            numRows,
+            numCols,
+            offset,
+            false_type(),
             true_type() /*aAsColVector*/);
 }
 
-template<class T>
+template <class T>
 void BaseMatrixT<T>::rowDotMul2(size_t destCol,
                                 BaseMatrixT& b,
                                 BaseMatrixT& c) {
@@ -1290,17 +1428,24 @@ void BaseMatrixT<T>::rowDotMul2(size_t destCol,
   }
 }
 
-template<>
+template <>
 void BaseMatrixT<real>::addDotMulVMM(BaseMatrixT& b, BaseMatrixT& c) {
   MatrixOffset offset(0, 0, 0, 0, 0, 0);
   int numRows = b.height_;
   int numCols = b.width_;
-  aggregate(aggregate::sum(), base::binary::mul(), base::binary::add(), b, c,
-            numRows, numCols, offset, true_type() /*aAsRowVector*/,
+  aggregate(aggregate::sum(),
+            base::binary::mul(),
+            base::binary::add(),
+            b,
+            c,
+            numRows,
+            numCols,
+            offset,
+            true_type() /*aAsRowVector*/,
             false_type());
 }
 
-template<class T>
+template <class T>
 void BaseMatrixT<T>::addDotMulVMM2(BaseMatrixT& b, BaseMatrixT& c) {
   CHECK(!useGpu_) << "do not support gpu";
 
@@ -1321,16 +1466,22 @@ void BaseMatrixT<T>::addDotMulVMM2(BaseMatrixT& b, BaseMatrixT& c) {
 }
 
 DEFINE_MATRIX_TERNARY_OP(addDotMulMMV, a += b * c);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::addDotMulMMV(BaseMatrixT& b, BaseMatrixT& c) {
   MatrixOffset offset(0, 0, 0, 0, 0, 0);
   int numRows = height_;
   int numCols = width_;
-  applyTernary(ternary::addDotMulMMV<T>(), b, c, numRows, numCols, offset,
-               true_type() /*cAsRowVector*/, false_type());
+  applyTernary(ternary::addDotMulMMV<T>(),
+               b,
+               c,
+               numRows,
+               numCols,
+               offset,
+               true_type() /*cAsRowVector*/,
+               false_type());
 }
 
-template<class T>
+template <class T>
 void BaseMatrixT<T>::addDotMulMMV2(BaseMatrixT& b, BaseMatrixT& c) {
   CHECK(!useGpu_) << "do not support gpu";
 
@@ -1350,16 +1501,22 @@ void BaseMatrixT<T>::addDotMulMMV2(BaseMatrixT& b, BaseMatrixT& c) {
   }
 }
 
-template<class T>
+template <class T>
 void BaseMatrixT<T>::rowScale(size_t cCol, BaseMatrixT& b, BaseMatrixT& c) {
   MatrixOffset offset(0, 0, 0, 0, cCol, 0);
   int numRows = height_;
   int numCols = width_;
-  applyTernary(ternary::DotMul<T>(), b, c, numRows, numCols, offset,
-    false_type(), true_type() /*cAsColVector*/);
+  applyTernary(ternary::DotMul<T>(),
+               b,
+               c,
+               numRows,
+               numCols,
+               offset,
+               false_type(),
+               true_type() /*cAsColVector*/);
 }
 
-template<class T>
+template <class T>
 void BaseMatrixT<T>::rowScale2(size_t cCol, BaseMatrixT& b, BaseMatrixT& c) {
   CHECK(!useGpu_) << "do not support gpu";
 
@@ -1379,52 +1536,82 @@ void BaseMatrixT<T>::rowScale2(size_t cCol, BaseMatrixT& b, BaseMatrixT& c) {
   }
 }
 
-template<class T>
+template <class T>
 void BaseMatrixT<T>::colScale(size_t cRow, BaseMatrixT& b, BaseMatrixT& c) {
   MatrixOffset offset(0, 0, 0, 0, 0, cRow);
   int numRows = height_;
   int numCols = width_;
-  applyTernary(ternary::DotMul<T>(), b, c, numRows, numCols, offset,
-               true_type() /* cAsRowVector */, false_type() /* cAsColVector */);
+  applyTernary(ternary::DotMul<T>(),
+               b,
+               c,
+               numRows,
+               numCols,
+               offset,
+               true_type() /* cAsRowVector */,
+               false_type() /* cAsColVector */);
 }
 
-template<class T>
+template <class T>
 void BaseMatrixT<T>::addColScale(size_t cRow, BaseMatrixT& b, BaseMatrixT& c) {
   MatrixOffset offset(0, 0, 0, 0, 0, cRow);
   int numRows = height_;
   int numCols = width_;
-  applyTernary(ternary::addDotMulMMV<T>(), b, c, numRows, numCols, offset,
-               true_type() /* cAsRowVector */, false_type() /* cAsColVector */);
+  applyTernary(ternary::addDotMulMMV<T>(),
+               b,
+               c,
+               numRows,
+               numCols,
+               offset,
+               true_type() /* cAsRowVector */,
+               false_type() /* cAsColVector */);
 }
 
-template<class T>
+template <class T>
 void BaseMatrixT<T>::addRowScale(size_t cCol, BaseMatrixT& b, BaseMatrixT& c) {
   MatrixOffset offset(0, 0, 0, 0, cCol, 0);
   int numRows = height_;
   int numCols = width_;
-  applyTernary(ternary::addDotMulMMV<T>(), b, c, numRows, numCols, offset,
-               false_type(), true_type() /*cAsColVector*/);
+  applyTernary(ternary::addDotMulMMV<T>(),
+               b,
+               c,
+               numRows,
+               numCols,
+               offset,
+               false_type(),
+               true_type() /*cAsColVector*/);
 }
 
 DEFINE_MATRIX_TERNARY_PARAMETER_OP(RowAdd, ONE_PARAMETER, a = b + p * c);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::rowAdd(size_t cCol, BaseMatrixT& b, BaseMatrixT& c, T p) {
   MatrixOffset offset(0, 0, 0, 0, cCol, 0);
   int numRows = height_;
   int numCols = width_;
-  applyTernary(ternary::RowAdd<T>(p), b, c, numRows, numCols, offset,
-    false_type(), true_type() /*cAsColVector*/);
+  applyTernary(ternary::RowAdd<T>(p),
+               b,
+               c,
+               numRows,
+               numCols,
+               offset,
+               false_type(),
+               true_type() /*cAsColVector*/);
 }
 
 DEFINE_MATRIX_TERNARY_OP(RowPow, a = pow(b, c));
-template<>
+template <>
 void BaseMatrixT<real>::rowPow(size_t cCol, BaseMatrixT& b, BaseMatrixT& c) {
   if (useGpu_) {
     MatrixOffset offset(0, 0, 0, 0, cCol, 0);
     int numRows = height_;
     int numCols = width_;
-    applyTernary(ternary::RowPow<real>(), b, c, numRows, numCols, offset,
-                 false_type(), true_type() /*cAsColVector*/);
+    applyTernary(ternary::RowPow<real>(),
+                 b,
+                 c,
+                 numRows,
+                 numCols,
+                 offset,
+                 false_type(),
+                 true_type() /*cAsColVector*/);
   } else {
     size_t height = this->height_;
     size_t width = this->width_;
@@ -1441,44 +1628,64 @@ void BaseMatrixT<real>::rowPow(size_t cCol, BaseMatrixT& b, BaseMatrixT& c) {
   }
 }
 
-template<class T>
+template <class T>
 void BaseMatrixT<T>::mulRowVector(BaseMatrixT& b) {
   MatrixOffset offset(0, 0, 0, 0);
   int numRows = height_;
   int numCols = width_;
-  applyBinary(binary::DotMul<T>(), b, numRows, numCols, offset,
-              true_type() /* bAsRowVector */, false_type());
+  applyBinary(binary::DotMul<T>(),
+              b,
+              numRows,
+              numCols,
+              offset,
+              true_type() /* bAsRowVector */,
+              false_type());
 }
 
 DEFINE_MATRIX_BINARY_OP(DotDiv, a /= b);
-template<class T>
+template <class T>
 void BaseMatrixT<T>::divRowVector(BaseMatrixT& b) {
   MatrixOffset offset(0, 0, 0, 0);
   int numRows = height_;
   int numCols = width_;
-  applyBinary(binary::DotDiv<T>(), b, numRows, numCols, offset,
-              true_type() /* bAsRowVector */, false_type());
+  applyBinary(binary::DotDiv<T>(),
+              b,
+              numRows,
+              numCols,
+              offset,
+              true_type() /* bAsRowVector */,
+              false_type());
 }
 
-template<class T>
+template <class T>
 void BaseMatrixT<T>::mulColVector(BaseMatrixT& b) {
   MatrixOffset offset(0, 0, 0, 0);
   int numRows = height_;
   int numCols = width_;
-  applyBinary(binary::DotMul<T>(), b, numRows, numCols, offset,
-              false_type(), true_type() /* bAsColVector */);
+  applyBinary(binary::DotMul<T>(),
+              b,
+              numRows,
+              numCols,
+              offset,
+              false_type(),
+              true_type() /* bAsColVector */);
 }
 
-template<class T>
+template <class T>
 void BaseMatrixT<T>::divColVector(BaseMatrixT& b) {
   MatrixOffset offset(0, 0, 0, 0);
   int numRows = height_;
   int numCols = width_;
-  applyBinary(binary::DotDiv<T>(), b, numRows, numCols, offset,
-              false_type(), true_type() /* bAsColVector */);
+  applyBinary(binary::DotDiv<T>(),
+              b,
+              numRows,
+              numCols,
+              offset,
+              false_type(),
+              true_type() /* bAsColVector */);
 }
 
-template<>
+template <>
 template <class Agg>
 int BaseMatrixT<real>::applyRow(Agg agg, BaseMatrixT& b) {
   MatrixOffset offset(0, 0, 0, 0, 0, 0);
@@ -1486,13 +1693,20 @@ int BaseMatrixT<real>::applyRow(Agg agg, BaseMatrixT& b) {
   size_t numCols = b.width_;
   CHECK_EQ(height_, numRows);
   CHECK_EQ(width_, 1UL);
-  aggregate(agg, base::unary::identity(), base::binary::second(), b, numRows,
-            numCols, offset, false_type(), true_type() /*aAsColVector*/);
+  aggregate(agg,
+            base::unary::identity(),
+            base::binary::second(),
+            b,
+            numRows,
+            numCols,
+            offset,
+            false_type(),
+            true_type() /*aAsColVector*/);
 
   return 0;
 }
 
-template<>
+template <>
 template <class Agg, class Saver>
 int BaseMatrixT<real>::applyRow(Agg agg, Saver sv, BaseMatrixT& b) {
   MatrixOffset offset(0, 0, 0, 0, 0, 0);
@@ -1500,16 +1714,25 @@ int BaseMatrixT<real>::applyRow(Agg agg, Saver sv, BaseMatrixT& b) {
   size_t numCols = b.width_;
   CHECK_EQ(height_, numRows);
   CHECK_EQ(width_, 1UL);
-  aggregate(agg, base::unary::identity(), sv, b, numRows, numCols, offset,
-            false_type(), true_type() /*aAsColVector*/);
+  aggregate(agg,
+            base::unary::identity(),
+            sv,
+            b,
+            numRows,
+            numCols,
+            offset,
+            false_type(),
+            true_type() /*aAsColVector*/);
 
   return 0;
 }
 
-template<>
+template <>
 template <class Agg>
-int BaseMatrixT<real>::applyRow(
-     Agg agg, real scaleDest, real scaleAgg, BaseMatrixT& b) {
+int BaseMatrixT<real>::applyRow(Agg agg,
+                                real scaleDest,
+                                real scaleAgg,
+                                BaseMatrixT& b) {
   if (scaleDest != 0) {
     applyRow(agg, base::binary::add2(scaleDest, scaleAgg), b);
   } else {
@@ -1521,10 +1744,10 @@ int BaseMatrixT<real>::applyRow(
   return 0;
 }
 
-template<>
+template <>
 template <class Agg, class Op, class Saver>
-int BaseMatrixT<real>::applyRow(Agg agg, Op op, Saver sv,
-                                BaseMatrixT& b, BaseMatrixT& c) {
+int BaseMatrixT<real>::applyRow(
+    Agg agg, Op op, Saver sv, BaseMatrixT& b, BaseMatrixT& c) {
   MatrixOffset offset(0, 0, 0, 0, 0, 0);
   size_t numRows = b.height_;
   size_t numCols = b.width_;
@@ -1532,16 +1755,27 @@ int BaseMatrixT<real>::applyRow(Agg agg, Op op, Saver sv,
   CHECK_EQ(width_, 1UL);
   CHECK_EQ(c.height_, numRows);
   CHECK_EQ(c.width_, numCols);
-  aggregate(agg, op, sv,
-            b, c, numRows, numCols, offset,
-            false_type(), true_type() /*aAsColVector*/);
+  aggregate(agg,
+            op,
+            sv,
+            b,
+            c,
+            numRows,
+            numCols,
+            offset,
+            false_type(),
+            true_type() /*aAsColVector*/);
   return 0;
 }
 
-template<>
+template <>
 template <class Agg, class Op>
-int BaseMatrixT<real>::applyRow(Agg agg, Op op, real scaleDest, real scaleAgg,
-                                BaseMatrixT& b, BaseMatrixT& c) {
+int BaseMatrixT<real>::applyRow(Agg agg,
+                                Op op,
+                                real scaleDest,
+                                real scaleAgg,
+                                BaseMatrixT& b,
+                                BaseMatrixT& c) {
   if (scaleDest != 0) {
     applyRow(agg, op, base::binary::add2(scaleDest, scaleAgg), b, c);
   } else {
@@ -1553,7 +1787,7 @@ int BaseMatrixT<real>::applyRow(Agg agg, Op op, real scaleDest, real scaleAgg,
   return 0;
 }
 
-template<>
+template <>
 template <class Agg>
 int BaseMatrixT<real>::applyCol(Agg agg, BaseMatrixT& b) {
   MatrixOffset offset(0, 0, 0, 0, 0, 0);
@@ -1561,13 +1795,20 @@ int BaseMatrixT<real>::applyCol(Agg agg, BaseMatrixT& b) {
   size_t numCols = b.width_;
   CHECK_EQ(width_, numCols);
   CHECK_EQ(height_, 1UL);
-  aggregate(agg, base::unary::identity(), base::binary::second(), b, numRows,
-            numCols, offset, true_type() /*aAsRowVector*/, false_type());
+  aggregate(agg,
+            base::unary::identity(),
+            base::binary::second(),
+            b,
+            numRows,
+            numCols,
+            offset,
+            true_type() /*aAsRowVector*/,
+            false_type());
 
   return 0;
 }
 
-template<>
+template <>
 template <class Agg, class Saver>
 int BaseMatrixT<real>::applyCol(Agg agg, Saver sv, BaseMatrixT& b) {
   MatrixOffset offset(0, 0, 0, 0, 0, 0);
@@ -1575,16 +1816,25 @@ int BaseMatrixT<real>::applyCol(Agg agg, Saver sv, BaseMatrixT& b) {
   size_t numCols = b.width_;
   CHECK_EQ(width_, numCols);
   CHECK_EQ(height_, 1UL);
-  aggregate(agg, base::unary::identity(), sv, b, numRows, numCols, offset,
-            true_type() /*aAsRowVector*/, false_type());
+  aggregate(agg,
+            base::unary::identity(),
+            sv,
+            b,
+            numRows,
+            numCols,
+            offset,
+            true_type() /*aAsRowVector*/,
+            false_type());
 
   return 0;
 }
 
-template<>
+template <>
 template <class Agg>
-int BaseMatrixT<real>::applyCol(
-     Agg agg, real scaleDest, real scaleAgg, BaseMatrixT& b) {
+int BaseMatrixT<real>::applyCol(Agg agg,
+                                real scaleDest,
+                                real scaleAgg,
+                                BaseMatrixT& b) {
   if (scaleDest != 0) {
     applyCol(agg, base::binary::add2(scaleDest, scaleAgg), b);
   } else {
@@ -1596,48 +1846,51 @@ int BaseMatrixT<real>::applyCol(
   return 0;
 }
 
-template<>
+template <>
 void BaseMatrixT<real>::sumRows(BaseMatrixT& b, real scaleSum, real scaleDest) {
   applyRow(aggregate::sum(), scaleDest, scaleSum, b);
 }
 
-template<>
+template <>
 void BaseMatrixT<real>::maxRows(BaseMatrixT& b) {
   applyRow(aggregate::max(), b);
 }
 
-template<>
+template <>
 void BaseMatrixT<real>::minRows(BaseMatrixT& b) {
   applyRow(aggregate::min(), b);
 }
 
-template<>
+template <>
 void BaseMatrixT<real>::maxCols(BaseMatrixT& b) {
   applyCol(aggregate::max(), b);
 }
 
-template<>
+template <>
 void BaseMatrixT<real>::minCols(BaseMatrixT& b) {
   applyCol(aggregate::min(), b);
 }
 
-template<>
+template <>
 void BaseMatrixT<real>::sumCols(BaseMatrixT& b, real scaleSum, real scaleDest) {
   applyCol(aggregate::sum(), scaleDest, scaleSum, b);
 }
 
-template<>
-void BaseMatrixT<real>::sumOfSquaredDiffs(
-    BaseMatrixT& b, BaseMatrixT& c, real scaleSum, real scaleDest) {
-  applyRow(aggregate::sum(), base::binary::squaredDiff(),
-           scaleDest, scaleSum, b, c);
+template <>
+void BaseMatrixT<real>::sumOfSquaredDiffs(BaseMatrixT& b,
+                                          BaseMatrixT& c,
+                                          real scaleSum,
+                                          real scaleDest) {
+  applyRow(
+      aggregate::sum(), base::binary::squaredDiff(), scaleDest, scaleSum, b, c);
 }
 
-template<>
-void BaseMatrixT<real>::sumOfProducts(
-    BaseMatrixT& b, BaseMatrixT& c, real scaleSum, real scaleDest) {
-  applyRow(aggregate::sum(), base::binary::mul(),
-           scaleDest, scaleSum, b, c);
+template <>
+void BaseMatrixT<real>::sumOfProducts(BaseMatrixT& b,
+                                      BaseMatrixT& c,
+                                      real scaleSum,
+                                      real scaleDest) {
+  applyRow(aggregate::sum(), base::binary::mul(), scaleDest, scaleSum, b, c);
 }
 
 template class BaseMatrixT<real>;

From 133541ee41624e8b25b885fb1a2f11cbdd17299e Mon Sep 17 00:00:00 2001
From: Yu Yang <yuyang18@baidu.com>
Date: Thu, 3 Aug 2017 15:00:21 +0800
Subject: [PATCH 08/36] Merge codes

---
 python/paddle/v2/framework/tests/gradient_checker.py | 11 +++++------
 1 file changed, 5 insertions(+), 6 deletions(-)

diff --git a/python/paddle/v2/framework/tests/gradient_checker.py b/python/paddle/v2/framework/tests/gradient_checker.py
index 0ee7e8fb49..4022de1c40 100644
--- a/python/paddle/v2/framework/tests/gradient_checker.py
+++ b/python/paddle/v2/framework/tests/gradient_checker.py
@@ -10,7 +10,7 @@ def get_numeric_gradient(op,
                          input_values,
                          output_name,
                          input_to_check,
-                         delta=1e-5,
+                         delta=1e-2,
                          local_scope=None):
     """
     Get Numeric Gradient for an operator's input.
@@ -34,8 +34,8 @@ def get_numeric_gradient(op,
         var = local_scope.new_var(var_name)
         tensor = var.get_tensor()
         tensor.set_dims(input_values[var_name].shape)
-        tensor.alloc_float()
-        tensor.set(input_values[var_name])
+        tensor.alloc_float(core.CPUPlace())
+        tensor.set(input_values[var_name], core.CPUPlace())
 
     # Create all output variable in local_scope
     for output in op.outputs():
@@ -46,10 +46,10 @@ def get_numeric_gradient(op,
 
     # allocate output memory
     for output in op.outputs():
-        local_scope.find_var(output).get_tensor().alloc_float()
+        local_scope.find_var(output).get_tensor().alloc_float(core.CPUPlace())
 
     # TODO(yuyang18): Only CPU is support now.
-    cpu_ctx = core.DeviceContext.cpu_context()
+    cpu_ctx = core.DeviceContext.create(core.CPUPlace())
 
     def get_output():
         op.run(local_scope, cpu_ctx)
@@ -85,7 +85,6 @@ if __name__ == '__main__':
             y = numpy.random.random((10, 1)).astype("float32")
 
             arr = get_numeric_gradient(add_op, {'X': x, "Y": y}, 'Z', 'X')
-
             self.assertAlmostEqual(arr.mean(), 1.0, delta=1e-2)
 
     unittest.main()

From ddb29b6ca6a65dcb7505034fde0d23e466554928 Mon Sep 17 00:00:00 2001
From: Yi Wang <yi.wang.2005@gmail.com>
Date: Thu, 3 Aug 2017 14:19:59 -0700
Subject: [PATCH 09/36] Move constants from framework::OperatorBase to
 framework::

---
 paddle/framework/backward.cc        | 18 +++----
 paddle/framework/backward_test.cc   | 78 ++++++++++++++---------------
 paddle/framework/grad_op_builder.cc |  6 +--
 paddle/framework/op_registry.h      |  2 +-
 paddle/framework/operator.h         | 40 ++++++++-------
 paddle/framework/pybind.cc          |  4 +-
 paddle/operators/fc_op.cc           |  2 +-
 paddle/operators/mean_op.cc         |  2 +-
 paddle/operators/mean_op.h          |  4 +-
 paddle/operators/softmax_op.cc      |  6 +--
 paddle/operators/softmax_op.h       |  4 +-
 11 files changed, 84 insertions(+), 82 deletions(-)

diff --git a/paddle/framework/backward.cc b/paddle/framework/backward.cc
index c034e265fe..d5e41b7b7e 100644
--- a/paddle/framework/backward.cc
+++ b/paddle/framework/backward.cc
@@ -59,7 +59,7 @@ std::shared_ptr<OperatorBase> BackwardRecursive(
   //  If all input gradients of forwarding operator do not need to calculate,
   //  just return an NOP. Not return null ptr because NOP does not take
   //  too much time for calculation, but it is useful for simplifying logic.
-  if (AllInSet(forwardOp.inputs_, OperatorBase::GRAD_VAR_SUFFIX(),
+  if (AllInSet(forwardOp.inputs_, kGradVarSuffix,
                no_grad_names)) {
     return NOP();
   }
@@ -67,11 +67,11 @@ std::shared_ptr<OperatorBase> BackwardRecursive(
   //  All output gradients of forwarding operator do not need to calculate.
   //  Then all input gradients cannot be computed at all, and we put them into
   //  `no_grad_names` set. Return an NOP.
-  if (AllInSet(forwardOp.outputs_, OperatorBase::GRAD_VAR_SUFFIX(),
+  if (AllInSet(forwardOp.outputs_, kGradVarSuffix,
                no_grad_names)) {
     for (auto& name : forwardOp.inputs_) {
       // Mark all input is not need
-      no_grad_names.insert(name + OperatorBase::GRAD_VAR_SUFFIX());
+      no_grad_names.insert(name + kGradVarSuffix);
     }
     return NOP();
   }
@@ -135,8 +135,8 @@ std::shared_ptr<OperatorBase> BackwardRecursive(
     for (std::string& grad_input : grad_op->inputs_) {
       if (no_grad_names.count(grad_input)) {
         std::string prefix = grad_input.substr(
-            0, grad_input.size() - OperatorBase::GRAD_VAR_SUFFIX().size());
-        grad_input = prefix + OperatorBase::ZERO_VAR_SUFFIX();
+            0, grad_input.size() - kGradVarSuffix.size());
+        grad_input = prefix + kZeroVarSuffix;
 
         // If part of input gradient of that operator is not calculated, fill
         // zero variables to that input gradient.
@@ -147,7 +147,7 @@ std::shared_ptr<OperatorBase> BackwardRecursive(
 
     for (std::string& grad_output : grad_op->outputs_) {
       if (no_grad_names.count(grad_output)) {
-        grad_output = OperatorBase::EMPTY_VAR_NAME();
+        grad_output = kEmptyVarName;
       }
     }
 
@@ -168,11 +168,11 @@ std::shared_ptr<OperatorBase> Backward(
   std::unordered_set<std::string> no_grad_names;
   no_grad_names.reserve(no_grad_vars.size());
 
-  no_grad_names.insert(OperatorBase::EMPTY_VAR_NAME() +
-                       OperatorBase::GRAD_VAR_SUFFIX());
+  no_grad_names.insert(kEmptyVarName +
+                       kGradVarSuffix);
 
   for (auto& name : no_grad_vars) {
-    no_grad_names.insert(name + OperatorBase::GRAD_VAR_SUFFIX());
+    no_grad_names.insert(name + kGradVarSuffix);
   }
   size_t uid = 0;
   return BackwardRecursive(forwardOp, no_grad_names, uid);
diff --git a/paddle/framework/backward_test.cc b/paddle/framework/backward_test.cc
index 8f437e6804..061bf1063f 100644
--- a/paddle/framework/backward_test.cc
+++ b/paddle/framework/backward_test.cc
@@ -78,14 +78,14 @@ class FcOp : public ops::NetOp {
                                {Output("mul_result")}, {}));
     auto b_name = Input("b");
     std::string before_act = "mul_result";
-    if (b_name != EMPTY_VAR_NAME()) {
+    if (b_name != kEmptyVarName) {
       AddOp(OpRegistry::CreateOp("rowwise_add", {Output("mul_result"), b_name},
                                  {Output("add_result")}, {}));
       before_act = "add_result";
     } else {
       auto out_varname = Output("add_result");
-      if (out_varname != EMPTY_VAR_NAME()) {
-        this->Rename(out_varname, EMPTY_VAR_NAME());
+      if (out_varname != kEmptyVarName) {
+        this->Rename(out_varname, kEmptyVarName);
       }
     }
 
@@ -163,13 +163,13 @@ TEST(Backward, simple_op_grad) {
   ASSERT_NE(fwd, nullptr);
   auto gop = f::OpRegistry::CreateGradOp(*fwd);
   ASSERT_EQ(4UL, gop->inputs_.size());
-  ASSERT_EQ(f::OperatorBase::EMPTY_VAR_NAME(), gop->inputs_[0]);
+  ASSERT_EQ(f::kEmptyVarName, gop->inputs_[0]);
   ASSERT_EQ("rowwise_add_grad", gop->type_);
-  ASSERT_EQ("X" + f::OperatorBase::GRAD_VAR_SUFFIX(), gop->outputs_[0]);
-  ASSERT_EQ("b" + f::OperatorBase::GRAD_VAR_SUFFIX(), gop->outputs_[1]);
+  ASSERT_EQ("X" + f::kGradVarSuffix, gop->outputs_[0]);
+  ASSERT_EQ("b" + f::kGradVarSuffix, gop->outputs_[1]);
 
-  ASSERT_EQ("X" + f::OperatorBase::GRAD_VAR_SUFFIX(),
-            gop->Output("X" + f::OperatorBase::GRAD_VAR_SUFFIX()));
+  ASSERT_EQ("X" + f::kGradVarSuffix,
+            gop->Output("X" + f::kGradVarSuffix));
 }
 
 TEST(Backward, simple_op_not_need_grad) {
@@ -177,7 +177,7 @@ TEST(Backward, simple_op_not_need_grad) {
   ASSERT_NE(fwd, nullptr);
   auto gop = f::Backward(*fwd, {"X"});
   ASSERT_EQ(std::find(gop->outputs_.begin(), gop->outputs_.end(),
-                      "X" + f::OperatorBase::GRAD_VAR_SUFFIX()),
+                      "X" + f::kGradVarSuffix),
             gop->outputs_.end());
 
   auto no_input_gop = f::Backward(*fwd, {"X", "b"});
@@ -211,7 +211,7 @@ TEST(Backward, net_fc_backward_normal) {
 
 TEST(Backward, net_fc_backward_not_have_b) {
   std::shared_ptr<f::OperatorBase> fwd = f::OpRegistry::CreateOp(
-      "fc", {"X", "w", f::OperatorBase::EMPTY_VAR_NAME()},
+      "fc", {"X", "w", f::kEmptyVarName},
       {"mul_result", "add_result", "tmp"}, {});
   ASSERT_NE(fwd, nullptr);
   std::shared_ptr<f::OperatorBase> gop = f::Backward(*fwd, {});
@@ -242,15 +242,15 @@ TEST(Backward, net_input_of_network_not_need_grad) {
 
   std::unordered_set<std::string> all_output = std::unordered_set<std::string>(
       bwd_net->outputs_.begin(), bwd_net->outputs_.end());
-  all_output.erase(f::OperatorBase::EMPTY_VAR_NAME());
+  all_output.erase(f::kEmptyVarName);
 
   for (auto &out : {"W1", "b1", "hidden0", "W2", "b2"}) {
-    ASSERT_NE(all_output.find(out + f::OperatorBase::GRAD_VAR_SUFFIX()),
+    ASSERT_NE(all_output.find(out + f::kGradVarSuffix),
               all_output.end());
   }
 
   // Not Generated X
-  ASSERT_EQ(all_output.find("X" + f::OperatorBase::GRAD_VAR_SUFFIX()),
+  ASSERT_EQ(all_output.find("X" + f::kGradVarSuffix),
             all_output.end());
 
   ASSERT_EQ(2UL, bwd_net->ops_.size());
@@ -258,8 +258,8 @@ TEST(Backward, net_input_of_network_not_need_grad) {
   auto first_fc_grad = static_cast<ops::NetOp *>(bwd_net->ops_[1].get());
   ASSERT_EQ(3UL, first_fc_grad->ops_.size());
   ASSERT_EQ(
-      f::OperatorBase::EMPTY_VAR_NAME(),
-      first_fc_grad->ops_[2]->Output("A" + f::OperatorBase::GRAD_VAR_SUFFIX()));
+      f::kEmptyVarName,
+      first_fc_grad->ops_[2]->Output("A" + f::kGradVarSuffix));
 }
 
 TEST(Backward, net_shared_weight) {
@@ -311,17 +311,17 @@ TEST(Backward, op_part_of_output_are_not_need) {
   ASSERT_EQ(1UL, fill_zero.inputs_.size());
   ASSERT_EQ("Z", fill_zero.inputs_[0]);
   ASSERT_EQ(1UL, fill_zero.outputs_.size());
-  ASSERT_EQ("Z" + f::OperatorBase::ZERO_VAR_SUFFIX(), fill_zero.outputs_[0]);
+  ASSERT_EQ("Z" + f::kZeroVarSuffix, fill_zero.outputs_[0]);
 
   auto &d_many_out = *net->ops_[1];
   ASSERT_EQ("many_output_op_grad", d_many_out.type_);
   ASSERT_EQ(1UL + 2UL + 2UL, d_many_out.inputs_.size());  // I/O/OG
-  ASSERT_EQ("Z" + f::OperatorBase::ZERO_VAR_SUFFIX(),
-            d_many_out.Input("z" + f::OperatorBase::GRAD_VAR_SUFFIX()));
-  ASSERT_EQ("Y" + f::OperatorBase::GRAD_VAR_SUFFIX(),
-            d_many_out.Input("y" + f::OperatorBase::GRAD_VAR_SUFFIX()));
-  ASSERT_EQ("X" + f::OperatorBase::GRAD_VAR_SUFFIX(),
-            d_many_out.Output("x" + f::OperatorBase::GRAD_VAR_SUFFIX()));
+  ASSERT_EQ("Z" + f::kZeroVarSuffix,
+            d_many_out.Input("z" + f::kGradVarSuffix));
+  ASSERT_EQ("Y" + f::kGradVarSuffix,
+            d_many_out.Input("y" + f::kGradVarSuffix));
+  ASSERT_EQ("X" + f::kGradVarSuffix,
+            d_many_out.Output("x" + f::kGradVarSuffix));
 }
 
 TEST(Backward, op_part_of_input_are_not_need) {
@@ -331,12 +331,12 @@ TEST(Backward, op_part_of_input_are_not_need) {
   ASSERT_EQ(grad_mul.type_, "mul_grad");
   ASSERT_EQ(grad_mul.inputs_.size(), 2UL + 1UL + 1UL);
   ASSERT_EQ(grad_mul.outputs_.size(), 2UL);
-  ASSERT_EQ(grad_mul.Output("A" + f::OperatorBase::GRAD_VAR_SUFFIX()),
-            f::OperatorBase::EMPTY_VAR_NAME());
-  ASSERT_EQ(grad_mul.Output("B" + f::OperatorBase::GRAD_VAR_SUFFIX()),
-            "b" + f::OperatorBase::GRAD_VAR_SUFFIX());
-  ASSERT_EQ(grad_mul.Input("Out" + f::OperatorBase::GRAD_VAR_SUFFIX()),
-            "out" + f::OperatorBase::GRAD_VAR_SUFFIX());
+  ASSERT_EQ(grad_mul.Output("A" + f::kGradVarSuffix),
+            f::kEmptyVarName);
+  ASSERT_EQ(grad_mul.Output("B" + f::kGradVarSuffix),
+            "b" + f::kGradVarSuffix);
+  ASSERT_EQ(grad_mul.Input("Out" + f::kGradVarSuffix),
+            "out" + f::kGradVarSuffix);
   ASSERT_EQ(grad_mul.Input("A"), "a");
   ASSERT_EQ(grad_mul.Input("B"), "b");
   ASSERT_EQ(grad_mul.Input("Out"), "out");
@@ -370,17 +370,17 @@ TEST(Backward, linear_net_intermediate_variable_has_no_grad) {
   EXPECT_EQ(bwd_net->ops_[2]->outputs_.size(), 0UL);
 
   /*
-    EXPECT_EQ(grad_fc.Output("X" + f::OperatorBase::GRAD_VAR_SUFFIX()),
-              f::OperatorBase::EMPTY_VAR_NAME());
-  EXPECT_EQ(grad_fc.Output("W" + f::OperatorBase::GRAD_VAR_SUFFIX()),
-    "w3" + f::OperatorBase::GRAD_VAR_SUFFIX());
-  EXPECT_EQ(grad_fc.Output("b" + f::OperatorBase::GRAD_VAR_SUFFIX()),
-    "b3" + f::OperatorBase::GRAD_VAR_SUFFIX());
-  EXPECT_EQ(grad_fc.Output("mul_result" + f::OperatorBase::GRAD_VAR_SUFFIX()),
-  "mul_out3" + f::OperatorBase::GRAD_VAR_SUFFIX());
-
-  EXPECT_EQ(grad_fc.Input("Out" + f::OperatorBase::GRAD_VAR_SUFFIX()),
-  "out3" + f::OperatorBase::GRAD_VAR_SUFFIX());
+    EXPECT_EQ(grad_fc.Output("X" + f::kGradVarSuffix),
+              f::kEmptyVarName);
+  EXPECT_EQ(grad_fc.Output("W" + f::kGradVarSuffix),
+    "w3" + f::kGradVarSuffix);
+  EXPECT_EQ(grad_fc.Output("b" + f::kGradVarSuffix),
+    "b3" + f::kGradVarSuffix);
+  EXPECT_EQ(grad_fc.Output("mul_result" + f::kGradVarSuffix),
+  "mul_out3" + f::kGradVarSuffix);
+
+  EXPECT_EQ(grad_fc.Input("Out" + f::kGradVarSuffix),
+  "out3" + f::kGradVarSuffix);
   EXPECT_EQ(grad_fc.Input("X"), "out2");
   EXPECT_EQ(grad_fc.Input("W"), "w3");
   EXPECT_EQ(grad_fc.Input("mul_result"), "mul_out3");
diff --git a/paddle/framework/grad_op_builder.cc b/paddle/framework/grad_op_builder.cc
index 34722fedf9..f34aaa28c5 100644
--- a/paddle/framework/grad_op_builder.cc
+++ b/paddle/framework/grad_op_builder.cc
@@ -57,7 +57,7 @@ static void TransOpArg(const OperatorBase* src_op, OperatorBase* dst_op,
   for (const auto& arg : src_arg_list) {
     std::string src_name = arg.name();
     std::string dst_name =
-        is_grad ? src_name + OperatorBase::GRAD_VAR_SUFFIX() : src_name;
+        is_grad ? src_name + kGradVarSuffix : src_name;
     (*dst_op->in_out_idxs_)[dst_name] = idx++;
     int src_arg_idx = src_op->in_out_idxs_->at(src_name);
     int src_begin =
@@ -65,9 +65,9 @@ static void TransOpArg(const OperatorBase* src_op, OperatorBase* dst_op,
     int src_end = src_format == nullptr ? src_arg_idx + 1
                                         : src_format->at(src_arg_idx + 1);
     for (int i = src_begin; i < src_end; ++i) {
-      std::string s = is_grad ? src_inout[i] + OperatorBase::GRAD_VAR_SUFFIX()
+      std::string s = is_grad ? src_inout[i] + kGradVarSuffix
                               : arg.ignore_gradient()
-                                    ? OperatorBase::EMPTY_VAR_NAME()
+                                    ? kEmptyVarName
                                     : src_inout[i];
       dst_inout.emplace_back(s);
     }
diff --git a/paddle/framework/op_registry.h b/paddle/framework/op_registry.h
index 9a975185f0..b58e7d34eb 100644
--- a/paddle/framework/op_registry.h
+++ b/paddle/framework/op_registry.h
@@ -341,7 +341,7 @@ class OpRegistry {
   static void GenerateTempVariableName(OperatorBase* op) {
     static std::atomic<size_t> gUniqId(0UL);
     for (auto& outname : op->outputs_) {
-      if (outname == OperatorBase::TMP_VAR_NAME()) {
+      if (outname == kTempVarName) {
         outname += op->type_;
         outname += "@";
         outname += std::to_string(gUniqId.fetch_add(1));
diff --git a/paddle/framework/operator.h b/paddle/framework/operator.h
index 0b58829716..572c1d2b58 100644
--- a/paddle/framework/operator.h
+++ b/paddle/framework/operator.h
@@ -32,9 +32,30 @@ limitations under the License. */
 namespace paddle {
 namespace framework {
 
+/// If a variable is a empty variable, that name will be used.
+const std::string kEmptyVarName = "@EMPTY@";
+
+/// If a variable is a temporary variable, that name will be set in Python,
+/// but it will be convert to a unique name in scope after OpCreator.
+const std::string kTempVarName = "@TEMP@";
+
+/// If a variable's name has a certain suffix, it means that the
+/// variable is the gradient of another varibale.
+/// e.g. Variable "x@GRAD" is the gradient of varibale "x".
+const std::string kGradVarSuffix = "@GRAD";
+
+/// Variables with this suffix are supposed to be filled up with zeros.
+const std::string kZeroVarSuffix =  "@ZERO";
+
+inline std::string GradVarName(const std::string& var_name) {
+  return var_name + kGradVarSuffix;
+}
+
+
 class OperatorBase;
 class InferShapeContext;
 class ExecutionContext;
+
 /**
  * OperatorBase has the basic element that Net will call to do computation.
  * Only CreateOperator from OpRegistry will new Operator directly. User
@@ -43,25 +64,6 @@ class ExecutionContext;
  */
 class OperatorBase {
  public:
-  /// If a variable is a empty variable, that name will be used.
-  static std::string EMPTY_VAR_NAME() { return "@EMPTY@"; }
-
-  /// If a variable is a temporary variable, that name will be set in Python,
-  /// but it will be convert to a unique name in scope after OpCreator.
-  static std::string TMP_VAR_NAME() { return "@TEMP@"; }
-
-  /// If a variable's name has a certain suffix, it means that the
-  /// variable is the gradient of another varibale.
-  /// e.g. Variable "x@GRAD" is the gradient of varibale "x".
-  static std::string GRAD_VAR_SUFFIX() { return "@GRAD"; }
-
-  static std::string GRAD_VAR_NAME(const std::string& name) {
-    return name + GRAD_VAR_SUFFIX();
-  }
-
-  /// Variables with this suffix are supposed to be filled up with zeros.
-  static std::string ZERO_VAR_SUFFIX() { return "@ZERO"; }
-
   virtual ~OperatorBase() {}
 
   template <typename T>
diff --git a/paddle/framework/pybind.cc b/paddle/framework/pybind.cc
index b4f0f3ef7e..70f0e51573 100644
--- a/paddle/framework/pybind.cc
+++ b/paddle/framework/pybind.cc
@@ -154,8 +154,8 @@ All parameter, weight, gradient are variables in Paddle.
   m.def_submodule(
        "var_names",
        "The module will return special predefined variable name in Paddle")
-      .def("empty", OperatorBase::EMPTY_VAR_NAME)
-      .def("temp", OperatorBase::TMP_VAR_NAME);
+      .def("empty", kEmptyVarName)
+      .def("temp", kTempVarName);
   // clang-format off
   py::class_<paddle::platform::DeviceContext>(m, "DeviceContext")
       .def_static("create",
diff --git a/paddle/operators/fc_op.cc b/paddle/operators/fc_op.cc
index 71ceda9587..bd2c70c038 100644
--- a/paddle/operators/fc_op.cc
+++ b/paddle/operators/fc_op.cc
@@ -27,7 +27,7 @@ public:
                                {Output("before_act")},
                                {}));
     auto b = Input("b");
-    if (b != EMPTY_VAR_NAME()) {
+    if (b != framework::kEmptyVarName) {
       AddOp(OpRegistry::CreateOp("rowwise_add",
                                  {Output("before_act"), Input("b")},
                                  {Output("before_act")},
diff --git a/paddle/operators/mean_op.cc b/paddle/operators/mean_op.cc
index 78131b2680..aeef0c0eaf 100644
--- a/paddle/operators/mean_op.cc
+++ b/paddle/operators/mean_op.cc
@@ -41,7 +41,7 @@ public:
 class MeanGradOp : public OperatorWithKernel {
 protected:
   void InferShape(const InferShapeContext &ctx) const override {
-    ctx.Output<Tensor>("X" + GRAD_VAR_SUFFIX())
+    ctx.Output<Tensor>("X" + framework::kGradVarSuffix)
         ->Resize(ctx.Input<Tensor>("X")->dims());
   }
 };
diff --git a/paddle/operators/mean_op.h b/paddle/operators/mean_op.h
index e712dee6a7..267e6d903e 100644
--- a/paddle/operators/mean_op.h
+++ b/paddle/operators/mean_op.h
@@ -39,10 +39,10 @@ template <typename Place, typename T>
 class MeanGradKernel : public OpKernel {
 public:
   void Compute(const ExecutionContext& context) const override {
-    auto OG = context.Input<Tensor>("Out" + OperatorBase::GRAD_VAR_SUFFIX());
+    auto OG = context.Input<Tensor>("Out" + framework::kGradVarSuffix);
     PADDLE_ENFORCE(framework::product(OG->dims()) == 1,
                    "Mean Gradient should be scalar");
-    auto IG = context.Output<Tensor>("X" + OperatorBase::GRAD_VAR_SUFFIX());
+    auto IG = context.Output<Tensor>("X" + framework::kGradVarSuffix);
     IG->mutable_data<T>(context.GetPlace());
 
     T ig_size = (T)framework::product(IG->dims());
diff --git a/paddle/operators/softmax_op.cc b/paddle/operators/softmax_op.cc
index 5cbb96ab75..e0d5e16ca0 100644
--- a/paddle/operators/softmax_op.cc
+++ b/paddle/operators/softmax_op.cc
@@ -48,12 +48,12 @@ protected:
     PADDLE_ENFORCE(ctx.OutputSize() == 1UL,
                    "Output of SoftmaxOpGrad should be 1");
     PADDLE_ENFORCE(ctx.InputVar("Y") != nullptr, "Input(Y) should not be null");
-    PADDLE_ENFORCE(ctx.InputVar(GRAD_VAR_NAME("Y")) != nullptr,
+    PADDLE_ENFORCE(ctx.InputVar(framework::GradVarName("Y")) != nullptr,
                    "Input(Y@GRAD) should not be null");
     PADDLE_ENFORCE(ctx.Input<Tensor>("Y")->dims() ==
-                       ctx.Input<Tensor>(GRAD_VAR_NAME("Y"))->dims(),
+                   ctx.Input<Tensor>(framework::GradVarName("Y"))->dims(),
                    "the shape of Input(0) and Input(1) should be the same");
-    ctx.Output<Tensor>(GRAD_VAR_NAME("X"))
+    ctx.Output<Tensor>(framework::GradVarName("X"))
         ->Resize(ctx.Input<Tensor>("Y")->dims());
   }
 };
diff --git a/paddle/operators/softmax_op.h b/paddle/operators/softmax_op.h
index 13e74a7907..d9f3b2006e 100644
--- a/paddle/operators/softmax_op.h
+++ b/paddle/operators/softmax_op.h
@@ -68,8 +68,8 @@ public:
     std::shared_ptr<Tensor> scale_ = std::make_shared<Tensor>();
 
     auto Y = context.Input<Tensor>("Y");
-    auto dY = context.Input<Tensor>(OperatorBase::GRAD_VAR_NAME("Y"));
-    auto dX = context.Output<Tensor>(OperatorBase::GRAD_VAR_NAME("X"));
+    auto dY = context.Input<Tensor>(framework::GradVarName("Y"));
+    auto dX = context.Output<Tensor>(framework::GradVarName("X"));
     dX->mutable_data<T>(context.GetPlace());
 
     const int batch_size = Y->dims()[0];

From e4aea7fde4559dcb8453741c7681e8f54b0a56df Mon Sep 17 00:00:00 2001
From: Yi Wang <yi.wang.2005@gmail.com>
Date: Thu, 3 Aug 2017 17:33:21 -0700
Subject: [PATCH 10/36] Fix pybind and const type mismatch

---
 paddle/framework/pybind.cc | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/paddle/framework/pybind.cc b/paddle/framework/pybind.cc
index 70f0e51573..1f30cb10f6 100644
--- a/paddle/framework/pybind.cc
+++ b/paddle/framework/pybind.cc
@@ -154,8 +154,8 @@ All parameter, weight, gradient are variables in Paddle.
   m.def_submodule(
        "var_names",
        "The module will return special predefined variable name in Paddle")
-      .def("empty", kEmptyVarName)
-      .def("temp", kTempVarName);
+      .def("empty", []() { return kEmptyVarName; })
+      .def("temp", []() { return kTempVarName; });
   // clang-format off
   py::class_<paddle::platform::DeviceContext>(m, "DeviceContext")
       .def_static("create",

From 8740276d899ea688082b41b8a8e7f0b0d262158c Mon Sep 17 00:00:00 2001
From: Yi Wang <yi.wang.2005@gmail.com>
Date: Thu, 3 Aug 2017 18:08:29 -0700
Subject: [PATCH 11/36] Fix pybind and const type mismatch

---
 paddle/framework/CMakeLists.txt               |  8 ++--
 .../framework/{attr_checker.h => attribute.h} |  9 ++++
 .../{attr_type.proto => attribute.proto}      |  0
 paddle/framework/op_desc.proto                |  2 +-
 paddle/framework/op_proto.proto               |  2 +-
 paddle/framework/op_registry.cc               | 35 ++-------------
 paddle/framework/op_registry.h                | 43 ++-----------------
 paddle/framework/operator.h                   |  2 +-
 8 files changed, 22 insertions(+), 79 deletions(-)
 rename paddle/framework/{attr_checker.h => attribute.h} (95%)
 rename paddle/framework/{attr_type.proto => attribute.proto} (100%)

diff --git a/paddle/framework/CMakeLists.txt b/paddle/framework/CMakeLists.txt
index 9c39430835..7cbd77ec1f 100644
--- a/paddle/framework/CMakeLists.txt
+++ b/paddle/framework/CMakeLists.txt
@@ -12,9 +12,9 @@ cc_test(variable_test SRCS variable_test.cc)
 cc_library(scope SRCS scope.cc)
 cc_test(scope_test SRCS scope_test.cc DEPS scope)
 
-proto_library(attr_type SRCS attr_type.proto)
-proto_library(op_proto SRCS op_proto.proto DEPS attr_type)
-proto_library(op_desc SRCS op_desc.proto DEPS attr_type)
+proto_library(attribute_proto SRCS attribute.proto)
+proto_library(op_proto SRCS op_proto.proto DEPS attribute_proto)
+proto_library(op_desc SRCS op_desc.proto DEPS attribute_proto)
 cc_test(op_proto_test SRCS op_proto_test.cc DEPS op_proto protobuf)
 cc_test(op_desc_test SRCS op_desc_test.cc DEPS op_desc protobuf)
 
@@ -26,7 +26,7 @@ cc_library(op_registry SRCS op_registry.cc DEPS op_desc grad_op_builder)
 cc_test(op_registry_test SRCS op_registry_test.cc DEPS op_registry)
 cc_test(grad_op_builder_test SRCS grad_op_builder_test.cc DEPS grad_op_builder op_registry add_op)
 
-py_proto_compile(framework_py_proto SRCS attr_type.proto op_proto.proto op_desc.proto)
+py_proto_compile(framework_py_proto SRCS attribute.proto op_proto.proto op_desc.proto)
 # Generate an empty __init__.py to make framework_py_proto as a valid python module.
 add_custom_target(framework_py_proto_init ALL COMMAND ${CMAKE_COMMAND} -E touch __init__.py)
 add_dependencies(framework_py_proto framework_py_proto_init)
diff --git a/paddle/framework/attr_checker.h b/paddle/framework/attribute.h
similarity index 95%
rename from paddle/framework/attr_checker.h
rename to paddle/framework/attribute.h
index ea5614a45f..72a654bda5 100644
--- a/paddle/framework/attr_checker.h
+++ b/paddle/framework/attribute.h
@@ -6,6 +6,9 @@
 #include <unordered_map>
 #include <unordered_set>
 #include <vector>
+
+#include "paddle/framework/attribute.pb.h"
+#include "paddle/framework/op_desc.pb.h"
 #include "paddle/platform/enforce.h"
 
 namespace paddle {
@@ -14,8 +17,14 @@ namespace framework {
 typedef boost::variant<boost::blank, int, float, std::string, std::vector<int>,
                        std::vector<float>, std::vector<std::string>>
     Attribute;
+
 typedef std::unordered_map<std::string, Attribute> AttributeMap;
 
+template <typename T>
+AttrType AttrTypeID();
+
+Attribute GetAttrValue(const AttrDesc& attr_desc);
+
 // check whether a value(attribute) fit a certain limit
 template <typename T>
 class LargerThanChecker {
diff --git a/paddle/framework/attr_type.proto b/paddle/framework/attribute.proto
similarity index 100%
rename from paddle/framework/attr_type.proto
rename to paddle/framework/attribute.proto
diff --git a/paddle/framework/op_desc.proto b/paddle/framework/op_desc.proto
index 89497f3c16..5954dd8915 100644
--- a/paddle/framework/op_desc.proto
+++ b/paddle/framework/op_desc.proto
@@ -15,7 +15,7 @@ limitations under the License. */
 syntax="proto2";
 package paddle.framework;
 
-import "attr_type.proto";
+import "attribute.proto";
 
 // AttrDesc is used to describe Attributes of an Operator. It contain's
 // name, type, and value of Attribute.
diff --git a/paddle/framework/op_proto.proto b/paddle/framework/op_proto.proto
index 366c84e53d..60661cf7a8 100644
--- a/paddle/framework/op_proto.proto
+++ b/paddle/framework/op_proto.proto
@@ -21,7 +21,7 @@ limitations under the License. */
 syntax="proto2";
 package paddle.framework;
 
-import "attr_type.proto";
+import "attribute.proto";
 
 // Attribute protocol message for 3rd-party language binding.
 // It will store the Op support what attribute and what type.
diff --git a/paddle/framework/op_registry.cc b/paddle/framework/op_registry.cc
index 1d14535c50..1caa02a2a1 100644
--- a/paddle/framework/op_registry.cc
+++ b/paddle/framework/op_registry.cc
@@ -14,37 +14,8 @@ limitations under the License. */
 
 #include <paddle/framework/op_registry.h>
 
-namespace paddle {
-namespace framework {
-
-template <>
-void AttrTypeHelper::SetAttrType<int>(AttrProto* attr) {
-  attr->set_type(paddle::framework::AttrType::INT);
-}
-
-template <>
-void AttrTypeHelper::SetAttrType<float>(AttrProto* attr) {
-  attr->set_type(paddle::framework::AttrType::FLOAT);
-}
-
-template <>
-void AttrTypeHelper::SetAttrType<std::string>(AttrProto* attr) {
-  attr->set_type(paddle::framework::AttrType::STRING);
-}
+#include <vector>
 
-template <>
-void AttrTypeHelper::SetAttrType<std::vector<int>>(AttrProto* attr) {
-  attr->set_type(paddle::framework::AttrType::INTS);
-}
-
-template <>
-void AttrTypeHelper::SetAttrType<std::vector<float>>(AttrProto* attr) {
-  attr->set_type(paddle::framework::AttrType::FLOATS);
-}
-
-template <>
-void AttrTypeHelper::SetAttrType<std::vector<std::string>>(AttrProto* attr) {
-  attr->set_type(paddle::framework::AttrType::STRINGS);
-}
-}  // namespace framework
+namespace paddle {
+namespace framework {}  // namespace framework
 }  // namespace paddle
diff --git a/paddle/framework/op_registry.h b/paddle/framework/op_registry.h
index 9a975185f0..8f3e898ec5 100644
--- a/paddle/framework/op_registry.h
+++ b/paddle/framework/op_registry.h
@@ -19,7 +19,7 @@ limitations under the License. */
 #include <type_traits>
 #include <unordered_map>
 #include <unordered_set>
-#include "paddle/framework/attr_checker.h"
+#include "paddle/framework/attribute.h"
 #include "paddle/framework/grad_op_builder.h"
 #include "paddle/framework/op_desc.pb.h"
 #include "paddle/framework/scope.h"
@@ -31,43 +31,6 @@ namespace framework {
 struct AttrTypeHelper {
   template <typename T>
   static void SetAttrType(AttrProto* attr);
-
-  static Attribute GetAttrValue(const AttrDesc& attr_desc) {
-    switch (attr_desc.type()) {
-      case paddle::framework::AttrType::INT: {
-        return attr_desc.i();
-      }
-      case paddle::framework::AttrType::FLOAT: {
-        return attr_desc.f();
-      }
-      case paddle::framework::AttrType::STRING: {
-        return attr_desc.s();
-      }
-      case paddle::framework::AttrType::INTS: {
-        std::vector<int> val(attr_desc.ints_size());
-        for (int i = 0; i < attr_desc.ints_size(); ++i) {
-          val[i] = attr_desc.ints(i);
-        }
-        return val;
-      }
-      case paddle::framework::AttrType::FLOATS: {
-        std::vector<float> val(attr_desc.floats_size());
-        for (int i = 0; i < attr_desc.floats_size(); ++i) {
-          val[i] = attr_desc.floats(i);
-        }
-        return val;
-      }
-      case paddle::framework::AttrType::STRINGS: {
-        std::vector<std::string> val(attr_desc.strings_size());
-        for (int i = 0; i < attr_desc.strings_size(); ++i) {
-          val[i] = attr_desc.strings(i);
-        }
-        return val;
-      }
-    }
-    PADDLE_ENFORCE(false, "Unknown OpDesc::AttrDesc::type !");
-    return boost::blank();
-  }
 };
 
 // this class not only make proto but also init attribute checkers.
@@ -136,7 +99,7 @@ class OpProtoAndCheckerMaker {
     *attr->mutable_name() = name;
     *attr->mutable_comment() = comment;
     attr->set_generated(generated);
-    AttrTypeHelper::SetAttrType<T>(attr);
+    attr->set_type(AttrTypeID<T>());
     return op_checker_->AddAttrChecker<T>(name);
   }
 
@@ -297,7 +260,7 @@ class OpRegistry {
 
     AttributeMap attrs;
     for (auto& attr : op_desc.attrs()) {
-      attrs[attr.name()] = AttrTypeHelper::GetAttrValue(attr);
+      attrs[attr.name()] = GetAttrValue(attr);
     }
 
     return CreateOp(op_desc.type(), inputs, outputs, attrs);
diff --git a/paddle/framework/operator.h b/paddle/framework/operator.h
index 0b58829716..dff4a3c8b1 100644
--- a/paddle/framework/operator.h
+++ b/paddle/framework/operator.h
@@ -20,7 +20,7 @@ limitations under the License. */
 #include <unordered_map>
 #include <vector>
 
-#include "paddle/framework/attr_checker.h"
+#include "paddle/framework/attribute.h"
 #include "paddle/framework/op_desc.pb.h"
 #include "paddle/framework/op_proto.pb.h"
 #include "paddle/framework/scope.h"

From cedc2e645e5bc575ccbfa918a4ef6262ec1837f8 Mon Sep 17 00:00:00 2001
From: Yi Wang <yi.wang.2005@gmail.com>
Date: Thu, 3 Aug 2017 18:19:28 -0700
Subject: [PATCH 12/36] Restructure code oftype Attribute

---
 paddle/framework/CMakeLists.txt |  4 +-
 paddle/framework/attribute.cc   | 85 +++++++++++++++++++++++++++++++++
 paddle/framework/op_registry.h  |  6 ---
 3 files changed, 88 insertions(+), 7 deletions(-)
 create mode 100644 paddle/framework/attribute.cc

diff --git a/paddle/framework/CMakeLists.txt b/paddle/framework/CMakeLists.txt
index 7cbd77ec1f..454e8d54d4 100644
--- a/paddle/framework/CMakeLists.txt
+++ b/paddle/framework/CMakeLists.txt
@@ -12,13 +12,15 @@ cc_test(variable_test SRCS variable_test.cc)
 cc_library(scope SRCS scope.cc)
 cc_test(scope_test SRCS scope_test.cc DEPS scope)
 
+cc_library(attribute SRCS attribute.cc)
+
 proto_library(attribute_proto SRCS attribute.proto)
 proto_library(op_proto SRCS op_proto.proto DEPS attribute_proto)
 proto_library(op_desc SRCS op_desc.proto DEPS attribute_proto)
 cc_test(op_proto_test SRCS op_proto_test.cc DEPS op_proto protobuf)
 cc_test(op_desc_test SRCS op_desc_test.cc DEPS op_desc protobuf)
 
-cc_library(operator SRCS operator.cc DEPS op_desc device_context tensor scope)
+cc_library(operator SRCS operator.cc DEPS op_desc device_context tensor scope attribute)
 cc_test(operator_test SRCS operator_test.cc DEPS operator op_registry)
 
 cc_library(grad_op_builder SRCS grad_op_builder.cc DEPS op_proto operator)
diff --git a/paddle/framework/attribute.cc b/paddle/framework/attribute.cc
new file mode 100644
index 0000000000..4c5790693b
--- /dev/null
+++ b/paddle/framework/attribute.cc
@@ -0,0 +1,85 @@
+/* Copyright (c) 2016 PaddlePaddle Authors. All Rights Reserve.
+
+Licensed under the Apache License, Version 2.0 (the "License");
+you may not use this file except in compliance with the License.
+You may obtain a copy of the License at
+
+    http://www.apache.org/licenses/LICENSE-2.0
+
+Unless required by applicable law or agreed to in writing, software
+distributed under the License is distributed on an "AS IS" BASIS,
+WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+See the License for the specific language governing permissions and
+limitations under the License. */
+
+#include "paddle/framework/attribute.h"
+
+#include <vector>
+
+namespace paddle {
+namespace framework {
+
+template <>
+AttrType AttrTypeID<int>() {
+  return INT;
+}
+template <>
+AttrType AttrTypeID<float>() {
+  return FLOAT;
+}
+template <>
+AttrType AttrTypeID<std::string>() {
+  return STRING;
+}
+template <>
+AttrType AttrTypeID<std::vector<int>>() {
+  return INTS;
+}
+template <>
+AttrType AttrTypeID<std::vector<float>>() {
+  return FLOATS;
+}
+template <>
+AttrType AttrTypeID<std::vector<std::string>>() {
+  return STRINGS;
+}
+
+Attribute GetAttrValue(const AttrDesc& attr_desc) {
+  switch (attr_desc.type()) {
+    case paddle::framework::AttrType::INT: {
+      return attr_desc.i();
+    }
+    case paddle::framework::AttrType::FLOAT: {
+      return attr_desc.f();
+    }
+    case paddle::framework::AttrType::STRING: {
+      return attr_desc.s();
+    }
+    case paddle::framework::AttrType::INTS: {
+      std::vector<int> val(attr_desc.ints_size());
+      for (int i = 0; i < attr_desc.ints_size(); ++i) {
+        val[i] = attr_desc.ints(i);
+      }
+      return val;
+    }
+    case paddle::framework::AttrType::FLOATS: {
+      std::vector<float> val(attr_desc.floats_size());
+      for (int i = 0; i < attr_desc.floats_size(); ++i) {
+        val[i] = attr_desc.floats(i);
+      }
+      return val;
+    }
+    case paddle::framework::AttrType::STRINGS: {
+      std::vector<std::string> val(attr_desc.strings_size());
+      for (int i = 0; i < attr_desc.strings_size(); ++i) {
+        val[i] = attr_desc.strings(i);
+      }
+      return val;
+    }
+  }
+  PADDLE_ENFORCE(false, "Unknown OpDesc::AttrDesc::type !");
+  return boost::blank();
+}
+
+}  // namespace framework
+}  // namespace paddle
diff --git a/paddle/framework/op_registry.h b/paddle/framework/op_registry.h
index 8f3e898ec5..fcd8eceb35 100644
--- a/paddle/framework/op_registry.h
+++ b/paddle/framework/op_registry.h
@@ -27,12 +27,6 @@ limitations under the License. */
 namespace paddle {
 namespace framework {
 
-// helper class to set attribute type
-struct AttrTypeHelper {
-  template <typename T>
-  static void SetAttrType(AttrProto* attr);
-};
-
 // this class not only make proto but also init attribute checkers.
 class OpProtoAndCheckerMaker {
  public:

From ff19223e8d6025446dedbd16d6feebc4e8899c88 Mon Sep 17 00:00:00 2001
From: Yi Wang <yi.wang.2005@gmail.com>
Date: Thu, 3 Aug 2017 18:23:14 -0700
Subject: [PATCH 13/36] Reforamt

---
 paddle/framework/backward.cc        | 14 ++++----
 paddle/framework/backward_test.cc   | 51 +++++++----------------------
 paddle/framework/grad_op_builder.cc | 10 +++---
 paddle/framework/operator.h         |  3 +-
 paddle/operators/softmax_op.cc      |  2 +-
 5 files changed, 24 insertions(+), 56 deletions(-)

diff --git a/paddle/framework/backward.cc b/paddle/framework/backward.cc
index d5e41b7b7e..13706f8b56 100644
--- a/paddle/framework/backward.cc
+++ b/paddle/framework/backward.cc
@@ -59,16 +59,14 @@ std::shared_ptr<OperatorBase> BackwardRecursive(
   //  If all input gradients of forwarding operator do not need to calculate,
   //  just return an NOP. Not return null ptr because NOP does not take
   //  too much time for calculation, but it is useful for simplifying logic.
-  if (AllInSet(forwardOp.inputs_, kGradVarSuffix,
-               no_grad_names)) {
+  if (AllInSet(forwardOp.inputs_, kGradVarSuffix, no_grad_names)) {
     return NOP();
   }
 
   //  All output gradients of forwarding operator do not need to calculate.
   //  Then all input gradients cannot be computed at all, and we put them into
   //  `no_grad_names` set. Return an NOP.
-  if (AllInSet(forwardOp.outputs_, kGradVarSuffix,
-               no_grad_names)) {
+  if (AllInSet(forwardOp.outputs_, kGradVarSuffix, no_grad_names)) {
     for (auto& name : forwardOp.inputs_) {
       // Mark all input is not need
       no_grad_names.insert(name + kGradVarSuffix);
@@ -134,8 +132,8 @@ std::shared_ptr<OperatorBase> BackwardRecursive(
     std::shared_ptr<OperatorBase> grad_op = OpRegistry::CreateGradOp(forwardOp);
     for (std::string& grad_input : grad_op->inputs_) {
       if (no_grad_names.count(grad_input)) {
-        std::string prefix = grad_input.substr(
-            0, grad_input.size() - kGradVarSuffix.size());
+        std::string prefix =
+            grad_input.substr(0, grad_input.size() - kGradVarSuffix.size());
         grad_input = prefix + kZeroVarSuffix;
 
         // If part of input gradient of that operator is not calculated, fill
@@ -168,8 +166,7 @@ std::shared_ptr<OperatorBase> Backward(
   std::unordered_set<std::string> no_grad_names;
   no_grad_names.reserve(no_grad_vars.size());
 
-  no_grad_names.insert(kEmptyVarName +
-                       kGradVarSuffix);
+  no_grad_names.insert(kEmptyVarName + kGradVarSuffix);
 
   for (auto& name : no_grad_vars) {
     no_grad_names.insert(name + kGradVarSuffix);
@@ -177,5 +174,6 @@ std::shared_ptr<OperatorBase> Backward(
   size_t uid = 0;
   return BackwardRecursive(forwardOp, no_grad_names, uid);
 }
+
 }  // namespace framework
 }  // namespace paddle
diff --git a/paddle/framework/backward_test.cc b/paddle/framework/backward_test.cc
index 061bf1063f..6c6e12ca25 100644
--- a/paddle/framework/backward_test.cc
+++ b/paddle/framework/backward_test.cc
@@ -168,8 +168,7 @@ TEST(Backward, simple_op_grad) {
   ASSERT_EQ("X" + f::kGradVarSuffix, gop->outputs_[0]);
   ASSERT_EQ("b" + f::kGradVarSuffix, gop->outputs_[1]);
 
-  ASSERT_EQ("X" + f::kGradVarSuffix,
-            gop->Output("X" + f::kGradVarSuffix));
+  ASSERT_EQ("X" + f::kGradVarSuffix, gop->Output("X" + f::kGradVarSuffix));
 }
 
 TEST(Backward, simple_op_not_need_grad) {
@@ -210,9 +209,9 @@ TEST(Backward, net_fc_backward_normal) {
 }
 
 TEST(Backward, net_fc_backward_not_have_b) {
-  std::shared_ptr<f::OperatorBase> fwd = f::OpRegistry::CreateOp(
-      "fc", {"X", "w", f::kEmptyVarName},
-      {"mul_result", "add_result", "tmp"}, {});
+  std::shared_ptr<f::OperatorBase> fwd =
+      f::OpRegistry::CreateOp("fc", {"X", "w", f::kEmptyVarName},
+                              {"mul_result", "add_result", "tmp"}, {});
   ASSERT_NE(fwd, nullptr);
   std::shared_ptr<f::OperatorBase> gop = f::Backward(*fwd, {});
   ASSERT_TRUE(gop->IsNetOp());
@@ -245,21 +244,18 @@ TEST(Backward, net_input_of_network_not_need_grad) {
   all_output.erase(f::kEmptyVarName);
 
   for (auto &out : {"W1", "b1", "hidden0", "W2", "b2"}) {
-    ASSERT_NE(all_output.find(out + f::kGradVarSuffix),
-              all_output.end());
+    ASSERT_NE(all_output.find(out + f::kGradVarSuffix), all_output.end());
   }
 
   // Not Generated X
-  ASSERT_EQ(all_output.find("X" + f::kGradVarSuffix),
-            all_output.end());
+  ASSERT_EQ(all_output.find("X" + f::kGradVarSuffix), all_output.end());
 
   ASSERT_EQ(2UL, bwd_net->ops_.size());
   ASSERT_TRUE(bwd_net->ops_[1]->IsNetOp());
   auto first_fc_grad = static_cast<ops::NetOp *>(bwd_net->ops_[1].get());
   ASSERT_EQ(3UL, first_fc_grad->ops_.size());
-  ASSERT_EQ(
-      f::kEmptyVarName,
-      first_fc_grad->ops_[2]->Output("A" + f::kGradVarSuffix));
+  ASSERT_EQ(f::kEmptyVarName,
+            first_fc_grad->ops_[2]->Output("A" + f::kGradVarSuffix));
 }
 
 TEST(Backward, net_shared_weight) {
@@ -316,10 +312,8 @@ TEST(Backward, op_part_of_output_are_not_need) {
   auto &d_many_out = *net->ops_[1];
   ASSERT_EQ("many_output_op_grad", d_many_out.type_);
   ASSERT_EQ(1UL + 2UL + 2UL, d_many_out.inputs_.size());  // I/O/OG
-  ASSERT_EQ("Z" + f::kZeroVarSuffix,
-            d_many_out.Input("z" + f::kGradVarSuffix));
-  ASSERT_EQ("Y" + f::kGradVarSuffix,
-            d_many_out.Input("y" + f::kGradVarSuffix));
+  ASSERT_EQ("Z" + f::kZeroVarSuffix, d_many_out.Input("z" + f::kGradVarSuffix));
+  ASSERT_EQ("Y" + f::kGradVarSuffix, d_many_out.Input("y" + f::kGradVarSuffix));
   ASSERT_EQ("X" + f::kGradVarSuffix,
             d_many_out.Output("x" + f::kGradVarSuffix));
 }
@@ -331,10 +325,8 @@ TEST(Backward, op_part_of_input_are_not_need) {
   ASSERT_EQ(grad_mul.type_, "mul_grad");
   ASSERT_EQ(grad_mul.inputs_.size(), 2UL + 1UL + 1UL);
   ASSERT_EQ(grad_mul.outputs_.size(), 2UL);
-  ASSERT_EQ(grad_mul.Output("A" + f::kGradVarSuffix),
-            f::kEmptyVarName);
-  ASSERT_EQ(grad_mul.Output("B" + f::kGradVarSuffix),
-            "b" + f::kGradVarSuffix);
+  ASSERT_EQ(grad_mul.Output("A" + f::kGradVarSuffix), f::kEmptyVarName);
+  ASSERT_EQ(grad_mul.Output("B" + f::kGradVarSuffix), "b" + f::kGradVarSuffix);
   ASSERT_EQ(grad_mul.Input("Out" + f::kGradVarSuffix),
             "out" + f::kGradVarSuffix);
   ASSERT_EQ(grad_mul.Input("A"), "a");
@@ -368,23 +360,4 @@ TEST(Backward, linear_net_intermediate_variable_has_no_grad) {
   EXPECT_EQ(bwd_net->ops_[1]->outputs_.size(), 0UL);
   EXPECT_EQ(bwd_net->ops_[2]->inputs_.size(), 0UL);
   EXPECT_EQ(bwd_net->ops_[2]->outputs_.size(), 0UL);
-
-  /*
-    EXPECT_EQ(grad_fc.Output("X" + f::kGradVarSuffix),
-              f::kEmptyVarName);
-  EXPECT_EQ(grad_fc.Output("W" + f::kGradVarSuffix),
-    "w3" + f::kGradVarSuffix);
-  EXPECT_EQ(grad_fc.Output("b" + f::kGradVarSuffix),
-    "b3" + f::kGradVarSuffix);
-  EXPECT_EQ(grad_fc.Output("mul_result" + f::kGradVarSuffix),
-  "mul_out3" + f::kGradVarSuffix);
-
-  EXPECT_EQ(grad_fc.Input("Out" + f::kGradVarSuffix),
-  "out3" + f::kGradVarSuffix);
-  EXPECT_EQ(grad_fc.Input("X"), "out2");
-  EXPECT_EQ(grad_fc.Input("W"), "w3");
-  EXPECT_EQ(grad_fc.Input("mul_result"), "mul_out3");
-  EXPECT_EQ(grad_fc.Input("add_result"), "tmp_out3");
-  EXPECT_EQ(grad_fc.Input("Out"), "out3");
-  */
 }
diff --git a/paddle/framework/grad_op_builder.cc b/paddle/framework/grad_op_builder.cc
index f34aaa28c5..3aefbb3fff 100644
--- a/paddle/framework/grad_op_builder.cc
+++ b/paddle/framework/grad_op_builder.cc
@@ -56,8 +56,7 @@ static void TransOpArg(const OperatorBase* src_op, OperatorBase* dst_op,
 
   for (const auto& arg : src_arg_list) {
     std::string src_name = arg.name();
-    std::string dst_name =
-        is_grad ? src_name + kGradVarSuffix : src_name;
+    std::string dst_name = is_grad ? src_name + kGradVarSuffix : src_name;
     (*dst_op->in_out_idxs_)[dst_name] = idx++;
     int src_arg_idx = src_op->in_out_idxs_->at(src_name);
     int src_begin =
@@ -65,10 +64,9 @@ static void TransOpArg(const OperatorBase* src_op, OperatorBase* dst_op,
     int src_end = src_format == nullptr ? src_arg_idx + 1
                                         : src_format->at(src_arg_idx + 1);
     for (int i = src_begin; i < src_end; ++i) {
-      std::string s = is_grad ? src_inout[i] + kGradVarSuffix
-                              : arg.ignore_gradient()
-                                    ? kEmptyVarName
-                                    : src_inout[i];
+      std::string s =
+          is_grad ? src_inout[i] + kGradVarSuffix
+                  : (arg.ignore_gradient() ? kEmptyVarName : src_inout[i]);
       dst_inout.emplace_back(s);
     }
     if (dst_format != nullptr) {
diff --git a/paddle/framework/operator.h b/paddle/framework/operator.h
index 572c1d2b58..c4e23c3350 100644
--- a/paddle/framework/operator.h
+++ b/paddle/framework/operator.h
@@ -45,13 +45,12 @@ const std::string kTempVarName = "@TEMP@";
 const std::string kGradVarSuffix = "@GRAD";
 
 /// Variables with this suffix are supposed to be filled up with zeros.
-const std::string kZeroVarSuffix =  "@ZERO";
+const std::string kZeroVarSuffix = "@ZERO";
 
 inline std::string GradVarName(const std::string& var_name) {
   return var_name + kGradVarSuffix;
 }
 
-
 class OperatorBase;
 class InferShapeContext;
 class ExecutionContext;
diff --git a/paddle/operators/softmax_op.cc b/paddle/operators/softmax_op.cc
index e0d5e16ca0..e8bb7032f8 100644
--- a/paddle/operators/softmax_op.cc
+++ b/paddle/operators/softmax_op.cc
@@ -51,7 +51,7 @@ protected:
     PADDLE_ENFORCE(ctx.InputVar(framework::GradVarName("Y")) != nullptr,
                    "Input(Y@GRAD) should not be null");
     PADDLE_ENFORCE(ctx.Input<Tensor>("Y")->dims() ==
-                   ctx.Input<Tensor>(framework::GradVarName("Y"))->dims(),
+                       ctx.Input<Tensor>(framework::GradVarName("Y"))->dims(),
                    "the shape of Input(0) and Input(1) should be the same");
     ctx.Output<Tensor>(framework::GradVarName("X"))
         ->Resize(ctx.Input<Tensor>("Y")->dims());

From b58725bd5181fa9c5ada0fb94e553258dc1b25b0 Mon Sep 17 00:00:00 2001
From: liaogang <liaogang@baidu.com>
Date: Fri, 4 Aug 2017 11:07:47 +0800
Subject: [PATCH 14/36] Add cpplint for *.h and cuda  *.cu

---
 cmake/generic.cmake                    | 16 +++++++++++++++-
 paddle/framework/ddim.h                |  9 +++------
 paddle/framework/grad_op_builder.h     | 20 +++++++++++++++++---
 paddle/framework/op_registry.h         |  6 +++---
 paddle/framework/operator.h            |  2 +-
 paddle/math/BaseMatrix.cu              |  3 ++-
 paddle/memory/CMakeLists.txt           |  4 ++--
 paddle/memory/detail/buddy_allocator.h |  2 +-
 paddle/memory/detail/meta_cache.h      |  8 ++++----
 paddle/memory/memory.h                 |  2 +-
 paddle/operators/add_op.cu             | 14 ++++++++++++++
 paddle/operators/cross_entropy_op.cu   | 16 +++++++++++++++-
 paddle/operators/fill_zeros_like_op.cu | 16 +++++++++++++++-
 paddle/operators/mean_op.cu            | 16 +++++++++++++++-
 paddle/operators/mean_op.h             |  2 +-
 paddle/operators/mul_op.cu             |  2 +-
 paddle/operators/recurrent_op.h        | 20 ++++++++------------
 paddle/operators/rowwise_add_op.cu     | 14 ++++++++++++++
 paddle/operators/sgd_op.cu             | 16 +++++++++++++++-
 paddle/operators/sigmoid_op.cu         | 14 ++++++++++++++
 paddle/operators/softmax_op.cc         |  1 +
 paddle/operators/softmax_op.cu         | 14 ++++++++++++++
 paddle/platform/device_context.h       |  8 ++++----
 paddle/platform/dynload/cublas.cc      | 14 ++++++++++++++
 paddle/platform/dynload/cudnn.cc       | 16 +++++++++++++++-
 paddle/platform/dynload/curand.cc      | 21 ++++++++++++++++++---
 paddle/platform/place.h                |  2 +-
 paddle/string/piece.h                  |  4 ++--
 28 files changed, 230 insertions(+), 52 deletions(-)

diff --git a/cmake/generic.cmake b/cmake/generic.cmake
index 534be0abe2..41b9b59289 100644
--- a/cmake/generic.cmake
+++ b/cmake/generic.cmake
@@ -187,7 +187,13 @@ function(cc_library TARGET_NAME)
     endif()
     
     # cpplint code style
-    add_style_check_target(${TARGET_NAME} ${cc_library_SRCS})
+    foreach(source_file ${cc_library_SRCS})
+      string(REGEX REPLACE "\\.[^.]*$" "" source ${source_file})
+      if(EXISTS ${CMAKE_CURRENT_SOURCE_DIR}/${source}.h)
+        list(APPEND cc_library_HEADERS ${CMAKE_CURRENT_SOURCE_DIR}/${source}.h)
+      endif()
+    endforeach()
+    add_style_check_target(${TARGET_NAME} ${cc_library_SRCS} ${cc_library_HEADERS})
 
   else(cc_library_SRCS)
     if (cc_library_DEPS)
@@ -239,6 +245,14 @@ function(nv_library TARGET_NAME)
         add_dependencies(${TARGET_NAME} ${nv_library_DEPS})
         target_link_libraries(${TARGET_NAME} ${nv_library_DEPS})
       endif()
+      # cpplint code style
+      foreach(source_file ${nv_library_SRCS})
+        string(REGEX REPLACE "\\.[^.]*$" "" source ${source_file})
+        if(EXISTS ${CMAKE_CURRENT_SOURCE_DIR}/${source}.h)
+          list(APPEND cc_library_HEADERS ${CMAKE_CURRENT_SOURCE_DIR}/${source}.h)
+        endif()
+      endforeach()
+      add_style_check_target(${TARGET_NAME} ${nv_library_SRCS} ${nv_library_HEADERS})
     else(nv_library_SRCS)
       if (nv_library_DEPS)
         merge_static_libs(${TARGET_NAME} ${nv_library_DEPS})
diff --git a/paddle/framework/ddim.h b/paddle/framework/ddim.h
index 9fcc657edc..5aa5af0c19 100644
--- a/paddle/framework/ddim.h
+++ b/paddle/framework/ddim.h
@@ -25,18 +25,15 @@ limitations under the License. */
 namespace paddle {
 namespace framework {
 
-namespace {
-typedef boost::variant<Dim<1>, Dim<2>, Dim<3>, Dim<4>, Dim<5>, Dim<6>, Dim<7>,
-                       Dim<8>, Dim<9>>
-    DDimVar;
-}
-
 /**
  * \brief A dynamically sized dimension.
  *
  * The number of dimensions must be between [1, 9].
  */
 struct DDim {
+  typedef boost::variant<Dim<1>, Dim<2>, Dim<3>, Dim<4>, Dim<5>, Dim<6>, Dim<7>,
+                         Dim<8>, Dim<9>>
+      DDimVar;
   DDimVar var;
 
   DDim() : var(Dim<1>()) {}
diff --git a/paddle/framework/grad_op_builder.h b/paddle/framework/grad_op_builder.h
index cc7a76f372..973c12658c 100644
--- a/paddle/framework/grad_op_builder.h
+++ b/paddle/framework/grad_op_builder.h
@@ -1,3 +1,17 @@
+/* Copyright (c) 2016 PaddlePaddle Authors. All Rights Reserve.
+
+Licensed under the Apache License, Version 2.0 (the "License");
+you may not use this file except in compliance with the License.
+You may obtain a copy of the License at
+
+    http://www.apache.org/licenses/LICENSE-2.0
+
+Unless required by applicable law or agreed to in writing, software
+distributed under the License is distributed on an "AS IS" BASIS,
+WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+See the License for the specific language governing permissions and
+limitations under the License. */
+
 #pragma once
 
 #include "paddle/framework/op_proto.pb.h"
@@ -10,8 +24,8 @@ class OpRegistry;
 enum InOutType { IN, OUT };
 
 struct OpInOutArg {
-  OpInOutArg(const std::string& proto_name, const InOutType& type,
-             bool needed_in_grad, size_t begin_idx, size_t end_idx)
+  explicit OpInOutArg(const std::string& proto_name, const InOutType& type,
+                      bool needed_in_grad, size_t begin_idx, size_t end_idx)
       : proto_name_(proto_name),
         type_(type),
         needed_in_grad_(needed_in_grad),
@@ -29,7 +43,7 @@ class GradOpBuilder {
   using VarIndexMap = std::unordered_map<std::string, int>;
 
  public:
-  GradOpBuilder(const OperatorBase& op) : op_(op) {}
+  explicit GradOpBuilder(const OperatorBase& op) : op_(op) {}
   OperatorBase* Build();
 
  private:
diff --git a/paddle/framework/op_registry.h b/paddle/framework/op_registry.h
index 3e72e39126..228943d819 100644
--- a/paddle/framework/op_registry.h
+++ b/paddle/framework/op_registry.h
@@ -315,7 +315,7 @@ class OpRegistry {
   static std::unordered_map<std::string, OpProto>& protos() {
     static std::unordered_map<std::string, OpProto> protos_;
     return protos_;
-  };
+  }
 
   static std::unordered_map<std::string, std::string>& grad_ops() {
     static std::unordered_map<std::string, std::string> grad_ops_;
@@ -337,7 +337,7 @@ class OpRegistry {
   static std::unordered_map<std::string, OpAttrChecker>& op_checkers() {
     static std::unordered_map<std::string, OpAttrChecker> op_checkers_;
     return op_checkers_;
-  };
+  }
 
   static void GenerateTempVariableName(OperatorBase* op) {
     static std::atomic<size_t> gUniqId(0UL);
@@ -354,7 +354,7 @@ class OpRegistry {
 template <typename OpType, typename ProtoMakerType>
 class OpRegisterHelper {
  public:
-  OpRegisterHelper(const char* op_type) {
+  explicit OpRegisterHelper(const char* op_type) {
     OpRegistry::RegisterOp<OpType, ProtoMakerType>(op_type);
   }
 };
diff --git a/paddle/framework/operator.h b/paddle/framework/operator.h
index 5543510348..09a116ba75 100644
--- a/paddle/framework/operator.h
+++ b/paddle/framework/operator.h
@@ -280,7 +280,7 @@ class OperatorWithKernel : public OperatorBase {
     platform::Place place_;
 
     OpKernelKey() = default;
-    OpKernelKey(const platform::DeviceContext& dev_ctx) {
+    explicit OpKernelKey(const platform::DeviceContext& dev_ctx) {
       place_ = dev_ctx.GetPlace();
     }
 
diff --git a/paddle/math/BaseMatrix.cu b/paddle/math/BaseMatrix.cu
index 6db5965789..f60d9cc5c4 100644
--- a/paddle/math/BaseMatrix.cu
+++ b/paddle/math/BaseMatrix.cu
@@ -442,7 +442,8 @@ DEFINE_MATRIX_UNARY_PARAMETER_OP(Clip, TWO_PARAMETER,
 template<class T>
 void BaseMatrixT<T>::clip(T p1, T p2) { applyUnary(unary::Clip<T>(p1, p2)); }
 
-DEFINE_MATRIX_BINARY_PARAMETER_OP(ClipDerivative, TWO_PARAMETER, a = b < p1 ? 0 : (b > p2 ? 0 : 1));
+DEFINE_MATRIX_BINARY_PARAMETER_OP(ClipDerivative, TWO_PARAMETER,
+                                  a = b < p1 ? 0 : (b > p2 ? 0 : 1));
 template<class T>
 void BaseMatrixT<T>::clipDerivative(BaseMatrixT& b, T p1, T p2) {
   applyBinary(binary::ClipDerivative<T>(p1, p2), b);
diff --git a/paddle/memory/CMakeLists.txt b/paddle/memory/CMakeLists.txt
index 8035d93bfe..eb2f5cb66a 100644
--- a/paddle/memory/CMakeLists.txt
+++ b/paddle/memory/CMakeLists.txt
@@ -1,7 +1,7 @@
 add_subdirectory(detail)
 
-cc_library(memory SRCS memory.cc)
-cc_library(memcpy SRCS memcpy.cc DEPS device_context)
+cc_library(memory SRCS memory.h memory.cc)
+cc_library(memcpy SRCS memcpy.h memcpy.cc DEPS device_context)
 
 cc_library(paddle_memory
     DEPS
diff --git a/paddle/memory/detail/buddy_allocator.h b/paddle/memory/detail/buddy_allocator.h
index 4fa3fb0ee5..9c41378483 100644
--- a/paddle/memory/detail/buddy_allocator.h
+++ b/paddle/memory/detail/buddy_allocator.h
@@ -39,7 +39,7 @@ class BuddyAllocator {
 
  public:
   void* Alloc(size_t unaligned_size);
-  void Free(void*);
+  void Free(void* ptr);
   size_t Used();
 
  public:
diff --git a/paddle/memory/detail/meta_cache.h b/paddle/memory/detail/meta_cache.h
index ca0789779e..cf58156442 100644
--- a/paddle/memory/detail/meta_cache.h
+++ b/paddle/memory/detail/meta_cache.h
@@ -33,17 +33,17 @@ namespace detail {
  */
 class MetadataCache {
  public:
-  MetadataCache(bool uses_gpu);
+  explicit MetadataCache(bool uses_gpu);
 
  public:
   /*! \brief Load the associated metadata for the specified memory block. */
-  Metadata load(const MemoryBlock*);
+  Metadata load(const MemoryBlock* memory_block);
 
   /*! \brief Store the associated metadata for the specified memory block. */
-  void store(MemoryBlock*, const Metadata&);
+  void store(MemoryBlock* memory_block, const Metadata& meta_data);
 
   /*! \brief Indicate that the specified metadata will no longer be used. */
-  void invalidate(MemoryBlock*);
+  void invalidate(MemoryBlock* memory_block);
 
  public:
   MetadataCache(const MetadataCache&) = delete;
diff --git a/paddle/memory/memory.h b/paddle/memory/memory.h
index 44f567caf9..72351b9dfa 100644
--- a/paddle/memory/memory.h
+++ b/paddle/memory/memory.h
@@ -68,7 +68,7 @@ class PODDeleter {
   static_assert(std::is_pod<T>::value, "T must be POD");
 
  public:
-  PODDeleter(Place place) : place_(place) {}
+  explicit PODDeleter(Place place) : place_(place) {}
   void operator()(T* ptr) { Free(place_, static_cast<void*>(ptr)); }
 
  private:
diff --git a/paddle/operators/add_op.cu b/paddle/operators/add_op.cu
index f961b37565..9bd08634da 100644
--- a/paddle/operators/add_op.cu
+++ b/paddle/operators/add_op.cu
@@ -1,3 +1,17 @@
+/* Copyright (c) 2016 PaddlePaddle Authors. All Rights Reserve.
+
+   Licensed under the Apache License, Version 2.0 (the "License");
+   you may not use this file except in compliance with the License.
+   You may obtain a copy of the License at
+
+   http://www.apache.org/licenses/LICENSE-2.0
+
+   Unless required by applicable law or agreed to in writing, software
+   distributed under the License is distributed on an "AS IS" BASIS,
+   WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+   See the License for the specific language governing permissions and
+   limitations under the License. */
+
 #define EIGEN_USE_GPU
 #include "paddle/framework/op_registry.h"
 #include "paddle/operators/add_op.h"
diff --git a/paddle/operators/cross_entropy_op.cu b/paddle/operators/cross_entropy_op.cu
index 926a0c616b..2f453f8379 100644
--- a/paddle/operators/cross_entropy_op.cu
+++ b/paddle/operators/cross_entropy_op.cu
@@ -1,5 +1,19 @@
+/* Copyright (c) 2016 PaddlePaddle Authors. All Rights Reserve.
+
+   Licensed under the Apache License, Version 2.0 (the "License");
+   you may not use this file except in compliance with the License.
+   You may obtain a copy of the License at
+
+   http://www.apache.org/licenses/LICENSE-2.0
+
+   Unless required by applicable law or agreed to in writing, software
+   distributed under the License is distributed on an "AS IS" BASIS,
+   WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+   See the License for the specific language governing permissions and
+   limitations under the License. */
+
 #define EIGEN_USE_GPU
 #include "paddle/operators/cross_entropy_op.h"
 
 REGISTER_OP_GPU_KERNEL(onehot_cross_entropy,
-                       ops::OnehotCrossEntropyOpKernel<ops::GPUPlace, float>);
\ No newline at end of file
+                       ops::OnehotCrossEntropyOpKernel<ops::GPUPlace, float>);
diff --git a/paddle/operators/fill_zeros_like_op.cu b/paddle/operators/fill_zeros_like_op.cu
index 55ad58f4f1..ed1068219c 100644
--- a/paddle/operators/fill_zeros_like_op.cu
+++ b/paddle/operators/fill_zeros_like_op.cu
@@ -1,6 +1,20 @@
+/* Copyright (c) 2016 PaddlePaddle Authors. All Rights Reserve.
+
+   Licensed under the Apache License, Version 2.0 (the "License");
+   you may not use this file except in compliance with the License.
+   You may obtain a copy of the License at
+
+   http://www.apache.org/licenses/LICENSE-2.0
+
+   Unless required by applicable law or agreed to in writing, software
+   distributed under the License is distributed on an "AS IS" BASIS,
+   WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+   See the License for the specific language governing permissions and
+   limitations under the License. */
+
 #include "paddle/framework/op_registry.h"
 #include "paddle/operators/fill_zeros_like_op.h"
 
 REGISTER_OP_GPU_KERNEL(
     fill_zeros_like,
-    paddle::operators::FillZerosLikeKernel<paddle::platform::GPUPlace, float>);
\ No newline at end of file
+    paddle::operators::FillZerosLikeKernel<paddle::platform::GPUPlace, float>);
diff --git a/paddle/operators/mean_op.cu b/paddle/operators/mean_op.cu
index e15de2fd0d..8b97b0154c 100644
--- a/paddle/operators/mean_op.cu
+++ b/paddle/operators/mean_op.cu
@@ -1,6 +1,20 @@
+/* Copyright (c) 2016 PaddlePaddle Authors. All Rights Reserve.
+
+   Licensed under the Apache License, Version 2.0 (the "License");
+   you may not use this file except in compliance with the License.
+   You may obtain a copy of the License at
+
+   http://www.apache.org/licenses/LICENSE-2.0
+
+   Unless required by applicable law or agreed to in writing, software
+   distributed under the License is distributed on an "AS IS" BASIS,
+   WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+   See the License for the specific language governing permissions and
+   limitations under the License. */
+
 #define EIGEN_USE_GPU
 
 #include "paddle/operators/mean_op.h"
 
 REGISTER_OP_GPU_KERNEL(mean, ops::MeanKernel<ops::GPUPlace, float>);
-REGISTER_OP_GPU_KERNEL(mean_grad, ops::MeanGradKernel<ops::GPUPlace, float>);
\ No newline at end of file
+REGISTER_OP_GPU_KERNEL(mean_grad, ops::MeanGradKernel<ops::GPUPlace, float>);
diff --git a/paddle/operators/mean_op.h b/paddle/operators/mean_op.h
index a89cb422f9..9234d4dff8 100644
--- a/paddle/operators/mean_op.h
+++ b/paddle/operators/mean_op.h
@@ -47,7 +47,7 @@ public:
 
     T ig_size = (T)framework::product(IG->dims());
 
-    EigenVector<T>::Flatten(*IG).device(*(context.GetEigenDevice<Place>())) =
+    EigenVector<T>::Flatten(*IG).device((context.GetEigenDevice<Place>())) =
         EigenScalar<T>::From(*OG) / ig_size;
   }
 };
diff --git a/paddle/operators/mul_op.cu b/paddle/operators/mul_op.cu
index dc92367016..1dc04c4297 100644
--- a/paddle/operators/mul_op.cu
+++ b/paddle/operators/mul_op.cu
@@ -15,4 +15,4 @@
 #define EIGEN_USE_GPU
 #include "paddle/operators/mul_op.h"
 
-REGISTER_OP_GPU_KERNEL(mul, ops::MulKernel<ops::GPUPlace, float>);
\ No newline at end of file
+REGISTER_OP_GPU_KERNEL(mul, ops::MulKernel<ops::GPUPlace, float>);
diff --git a/paddle/operators/recurrent_op.h b/paddle/operators/recurrent_op.h
index 2a0964fff3..35e6d9d50d 100644
--- a/paddle/operators/recurrent_op.h
+++ b/paddle/operators/recurrent_op.h
@@ -19,7 +19,7 @@
 namespace paddle {
 namespace operators {
 
-using namespace paddle::framework;
+using namespace paddle::framework;  // NOLINT
 
 namespace rnn {
 
@@ -94,7 +94,7 @@ void InitArgument(const ArgumentName& name, Argument* arg);
 };  // namespace rnn
 
 // The sequence format in RecurrentOp is Tensor<seq_len, batch_size, dim> now.
-// TODO:
+// TODO(Yan Chunwei):
 // 1. No-padding computing for sequences with indifinite length in one batch.
 // 2. Hierarchical RNN for sequence with sub-sequence.
 // 3. Internal Memory.
@@ -172,12 +172,10 @@ public:
   /**
    * InferShape must be called before Run.
    */
-  virtual void InferShape(const Scope& scope) const override {
-    alg_.InferShape(scope);
-  }
+  void InferShape(const Scope& scope) const override { alg_.InferShape(scope); }
 
-  virtual void Run(const Scope& scope,
-                   const platform::DeviceContext& dev_ctx) const override {
+  void Run(const Scope& scope,
+           const platform::DeviceContext& dev_ctx) const override {
     alg_.Run(scope, dev_ctx);
   }
 
@@ -194,12 +192,10 @@ public:
   /**
    * InferShape must be called before Run.
    */
-  virtual void InferShape(const Scope& scope) const override {
-    alg_.InferShape(scope);
-  }
+  void InferShape(const Scope& scope) const override { alg_.InferShape(scope); }
 
-  virtual void Run(const Scope& scope,
-                   const platform::DeviceContext& dev_ctx) const override {
+  void Run(const Scope& scope,
+           const platform::DeviceContext& dev_ctx) const override {
     alg_.Run(scope, dev_ctx);
   }
 
diff --git a/paddle/operators/rowwise_add_op.cu b/paddle/operators/rowwise_add_op.cu
index 82338ceccc..f76faa0a3a 100644
--- a/paddle/operators/rowwise_add_op.cu
+++ b/paddle/operators/rowwise_add_op.cu
@@ -1,3 +1,17 @@
+/* Copyright (c) 2016 PaddlePaddle Authors. All Rights Reserve.
+
+   Licensed under the Apache License, Version 2.0 (the "License");
+   you may not use this file except in compliance with the License.
+   You may obtain a copy of the License at
+
+   http://www.apache.org/licenses/LICENSE-2.0
+
+   Unless required by applicable law or agreed to in writing, software
+   distributed under the License is distributed on an "AS IS" BASIS,
+   WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+   See the License for the specific language governing permissions and
+   limitations under the License. */
+
 #define EIGEN_USE_GPU
 #include "paddle/operators/rowwise_add_op.h"
 
diff --git a/paddle/operators/sgd_op.cu b/paddle/operators/sgd_op.cu
index d79258cbf1..72629ccfbb 100644
--- a/paddle/operators/sgd_op.cu
+++ b/paddle/operators/sgd_op.cu
@@ -1,4 +1,18 @@
+/* Copyright (c) 2016 PaddlePaddle Authors. All Rights Reserve.
+
+   Licensed under the Apache License, Version 2.0 (the "License");
+   you may not use this file except in compliance with the License.
+   You may obtain a copy of the License at
+
+   http://www.apache.org/licenses/LICENSE-2.0
+
+   Unless required by applicable law or agreed to in writing, software
+   distributed under the License is distributed on an "AS IS" BASIS,
+   WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+   See the License for the specific language governing permissions and
+   limitations under the License. */
+
 #define EIGEN_USE_GPU
 #include "paddle/operators/sgd_op.h"
 
-REGISTER_OP_GPU_KERNEL(sgd, ops::SGDOpKernel<ops::GPUPlace, float>);
\ No newline at end of file
+REGISTER_OP_GPU_KERNEL(sgd, ops::SGDOpKernel<ops::GPUPlace, float>);
diff --git a/paddle/operators/sigmoid_op.cu b/paddle/operators/sigmoid_op.cu
index c9d11a2e1f..2123b17e4b 100644
--- a/paddle/operators/sigmoid_op.cu
+++ b/paddle/operators/sigmoid_op.cu
@@ -1,3 +1,17 @@
+/* Copyright (c) 2016 PaddlePaddle Authors. All Rights Reserve.
+
+   Licensed under the Apache License, Version 2.0 (the "License");
+   you may not use this file except in compliance with the License.
+   You may obtain a copy of the License at
+
+   http://www.apache.org/licenses/LICENSE-2.0
+
+   Unless required by applicable law or agreed to in writing, software
+   distributed under the License is distributed on an "AS IS" BASIS,
+   WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+   See the License for the specific language governing permissions and
+   limitations under the License. */
+
 #define EIGEN_USE_GPU
 #include "paddle/operators/sigmoid_op.h"
 
diff --git a/paddle/operators/softmax_op.cc b/paddle/operators/softmax_op.cc
index 5b59fad7d5..70ac1b4c1a 100644
--- a/paddle/operators/softmax_op.cc
+++ b/paddle/operators/softmax_op.cc
@@ -11,6 +11,7 @@
    WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
    See the License for the specific language governing permissions and
    limitations under the License. */
+
 #include "paddle/operators/softmax_op.h"
 
 namespace paddle {
diff --git a/paddle/operators/softmax_op.cu b/paddle/operators/softmax_op.cu
index ddf8f6e913..d209eb82a4 100644
--- a/paddle/operators/softmax_op.cu
+++ b/paddle/operators/softmax_op.cu
@@ -1,3 +1,17 @@
+/* Copyright (c) 2016 PaddlePaddle Authors. All Rights Reserve.
+
+   Licensed under the Apache License, Version 2.0 (the "License");
+   you may not use this file except in compliance with the License.
+   You may obtain a copy of the License at
+
+   http://www.apache.org/licenses/LICENSE-2.0
+
+   Unless required by applicable law or agreed to in writing, software
+   distributed under the License is distributed on an "AS IS" BASIS,
+   WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+   See the License for the specific language governing permissions and
+   limitations under the License. */
+
 #define EIGEN_USE_GPU
 #include "paddle/framework/op_registry.h"
 #include "paddle/operators/softmax_op.h"
diff --git a/paddle/platform/device_context.h b/paddle/platform/device_context.h
index 2038fafe2e..48b9f5dcb5 100644
--- a/paddle/platform/device_context.h
+++ b/paddle/platform/device_context.h
@@ -40,7 +40,7 @@ class DeviceContext {
 class CPUDeviceContext : public DeviceContext {
  public:
   CPUDeviceContext();
-  CPUDeviceContext(CPUPlace);
+  explicit CPUDeviceContext(CPUPlace);
   virtual ~CPUDeviceContext() {}
 
   Eigen::DefaultDevice* eigen_device() const;
@@ -55,7 +55,7 @@ class CPUDeviceContext : public DeviceContext {
 
 class CUDADeviceContext : public DeviceContext {
  public:
-  explicit CUDADeviceContext(GPUPlace);
+  CUDADeviceContext(GPUPlace);  // NOLINT
   virtual ~CUDADeviceContext();
 
   /*! \brief  Wait for all operations completion in the stream. */
@@ -69,10 +69,10 @@ class CUDADeviceContext : public DeviceContext {
 
   // clang-format off
   /*! \brief  Return cublas handle in the device context. */
-  cublasHandle_t    cublas_handle   ();
+  cublasHandle_t    cublas_handle();
 
   /*! \brief  Return cudnn  handle in the device context. */
-  cudnnHandle_t     cudnn_handle    ();
+  cudnnHandle_t     cudnn_handle();
 
   /*! \brief  Return curand handle in the device context. */
   curandGenerator_t curand_generator();
diff --git a/paddle/platform/dynload/cublas.cc b/paddle/platform/dynload/cublas.cc
index 4e3dfdaefb..9cd2a1f565 100644
--- a/paddle/platform/dynload/cublas.cc
+++ b/paddle/platform/dynload/cublas.cc
@@ -1,3 +1,17 @@
+/* Copyright (c) 2016 PaddlePaddle Authors. All Rights Reserve.
+
+Licensed under the Apache License, Version 2.0 (the "License");
+you may not use this file except in compliance with the License.
+You may obtain a copy of the License at
+
+    http://www.apache.org/licenses/LICENSE-2.0
+
+Unless required by applicable law or agreed to in writing, software
+distributed under the License is distributed on an "AS IS" BASIS,
+WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+See the License for the specific language governing permissions and
+limitations under the License. */
+
 #include <paddle/platform/dynload/cublas.h>
 
 namespace paddle {
diff --git a/paddle/platform/dynload/cudnn.cc b/paddle/platform/dynload/cudnn.cc
index 8b5e15b5ef..d3e4cb567d 100644
--- a/paddle/platform/dynload/cudnn.cc
+++ b/paddle/platform/dynload/cudnn.cc
@@ -1,3 +1,17 @@
+/* Copyright (c) 2016 PaddlePaddle Authors. All Rights Reserve.
+
+Licensed under the Apache License, Version 2.0 (the "License");
+you may not use this file except in compliance with the License.
+You may obtain a copy of the License at
+
+    http://www.apache.org/licenses/LICENSE-2.0
+
+Unless required by applicable law or agreed to in writing, software
+distributed under the License is distributed on an "AS IS" BASIS,
+WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+See the License for the specific language governing permissions and
+limitations under the License. */
+
 #include <paddle/platform/dynload/cudnn.h>
 
 namespace paddle {
@@ -25,4 +39,4 @@ CUDNN_DNN_ROUTINE_EACH_R5(DEFINE_WRAP);
 
 }  // namespace dynload
 }  // namespace platform
-}  // namespace paddle
\ No newline at end of file
+}  // namespace paddle
diff --git a/paddle/platform/dynload/curand.cc b/paddle/platform/dynload/curand.cc
index 5c1fab992c..d05dd88126 100644
--- a/paddle/platform/dynload/curand.cc
+++ b/paddle/platform/dynload/curand.cc
@@ -1,3 +1,17 @@
+/* Copyright (c) 2016 PaddlePaddle Authors. All Rights Reserve.
+
+Licensed under the Apache License, Version 2.0 (the "License");
+you may not use this file except in compliance with the License.
+You may obtain a copy of the License at
+
+    http://www.apache.org/licenses/LICENSE-2.0
+
+Unless required by applicable law or agreed to in writing, software
+distributed under the License is distributed on an "AS IS" BASIS,
+WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+See the License for the specific language governing permissions and
+limitations under the License. */
+
 #include <paddle/platform/dynload/curand.h>
 
 namespace paddle {
@@ -10,6 +24,7 @@ void *curand_dso_handle;
 #define DEFINE_WRAP(__name) DynLoad__##__name __name
 
 CURAND_RAND_ROUTINE_EACH(DEFINE_WRAP);
-}
-}
-}
\ No newline at end of file
+
+}  // namespace dynload
+}  // namespace platform
+}  // namespace paddle
diff --git a/paddle/platform/place.h b/paddle/platform/place.h
index 7cead18388..a37ad38a8f 100644
--- a/paddle/platform/place.h
+++ b/paddle/platform/place.h
@@ -32,7 +32,7 @@ struct CPUPlace {
 
 struct GPUPlace {
   GPUPlace() : GPUPlace(0) {}
-  GPUPlace(int d) : device(d) {}
+  GPUPlace(int d) : device(d) {}  // NOLINT
 
   // needed for variant equality comparison
   inline bool operator==(const GPUPlace &o) const { return device == o.device; }
diff --git a/paddle/string/piece.h b/paddle/string/piece.h
index 0272529d1c..3b887490b5 100644
--- a/paddle/string/piece.h
+++ b/paddle/string/piece.h
@@ -39,8 +39,8 @@ public:
   // size_ is 0.
   Piece();
   Piece(const char* d, size_t n);
-  Piece(const char* d);
-  Piece(const std::string& s);
+  Piece(const char* d);         // NOLINT
+  Piece(const std::string& s);  // NOLINT
 
   const char* data() const { return data_; }
   size_t len() const { return size_; }

From 051fe1724f94397fc58df5f913c9b427fb63ebdb Mon Sep 17 00:00:00 2001
From: liaogang <liaogang@baidu.com>
Date: Fri, 4 Aug 2017 11:12:48 +0800
Subject: [PATCH 15/36] remove duplicate cpplint

---
 paddle/memory/CMakeLists.txt | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/paddle/memory/CMakeLists.txt b/paddle/memory/CMakeLists.txt
index eb2f5cb66a..8035d93bfe 100644
--- a/paddle/memory/CMakeLists.txt
+++ b/paddle/memory/CMakeLists.txt
@@ -1,7 +1,7 @@
 add_subdirectory(detail)
 
-cc_library(memory SRCS memory.h memory.cc)
-cc_library(memcpy SRCS memcpy.h memcpy.cc DEPS device_context)
+cc_library(memory SRCS memory.cc)
+cc_library(memcpy SRCS memcpy.cc DEPS device_context)
 
 cc_library(paddle_memory
     DEPS

From c6186120c32c98fb91609a1bffdc98c7df4f0aae Mon Sep 17 00:00:00 2001
From: liaogang <liaogang@baidu.com>
Date: Fri, 4 Aug 2017 11:17:35 +0800
Subject: [PATCH 16/36] fix softmax_op code line > 80

---
 paddle/operators/softmax_op.cu | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/paddle/operators/softmax_op.cu b/paddle/operators/softmax_op.cu
index d1115a7047..b79228580a 100644
--- a/paddle/operators/softmax_op.cu
+++ b/paddle/operators/softmax_op.cu
@@ -17,4 +17,5 @@
 #include "paddle/operators/softmax_op.h"
 
 REGISTER_OP_GPU_KERNEL(softmax, ops::SoftmaxKernel<ops::GPUPlace, float>);
-REGISTER_OP_GPU_KERNEL(softmax_grad, ops::SoftmaxGradKernel<ops::GPUPlace, float>);
+REGISTER_OP_GPU_KERNEL(softmax_grad,
+                       ops::SoftmaxGradKernel<ops::GPUPlace, float>);

From 5485caf7f7d557ec856c3ea8e95ae9f21f2f9ca8 Mon Sep 17 00:00:00 2001
From: Superjom <superjom@gmail.com>
Date: Fri, 4 Aug 2017 11:57:05 +0800
Subject: [PATCH 17/36] add EQ

---
 paddle/platform/enforce.h | 5 +++++
 1 file changed, 5 insertions(+)

diff --git a/paddle/platform/enforce.h b/paddle/platform/enforce.h
index 60a42c777d..7e03bf4425 100644
--- a/paddle/platform/enforce.h
+++ b/paddle/platform/enforce.h
@@ -162,5 +162,10 @@ inline void throw_on_error(T e) {
     }                                                                   \
   } while (0)
 
+#define PADDLE_ENFORCE_EQ(__VAL0, __VAL1)                                   \
+  PADDLE_ENFORCE((__VAL0) == (__VAL1), "enforce %s == %s failed, %s != %s", \
+                 #__VAL0, #__VAL1, std::to_string(__VAL0),                  \
+                 std::to_string(__VAL1));
+
 }  // namespace platform
 }  // namespace paddle

From 1a34becf4231c47d5074156a434629afc198d200 Mon Sep 17 00:00:00 2001
From: Yu Yang <yuyang18@baidu.com>
Date: Fri, 4 Aug 2017 12:21:26 +0800
Subject: [PATCH 18/36] Reset develop BaseMatrix.cu

---
 paddle/math/BaseMatrix.cu | 985 ++++++++++++++------------------------
 1 file changed, 366 insertions(+), 619 deletions(-)

diff --git a/paddle/math/BaseMatrix.cu b/paddle/math/BaseMatrix.cu
index 5435808fb7..ba2b47d6cc 100644
--- a/paddle/math/BaseMatrix.cu
+++ b/paddle/math/BaseMatrix.cu
@@ -12,21 +12,21 @@ WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 See the License for the specific language governing permissions and
 limitations under the License. */
 
-#include <paddle/utils/Logging.h>
-#include <string.h>
 #include <cmath>
+#include <string.h>
+#include <paddle/utils/Logging.h>
 #include "BaseMatrix.h"
-#include "MathFunctions.h"
-#include "SIMDFunctions.h"
-#include "hl_matrix_apply.cuh"
-#include "hl_matrix_base.cuh"
 #include "hl_matrix_ops.cuh"
+#include "hl_matrix_base.cuh"
+#include "hl_matrix_apply.cuh"
+#include "SIMDFunctions.h"
+#include "MathFunctions.h"
 
 namespace paddle {
 
 const char* SPARSE_SUPPORT_ERROR = "Sparse Matrix/Vector is not supported.";
 
-template <class T>
+template<class T>
 template <class Op>
 int BaseMatrixT<T>::applyUnary(Op op) {
   MatrixOffset offset(0, 0);
@@ -34,11 +34,9 @@ int BaseMatrixT<T>::applyUnary(Op op) {
   return 0;
 }
 
-template <class T>
+template<class T>
 template <class Op>
-int BaseMatrixT<T>::applyUnary(Op op,
-                               int numRows,
-                               int numCols,
+int BaseMatrixT<T>::applyUnary(Op op, int numRows, int numCols,
                                MatrixOffset& offset) {
   CHECK(!this->isSparse()) << SPARSE_SUPPORT_ERROR;
   int dimM = numRows;
@@ -58,7 +56,7 @@ int BaseMatrixT<T>::applyUnary(Op op,
   return 0;
 }
 
-template <class T>
+template<class T>
 template <class Op>
 int BaseMatrixT<T>::applyBinary(Op op, BaseMatrixT& b) {
   CHECK(height_ == b.height_ && width_ == b.width_)
@@ -69,23 +67,18 @@ int BaseMatrixT<T>::applyBinary(Op op, BaseMatrixT& b) {
   return 0;
 }
 
-template <class T>
+template<class T>
 template <class Op>
-int BaseMatrixT<T>::applyBinary(
-    Op op, BaseMatrixT& b, int numRows, int numCols, MatrixOffset& offset) {
+int BaseMatrixT<T>::applyBinary(Op op, BaseMatrixT& b, int numRows, int numCols,
+                                MatrixOffset& offset) {
   applyBinary(op, b, numRows, numCols, offset, false_type(), false_type());
   return 0;
 }
 
-template <class T>
+template<class T>
 template <class Op, class bAsRowVector, class bAsColVector>
-int BaseMatrixT<T>::applyBinary(Op op,
-                                BaseMatrixT& b,
-                                int numRows,
-                                int numCols,
-                                MatrixOffset& offset,
-                                bAsRowVector,
-                                bAsColVector) {
+int BaseMatrixT<T>::applyBinary(Op op, BaseMatrixT& b, int numRows, int numCols,
+                            MatrixOffset& offset, bAsRowVector, bAsColVector) {
   CHECK(!this->isSparse()) << SPARSE_SUPPORT_ERROR;
   CHECK(!b.isSparse()) << SPARSE_SUPPORT_ERROR;
   CHECK(useGpu_ == b.useGpu_) << "Matrix type mismatch";
@@ -98,8 +91,8 @@ int BaseMatrixT<T>::applyBinary(Op op,
   T* A = data_;
   T* B = b.data_;
   CAL_MATRIX_START_ADDRESS(A, height_, width_, lda, offset.aCol_, offset.aRow_);
-  CAL_MATRIX_START_ADDRESS(
-      B, b.height_, b.width_, ldb, offset.bCol_, offset.bRow_);
+  CAL_MATRIX_START_ADDRESS(B, b.height_, b.width_, ldb, offset.bCol_,
+                           offset.bRow_);
   CHECK_LE(dimM + offset.aRow_, this->height_);
   CHECK_LE(dimN + offset.aCol_, this->width_);
   if (!bAsRowVector::value && !bAsColVector::value) {
@@ -122,7 +115,7 @@ int BaseMatrixT<T>::applyBinary(Op op,
   return 0;
 }
 
-template <class T>
+template<class T>
 template <class Op>
 int BaseMatrixT<T>::applyTernary(Op op, BaseMatrixT& b, BaseMatrixT& c) {
   CHECK_EQ(height_, b.height_);
@@ -136,29 +129,21 @@ int BaseMatrixT<T>::applyTernary(Op op, BaseMatrixT& b, BaseMatrixT& c) {
   return 0;
 }
 
-template <class T>
+template<class T>
 template <class Op>
-int BaseMatrixT<T>::applyTernary(Op op,
-                                 BaseMatrixT& b,
-                                 BaseMatrixT& c,
-                                 int numRows,
-                                 int numCols,
+int BaseMatrixT<T>::applyTernary(Op op, BaseMatrixT& b, BaseMatrixT& c,
+                                 int numRows, int numCols,
                                  MatrixOffset& offset) {
   applyTernary(op, b, c, numRows, numCols, offset, false_type(), false_type());
 
   return 0;
 }
 
-template <class T>
+template<class T>
 template <class Op, class cAsRowVector, class cAsColVector>
-int BaseMatrixT<T>::applyTernary(Op op,
-                                 BaseMatrixT& b,
-                                 BaseMatrixT& c,
-                                 int numRows,
-                                 int numCols,
-                                 MatrixOffset& offset,
-                                 cAsRowVector,
-                                 cAsColVector) {
+int BaseMatrixT<T>::applyTernary(Op op, BaseMatrixT& b, BaseMatrixT& c,
+                                 int numRows, int numCols, MatrixOffset& offset,
+                                 cAsRowVector, cAsColVector) {
   CHECK(!this->isSparse()) << SPARSE_SUPPORT_ERROR;
   CHECK(!b.isSparse()) << SPARSE_SUPPORT_ERROR;
   CHECK(!c.isSparse()) << SPARSE_SUPPORT_ERROR;
@@ -175,10 +160,10 @@ int BaseMatrixT<T>::applyTernary(Op op,
   T* B = b.data_;
   T* C = c.data_;
   CAL_MATRIX_START_ADDRESS(A, height_, width_, lda, offset.aCol_, offset.aRow_);
-  CAL_MATRIX_START_ADDRESS(
-      B, b.height_, b.width_, ldb, offset.bCol_, offset.bRow_);
-  CAL_MATRIX_START_ADDRESS(
-      C, c.height_, c.width_, ldc, offset.cCol_, offset.cRow_);
+  CAL_MATRIX_START_ADDRESS(B, b.height_, b.width_, ldb, offset.bCol_,
+                           offset.bRow_);
+  CAL_MATRIX_START_ADDRESS(C, c.height_, c.width_, ldc, offset.cCol_,
+                           offset.cRow_);
 
   CHECK_LE(dimM + offset.aRow_, this->height_);
   CHECK_LE(dimN + offset.aCol_, this->width_);
@@ -195,21 +180,21 @@ int BaseMatrixT<T>::applyTernary(Op op,
   }
 
   if (true == useGpu_) {
-    hl_gpu_apply_ternary_op<T, Op, cAsRowVector::value, cAsColVector::value>(
+    hl_gpu_apply_ternary_op
+      <T, Op, cAsRowVector::value, cAsColVector::value>(
         op, A, B, C, dimM, dimN, lda, ldb, ldc);
   } else {
-    hl_cpu_apply_ternary_op<T, Op, cAsRowVector::value, cAsColVector::value>(
+    hl_cpu_apply_ternary_op
+      <T, Op, cAsRowVector::value, cAsColVector::value>(
         op, A, B, C, dimM, dimN, lda, ldb, ldc);
   }
 
   return 0;
 }
 
-template <class T>
+template<class T>
 template <class Op>
-int BaseMatrixT<T>::applyQuaternary(Op op,
-                                    BaseMatrixT& b,
-                                    BaseMatrixT& c,
+int BaseMatrixT<T>::applyQuaternary(Op op, BaseMatrixT& b, BaseMatrixT& c,
                                     BaseMatrixT& d) {
   CHECK_EQ(height_, b.height_);
   CHECK_EQ(width_, b.width_);
@@ -224,14 +209,10 @@ int BaseMatrixT<T>::applyQuaternary(Op op,
   return 0;
 }
 
-template <class T>
+template<class T>
 template <class Op>
-int BaseMatrixT<T>::applyQuaternary(Op op,
-                                    BaseMatrixT& b,
-                                    BaseMatrixT& c,
-                                    BaseMatrixT& d,
-                                    int numRows,
-                                    int numCols,
+int BaseMatrixT<T>::applyQuaternary(Op op, BaseMatrixT& b, BaseMatrixT& c,
+                                    BaseMatrixT& d, int numRows, int numCols,
                                     MatrixOffset& offset) {
   CHECK(!this->isSparse()) << SPARSE_SUPPORT_ERROR;
   CHECK(!b.isSparse()) << SPARSE_SUPPORT_ERROR;
@@ -253,12 +234,12 @@ int BaseMatrixT<T>::applyQuaternary(Op op,
   T* C = c.data_;
   T* D = d.data_;
   CAL_MATRIX_START_ADDRESS(A, height_, width_, lda, offset.aCol_, offset.aRow_);
-  CAL_MATRIX_START_ADDRESS(
-      B, b.height_, b.width_, ldb, offset.bCol_, offset.bRow_);
-  CAL_MATRIX_START_ADDRESS(
-      C, c.height_, c.width_, ldc, offset.cCol_, offset.cRow_);
-  CAL_MATRIX_START_ADDRESS(
-      D, d.height_, d.width_, ldd, offset.dCol_, offset.dRow_);
+  CAL_MATRIX_START_ADDRESS(B, b.height_, b.width_, ldb, offset.bCol_,
+                           offset.bRow_);
+  CAL_MATRIX_START_ADDRESS(C, c.height_, c.width_, ldc, offset.cCol_,
+                           offset.cRow_);
+  CAL_MATRIX_START_ADDRESS(D, d.height_, d.width_, ldd, offset.dCol_,
+                           offset.dRow_);
 
   CHECK_LE(dimM + offset.aRow_, this->height_);
   CHECK_LE(dimN + offset.aCol_, this->width_);
@@ -269,29 +250,22 @@ int BaseMatrixT<T>::applyQuaternary(Op op,
   CHECK_LE(dimM + offset.dRow_, d.height_);
   CHECK_LE(dimN + offset.dCol_, d.width_);
   if (true == useGpu_) {
-    hl_gpu_apply_quaternary_op(op, A, B, C, D, dimM, dimN, lda, ldb, ldc, ldd);
+    hl_gpu_apply_quaternary_op(op, A, B, C, D, dimM, dimN, lda, ldb,
+                               ldc, ldd);
   } else {
-    hl_cpu_apply_quaternary_op(op, A, B, C, D, dimM, dimN, lda, ldb, ldc, ldd);
+    hl_cpu_apply_quaternary_op(op, A, B, C, D, dimM, dimN, lda, ldb,
+                               ldc, ldd);
   }
 
   return 0;
 }
 
-template <class T>
-template <class Agg,
-          class Op,
-          class Saver,
-          class aAsRowVector,
+template<class T>
+template <class Agg, class Op, class Saver, class aAsRowVector,
           class aAsColVector>
-int BaseMatrixT<T>::aggregate(Agg agg,
-                              Op op,
-                              Saver sv,
-                              BaseMatrixT& b,
-                              int numRows,
-                              int numCols,
-                              MatrixOffset& offset,
-                              aAsRowVector,
-                              aAsColVector) {
+int BaseMatrixT<T>::aggregate(Agg agg, Op op, Saver sv, BaseMatrixT& b,
+                              int numRows, int numCols, MatrixOffset& offset,
+                              aAsRowVector, aAsColVector) {
   CHECK_EQ(useGpu_, b.useGpu_);
 
   int ld = stride_;
@@ -299,10 +273,10 @@ int BaseMatrixT<T>::aggregate(Agg agg,
 
   T* dst = data_;
   T* B = b.data_;
-  CAL_MATRIX_START_ADDRESS(
-      dst, height_, width_, ld, offset.aCol_, offset.aRow_);
-  CAL_MATRIX_START_ADDRESS(
-      B, b.height_, b.width_, ldb, offset.bCol_, offset.bRow_);
+  CAL_MATRIX_START_ADDRESS(dst, height_, width_, ld, offset.aCol_,
+                           offset.aRow_);
+  CAL_MATRIX_START_ADDRESS(B, b.height_, b.width_, ldb, offset.bCol_,
+                           offset.bRow_);
 
   if (aAsRowVector::value && !aAsColVector::value) {
     if (useGpu_) {
@@ -323,21 +297,12 @@ int BaseMatrixT<T>::aggregate(Agg agg,
   return 0;
 }
 
-template <class T>
-template <class Agg,
-          class Op,
-          class Saver,
-          class aAsRowVector,
+template<class T>
+template <class Agg, class Op, class Saver, class aAsRowVector,
           class aAsColVector>
-int BaseMatrixT<T>::aggregate(Agg agg,
-                              Op op,
-                              Saver sv,
-                              BaseMatrixT& b,
-                              BaseMatrixT& c,
-                              int numRows,
-                              int numCols,
-                              MatrixOffset& offset,
-                              aAsRowVector,
+int BaseMatrixT<T>::aggregate(Agg agg, Op op, Saver sv, BaseMatrixT& b,
+                              BaseMatrixT& c, int numRows, int numCols,
+                              MatrixOffset& offset, aAsRowVector,
                               aAsColVector) {
   CHECK_EQ(useGpu_, b.useGpu_);
   CHECK_EQ(useGpu_, c.useGpu_);
@@ -349,28 +314,28 @@ int BaseMatrixT<T>::aggregate(Agg agg,
   T* dst = data_;
   T* B = b.data_;
   T* C = c.data_;
-  CAL_MATRIX_START_ADDRESS(
-      dst, height_, width_, ld, offset.aCol_, offset.aRow_);
-  CAL_MATRIX_START_ADDRESS(
-      B, b.height_, b.width_, ldb, offset.bCol_, offset.bRow_);
-  CAL_MATRIX_START_ADDRESS(
-      C, c.height_, c.width_, ldc, offset.cCol_, offset.cRow_);
+  CAL_MATRIX_START_ADDRESS(dst, height_, width_, ld, offset.aCol_,
+                           offset.aRow_);
+  CAL_MATRIX_START_ADDRESS(B, b.height_, b.width_, ldb, offset.bCol_,
+                           offset.bRow_);
+  CAL_MATRIX_START_ADDRESS(C, c.height_, c.width_, ldc, offset.cCol_,
+                           offset.cRow_);
 
   if (aAsRowVector::value && !aAsColVector::value) {
     if (useGpu_) {
-      hl_gpu_matrix_column_op(
-          agg, op, sv, numRows, numCols, dst, B, ldb, C, ldc);
+      hl_gpu_matrix_column_op(agg, op, sv, numRows, numCols, dst, B,
+                              ldb, C, ldc);
     } else {
-      hl_cpu_matrix_column_op(
-          agg, op, sv, numRows, numCols, dst, B, ldb, C, ldc);
+      hl_cpu_matrix_column_op(agg, op, sv, numRows, numCols, dst, B,
+                              ldb, C, ldc);
     }
   } else if (!aAsRowVector::value && aAsColVector::value) {
     if (useGpu_) {
-      hl_gpu_matrix_row_op(
-          agg, op, sv, numRows, numCols, dst, ld, B, ldb, C, ldc);
+      hl_gpu_matrix_row_op(agg, op, sv, numRows, numCols, dst, ld, B,
+                           ldb, C, ldc);
     } else {
-      hl_cpu_matrix_row_op(
-          agg, op, sv, numRows, numCols, dst, ld, B, ldb, C, ldc);
+      hl_cpu_matrix_row_op(agg, op, sv, numRows, numCols, dst, ld, B,
+                           ldb, C, ldc);
     }
   } else {
     LOG(FATAL) << "not supported";
@@ -385,19 +350,15 @@ int BaseMatrixT<T>::aggregate(Agg agg,
  */
 
 DEFINE_MATRIX_UNARY_OP(Neg, a = -a);
-template <class T>
-void BaseMatrixT<T>::neg() {
-  applyUnary(unary::Neg<T>());
-}
+template<class T>
+void BaseMatrixT<T>::neg() { applyUnary(unary::Neg<T>()); }
 
 DEFINE_MATRIX_UNARY_OP(Exp, a = exp(a));
-template <>
-void BaseMatrixT<real>::exp2() {
-  applyUnary(unary::Exp<real>());
-}
+template<>
+void BaseMatrixT<real>::exp2() { applyUnary(unary::Exp<real>()); }
 
 DEFINE_MATRIX_UNARY_OP(Log, a = log(a));
-template <>
+template<>
 void BaseMatrixT<real>::log2() {
   if (useGpu_) {
     applyUnary(unary::Log<real>());
@@ -407,42 +368,30 @@ void BaseMatrixT<real>::log2() {
 }
 
 DEFINE_MATRIX_UNARY_OP(Sqrt, a = sqrt(a));
-template <>
-void BaseMatrixT<real>::sqrt2() {
-  applyUnary(unary::Sqrt<real>());
-}
+template<>
+void BaseMatrixT<real>::sqrt2() { applyUnary(unary::Sqrt<real>()); }
 
 DEFINE_MATRIX_UNARY_OP(Square, a = a * a);
-template <class T>
-void BaseMatrixT<T>::square2() {
-  applyUnary(unary::Square<T>());
-}
+template<class T>
+void BaseMatrixT<T>::square2() { applyUnary(unary::Square<T>()); }
 
 DEFINE_MATRIX_UNARY_OP(Reciprocal, a = 1.0f / a);
-template <class T>
-void BaseMatrixT<T>::reciprocal2() {
-  applyUnary(unary::Reciprocal<T>());
-}
+template<class T>
+void BaseMatrixT<T>::reciprocal2() { applyUnary(unary::Reciprocal<T>()); }
 
 DEFINE_MATRIX_UNARY_OP(Abs, a = a > 0 ? a : -a);
-template <class T>
-void BaseMatrixT<T>::abs2() {
-  applyUnary(unary::Abs<T>());
-}
+template<class T>
+void BaseMatrixT<T>::abs2() { applyUnary(unary::Abs<T>()); }
 
 DEFINE_MATRIX_UNARY_OP(Sign, a = (a > 0) - (a < 0));
-template <class T>
-void BaseMatrixT<T>::sign2() {
-  applyUnary(unary::Sign<T>());
-}
+template<class T>
+void BaseMatrixT<T>::sign2() { applyUnary(unary::Sign<T>()); }
 
 DEFINE_MATRIX_UNARY_OP(Zero, a = 0);
-template <class T>
-void BaseMatrixT<T>::zero() {
-  applyUnary(unary::Zero<T>());
-}
+template<class T>
+void BaseMatrixT<T>::zero() { applyUnary(unary::Zero<T>()); }
 
-template <class T>
+template<class T>
 void BaseMatrixT<T>::zeroAtOffset(int64_t columnOffset, int64_t numColumns) {
   int numRows = height_;
   int numCols = numColumns;
@@ -451,13 +400,11 @@ void BaseMatrixT<T>::zeroAtOffset(int64_t columnOffset, int64_t numColumns) {
 }
 
 DEFINE_MATRIX_UNARY_OP(One, a = 1);
-template <class T>
-void BaseMatrixT<T>::one() {
-  applyUnary(unary::One<T>());
-}
+template<class T>
+void BaseMatrixT<T>::one() { applyUnary(unary::One<T>()); }
 
 DEFINE_MATRIX_UNARY_PARAMETER_OP(Pow, ONE_PARAMETER, a = pow(a, p));
-template <>
+template<>
 void BaseMatrixT<real>::pow2(real p) {
   if (useGpu_) {
     applyUnary(unary::Pow<real>(p));
@@ -467,67 +414,51 @@ void BaseMatrixT<real>::pow2(real p) {
 }
 
 DEFINE_MATRIX_UNARY_PARAMETER_OP(SubScalar, ONE_PARAMETER, a -= p);
-template <class T>
-void BaseMatrixT<T>::subScalar(T p) {
-  applyUnary(unary::SubScalar<T>(p));
-}
+template<class T>
+void BaseMatrixT<T>::subScalar(T p) { applyUnary(unary::SubScalar<T>(p)); }
 
 DEFINE_MATRIX_UNARY_PARAMETER_OP(MulScalar, ONE_PARAMETER, a *= p);
-template <class T>
-void BaseMatrixT<T>::mulScalar(T p) {
-  applyUnary(unary::MulScalar<T>(p));
-}
+template<class T>
+void BaseMatrixT<T>::mulScalar(T p) { applyUnary(unary::MulScalar<T>(p)); }
 
 DEFINE_MATRIX_UNARY_PARAMETER_OP(DivScalar, ONE_PARAMETER, a /= p);
-template <class T>
-void BaseMatrixT<T>::divScalar(T p) {
-  applyUnary(unary::DivScalar<T>(p));
-}
+template<class T>
+void BaseMatrixT<T>::divScalar(T p) { applyUnary(unary::DivScalar<T>(p)); }
 
 DEFINE_MATRIX_UNARY_PARAMETER_OP(Assign, ONE_PARAMETER, a = p);
-template <class T>
-void BaseMatrixT<T>::assign(T p) {
-  applyUnary(unary::Assign<T>(p));
-}
+template<class T>
+void BaseMatrixT<T>::assign(T p) { applyUnary(unary::Assign<T>(p)); }
 
 DEFINE_MATRIX_UNARY_PARAMETER_OP(Add, ONE_PARAMETER, a += p);
-template <class T>
-void BaseMatrixT<T>::add(T p) {
-  applyUnary(unary::Add<T>(p));
-}
+template<class T>
+void BaseMatrixT<T>::add(T p) { applyUnary(unary::Add<T>(p)); }
 
 DEFINE_MATRIX_UNARY_PARAMETER_OP(Add2, TWO_PARAMETER, a = a * p1 + p2);
-template <class T>
-void BaseMatrixT<T>::add(T p1, T p2) {
-  applyUnary(unary::Add2<T>(p1, p2));
-}
+template<class T>
+void BaseMatrixT<T>::add(T p1, T p2) { applyUnary(unary::Add2<T>(p1, p2)); }
 
-DEFINE_MATRIX_UNARY_PARAMETER_OP(Clip,
-                                 TWO_PARAMETER,
+DEFINE_MATRIX_UNARY_PARAMETER_OP(Clip, TWO_PARAMETER,
                                  a = a < p1 ? p1 : (a > p2 ? p2 : a));
-template <class T>
-void BaseMatrixT<T>::clip(T p1, T p2) {
-  applyUnary(unary::Clip<T>(p1, p2));
-}
+template<class T>
+void BaseMatrixT<T>::clip(T p1, T p2) { applyUnary(unary::Clip<T>(p1, p2)); }
 
-DEFINE_MATRIX_BINARY_PARAMETER_OP(ClipDerivative,
-                                  TWO_PARAMETER,
-                                  a = b < p1 ? 0 : (b > p2 ? 0 : 1));
-template <class T>
+DEFINE_MATRIX_BINARY_PARAMETER_OP(ClipDerivative, TWO_PARAMETER,
+    a = b < p1 ? 0 : (b > p2 ? 0 : 1));
+template<class T>
 void BaseMatrixT<T>::clipDerivative(BaseMatrixT& b, T p1, T p2) {
   applyBinary(binary::ClipDerivative<T>(p1, p2), b);
 }
 
-DEFINE_MATRIX_UNARY_PARAMETER_OP(BiggerThanScalar,
-                                 ONE_PARAMETER,
+DEFINE_MATRIX_UNARY_PARAMETER_OP(BiggerThanScalar, ONE_PARAMETER,
                                  a = a > p ? 1.0f : 0.0f);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::biggerThanScalar(T p) {
   applyUnary(unary::BiggerThanScalar<T>(p));
 }
 
-DEFINE_MATRIX_UNARY_PARAMETER_OP(DownClip, ONE_PARAMETER, a = a > p ? a : p);
-template <class T>
+DEFINE_MATRIX_UNARY_PARAMETER_OP(DownClip, ONE_PARAMETER,
+                                 a = a > p ? a : p);
+template<class T>
 void BaseMatrixT<T>::downClip(T p) {
   applyUnary(unary::DownClip<T>(p));
 }
@@ -538,12 +469,12 @@ void BaseMatrixT<T>::downClip(T p) {
  */
 
 DEFINE_MATRIX_BINARY_OP(Add, a += b);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::add(BaseMatrixT& b) {
   applyBinary(binary::Add<T>(), b);
 }
 
-template <>
+template<>
 void BaseMatrixT<real>::add(BaseMatrixT& b) {
   if (useGpu_) {
     applyBinary(binary::Add<real>(), b);
@@ -554,7 +485,7 @@ void BaseMatrixT<real>::add(BaseMatrixT& b) {
   }
 }
 
-template <class T>
+template<class T>
 void BaseMatrixT<T>::addAtOffset(BaseMatrixT& b, int64_t columnOffset) {
   if (columnOffset + b.width_ <= width_) {
     int numRows = height_;
@@ -573,53 +504,43 @@ void BaseMatrixT<T>::addAtOffset(BaseMatrixT& b, int64_t columnOffset) {
   }
 }
 
-template <class T>
+template<class T>
 void BaseMatrixT<T>::addP2P(BaseMatrixT& b) {
   T* A = data_;
   T* B = b.data_;
   int dimM = height_;
   int dimN = width_;
 
-  hl_gpu_apply_binary_op<T, binary::Add<T>, 0, 0>(
-      binary::Add<T>(), A, B, dimM, dimN, dimN, dimN);
+  hl_gpu_apply_binary_op<T, binary::Add<T>, 0, 0>
+    (binary::Add<T>(), A, B, dimM, dimN, dimN, dimN);
 }
 
-template <class T>
+template<class T>
 void BaseMatrixT<T>::addColVector(BaseMatrixT& b) {
   MatrixOffset offset(0, 0, 0, 0);
   int numRows = height_;
   int numCols = width_;
-  applyBinary(binary::Add<T>(),
-              b,
-              numRows,
-              numCols,
-              offset,
-              false_type(),
+  applyBinary(binary::Add<T>(), b, numRows, numCols, offset, false_type(),
               true_type() /* bAsColVector */);
 }
 
-template <class T>
+template<class T>
 void BaseMatrixT<T>::addRowVector(BaseMatrixT& b) {
   MatrixOffset offset(0, 0, 0, 0);
   int numRows = height_;
   int numCols = width_;
-  applyBinary(binary::Add<T>(),
-              b,
-              numRows,
-              numCols,
-              offset,
-              true_type() /* bAsRowVector */,
-              false_type());
+  applyBinary(binary::Add<T>(), b, numRows, numCols, offset,
+              true_type() /* bAsRowVector */, false_type());
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(Add1, ONE_PARAMETER, a += b * p);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::add(BaseMatrixT& b, T p) {
   applyBinary(binary::Add1<T>(p), b);
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(Pow, ONE_PARAMETER, a = pow(b, p));
-template <>
+template<>
 void BaseMatrixT<real>::pow2(BaseMatrixT& b, real p) {
   if (useGpu_) {
     applyBinary(binary::Pow<real>(p), b);
@@ -629,45 +550,36 @@ void BaseMatrixT<real>::pow2(BaseMatrixT& b, real p) {
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(Add2, TWO_PARAMETER, a = p1 * a + p2 * b);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::add(BaseMatrixT& b, T p1, T p2) {
   applyBinary(binary::Add2<T>(p1, p2), b);
 }
 
-template <class T>
+template<class T>
 void BaseMatrixT<T>::addBias(BaseMatrixT& b, T scale) {
   MatrixOffset offset(0, 0, 0, 0);
   int numRows = height_;
   int numCols = width_;
-  applyBinary(binary::Add1<T>(scale),
-              b,
-              numRows,
-              numCols,
-              offset,
-              true_type() /* bAsRowVector */,
-              false_type());
+  applyBinary(binary::Add1<T>(scale), b, numRows, numCols, offset,
+              true_type() /* bAsRowVector */, false_type());
 }
 
 DEFINE_MATRIX_BINARY_OP(Sub, a -= b);
-template <class T>
-void BaseMatrixT<T>::sub(BaseMatrixT& b) {
-  applyBinary(binary::Sub<T>(), b);
-}
+template<class T>
+void BaseMatrixT<T>::sub(BaseMatrixT& b) { applyBinary(binary::Sub<T>(), b); }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(Sub1, ONE_PARAMETER, a -= b * p);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::sub(BaseMatrixT& b, T p) {
   applyBinary(binary::Sub1<T>(p), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(Relu, b = a > 0.0f ? a : 0.0f);
-template <class T>
-void BaseMatrixT<T>::relu(BaseMatrixT& b) {
-  applyBinary(binary::Relu<T>(), b);
-}
+template<class T>
+void BaseMatrixT<T>::relu(BaseMatrixT& b) { applyBinary(binary::Relu<T>(), b); }
 
 DEFINE_MATRIX_BINARY_OP(ReluDerivative, a *= (b > 0.0f ? 1.0f : 0.0f));
-template <class T>
+template<class T>
 void BaseMatrixT<T>::reluDerivative(BaseMatrixT& b) {
   applyBinary(binary::ReluDerivative<T>(), b);
 }
@@ -677,7 +589,7 @@ DEFINE_MATRIX_BINARY_OP(Softrelu, const T THRESHOLD = 40.0;
                                               ? THRESHOLD
                                               : ((a < -THRESHOLD) ? (-THRESHOLD)
                                                                   : a))));
-template <>
+template<>
 void BaseMatrixT<real>::softrelu(BaseMatrixT& b) {
   applyBinary(binary::Softrelu<real>(), b);
 }
@@ -687,100 +599,97 @@ DEFINE_MATRIX_BINARY_OP(
     a *= (1.0 - exp(-1.0 * ((b > THRESHOLD)
                                 ? THRESHOLD
                                 : ((b < -THRESHOLD) ? (-THRESHOLD) : b)))));
-template <>
+template<>
 void BaseMatrixT<real>::softreluDerivative(BaseMatrixT& b) {
   applyBinary(binary::SoftreluDerivative<real>(), b);
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(Brelu, TWO_PARAMETER, b = a > p1 ? a : p1;
                                   b = b < p2 ? b : p2);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::brelu(BaseMatrixT& b) {
-  int p1 = 0, p2 = 24;  //! TODO(yuyang18): Make p1,p2 configuable.
+  int p1 = 0, p2 = 24;    //! TODO(yuyang18): Make p1,p2 configuable.
   applyBinary(binary::Brelu<T>(p1, p2), b);
 }
 
-DEFINE_MATRIX_BINARY_PARAMETER_OP(BreluDerivative,
-                                  TWO_PARAMETER,
+DEFINE_MATRIX_BINARY_PARAMETER_OP(BreluDerivative, TWO_PARAMETER,
                                   a *= (b > p1 && b < p2) ? 1.0 : 0.0);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::breluDerivative(BaseMatrixT& b) {
   int p1 = 0, p2 = 24;
   applyBinary(binary::BreluDerivative<T>(p1, p2), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(Square, b = a * a);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::square2(BaseMatrixT& b) {
   applyBinary(binary::Square<T>(), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(SquareDerivative, a *= 2.0 * b);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::squareDerivative(BaseMatrixT& b) {
   applyBinary(binary::SquareDerivative<T>(), b);
 }
 
-DEFINE_MATRIX_BINARY_OP(Tanh, T tmp = -2.0 * a;
-                        tmp = (tmp > EXP_MAX_INPUT) ? EXP_MAX_INPUT : tmp;
-                        b = 2.0 / (1.0 + std::exp(tmp)) - 1.0);
-template <>
+DEFINE_MATRIX_BINARY_OP(Tanh,
+    T tmp = -2.0 * a;
+    tmp = (tmp > EXP_MAX_INPUT) ? EXP_MAX_INPUT : tmp;
+    b = 2.0 / (1.0 + std::exp(tmp)) - 1.0);
+template<>
 void BaseMatrixT<real>::tanh(BaseMatrixT& b) {
   applyBinary(binary::Tanh<real>(), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(TanhDerivative, a *= 1 - b * b);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::tanhDerivative(BaseMatrixT& b) {
   applyBinary(binary::TanhDerivative<T>(), b);
 }
 
-DEFINE_MATRIX_BINARY_PARAMETER_OP(
-    ScaledTanh, TWO_PARAMETER, b = p1 * (2.0 / (1.0 + exp(-2 * p2 * a)) - 1.0));
-template <>
+DEFINE_MATRIX_BINARY_PARAMETER_OP(ScaledTanh, TWO_PARAMETER,
+                                  b = p1 *
+                                      (2.0 / (1.0 + exp(-2 * p2 * a)) - 1.0));
+template<>
 void BaseMatrixT<real>::scaledTanh(BaseMatrixT& b, real p1, real p2) {
   applyBinary(binary::ScaledTanh<real>(p1, p2), b);
 }
 
-DEFINE_MATRIX_BINARY_PARAMETER_OP(ScaledTanhDerivative,
-                                  TWO_PARAMETER,
+DEFINE_MATRIX_BINARY_PARAMETER_OP(ScaledTanhDerivative, TWO_PARAMETER,
                                   a *= p2 * (p1 - b * b));
-template <class T>
+template<class T>
 void BaseMatrixT<T>::scaledTanhDerivative(BaseMatrixT& b, T p1, T p2) {
   applyBinary(binary::ScaledTanhDerivative<T>(p1 * p1, p2 / p1), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(Reciprocal, b = 1.0f / a);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::reciprocal2(BaseMatrixT& b) {
   applyBinary(binary::Reciprocal<T>(), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(ReciprocalDerivative, a *= -b * b);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::reciprocalDerivative(BaseMatrixT& b) {
   applyBinary(binary::ReciprocalDerivative<T>(), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(Abs, b = a > 0.0f ? a : -a);
-template <class T>
-void BaseMatrixT<T>::abs2(BaseMatrixT& b) {
-  applyBinary(binary::Abs<T>(), b);
-}
+template<class T>
+void BaseMatrixT<T>::abs2(BaseMatrixT& b) { applyBinary(binary::Abs<T>(), b); }
 
 DEFINE_MATRIX_BINARY_OP(AbsDerivative, a = (b > 0) ? a : (b < 0) ? -a : 0);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::absDerivative(BaseMatrixT& b) {
   applyBinary(binary::AbsDerivative<T>(), b);
 }
 
-DEFINE_MATRIX_BINARY_OP(Sigmoid, const T THRESHOLD_MIN = -40.0;
-                        const T THRESHOLD_MAX = 13.0;
-                        T tmp = (a < THRESHOLD_MIN)
-                                    ? THRESHOLD_MIN
-                                    : ((a > THRESHOLD_MAX) ? THRESHOLD_MAX : a);
-                        b = 1.0f / (1.0f + exp(-tmp)));
-template <>
+DEFINE_MATRIX_BINARY_OP(
+    Sigmoid, const T THRESHOLD_MIN = -40.0; const T THRESHOLD_MAX = 13.0;
+    T tmp = (a < THRESHOLD_MIN) ? THRESHOLD_MIN
+                                   : ((a > THRESHOLD_MAX) ? THRESHOLD_MAX : a);
+    b = 1.0f / (1.0f + exp(-tmp)));
+template<>
 void BaseMatrixT<real>::sigmoid(BaseMatrixT& b) {
   if (useGpu_) {
     applyBinary(binary::Sigmoid<real>(), b);
@@ -814,31 +723,31 @@ void BaseMatrixT<real>::sigmoid(BaseMatrixT& b) {
 }
 
 DEFINE_MATRIX_BINARY_OP(SigmoidDerivative, a *= b * (1 - b));
-template <class T>
+template<class T>
 void BaseMatrixT<T>::sigmoidDerivative(BaseMatrixT& b) {
   applyBinary(binary::SigmoidDerivative<T>(), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(ExpDerivative, a *= b);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::expDerivative(BaseMatrixT& b) {
   applyBinary(binary::ExpDerivative<T>(), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(Sign, b = a > 0.0f ? 1.0f : -1.0f);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::sign2(BaseMatrixT& b) {
   applyBinary(binary::Sign<T>(), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(Exp, a = exp(b));
-template <>
+template<>
 void BaseMatrixT<real>::exp2(BaseMatrixT& b) {
   applyBinary(binary::Exp<real>(), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(Log, a = log(b));
-template <>
+template<>
 void BaseMatrixT<real>::log2(BaseMatrixT& b) {
   if (useGpu_) {
     applyBinary(binary::Log<real>(), b);
@@ -848,13 +757,13 @@ void BaseMatrixT<real>::log2(BaseMatrixT& b) {
 }
 
 DEFINE_MATRIX_BINARY_OP(Sqrt, a = sqrt(b));
-template <>
+template<>
 void BaseMatrixT<real>::sqrt2(BaseMatrixT& b) {
   applyBinary(binary::Sqrt<real>(), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(InvSqrt, a = 1.0f / sqrt(b));
-template <>
+template<>
 void BaseMatrixT<real>::invSqrt(BaseMatrixT& b) {
   if (useGpu_) {
     applyBinary(binary::InvSqrt<real>(), b);
@@ -866,37 +775,37 @@ void BaseMatrixT<real>::invSqrt(BaseMatrixT& b) {
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(IsEqual, ONE_PARAMETER, a = (b == p));
-template <class T>
+template<class T>
 void BaseMatrixT<T>::isEqualTo(BaseMatrixT& b, T value) {
   applyBinary(binary::IsEqual<T>(value), b);
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(AddScalar, ONE_PARAMETER, a = b + p);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::addScalar(BaseMatrixT& b, T p) {
   applyBinary(binary::AddScalar<T>(p), b);
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(SubScalar, ONE_PARAMETER, a = b - p);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::subScalar(BaseMatrixT& b, T p) {
   applyBinary(binary::SubScalar<T>(p), b);
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(MulScalar, ONE_PARAMETER, a = b * p);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::mulScalar(BaseMatrixT& b, T p) {
   applyBinary(binary::MulScalar<T>(p), b);
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(DivScalar, ONE_PARAMETER, a = b / p);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::divScalar(BaseMatrixT& b, T p) {
   applyBinary(binary::DivScalar<T>(p), b);
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(ScalarDiv, ONE_PARAMETER, a = p / b);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::scalarDiv(BaseMatrixT& b, T p) {
   applyBinary(binary::ScalarDiv<T>(p), b);
 }
@@ -908,20 +817,20 @@ void BaseMatrixT<T>::scalarDiv(BaseMatrixT& b, T p) {
 
 DEFINE_MATRIX_TERNARY_OP(SoftCrossEntropy,
                          a = -c * log(b) - (1 - c) * log(1 - b));
-template <>
+template<>
 void BaseMatrixT<real>::softCrossEntropy(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::SoftCrossEntropy<real>(), b, c);
 }
 
 DEFINE_MATRIX_TERNARY_OP(SoftCrossEntropyBp, a += (b - c) / (b * (1 - b)));
-template <class T>
+template<class T>
 void BaseMatrixT<T>::softCrossEntropyBp(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::SoftCrossEntropyBp<T>(), b, c);
 }
 
 DEFINE_MATRIX_TERNARY_OP(BinaryCrossEntropy,
                          a = c > 0.5 ? -log(b) : -log(1.0 - b));
-template <>
+template<>
 void BaseMatrixT<real>::binaryLabelCrossEntropy(BaseMatrixT& b,
                                                 BaseMatrixT& c) {
   if (useGpu_) {
@@ -949,73 +858,70 @@ void BaseMatrixT<real>::binaryLabelCrossEntropy(BaseMatrixT& b,
 
 DEFINE_MATRIX_TERNARY_OP(BinaryCrossEntropyBp,
                          a += c > 0.5 ? -1.0 / b : 1.0 / (1.0 - b));
-template <class T>
+template<class T>
 void BaseMatrixT<T>::binaryLabelCrossEntropyBp(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::BinaryCrossEntropyBp<T>(), b, c);
 }
 
 DEFINE_MATRIX_TERNARY_OP(Add, a = b + c);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::add(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::Add<T>(), b, c);
 }
 
 DEFINE_MATRIX_TERNARY_PARAMETER_OP(Add1, TWO_PARAMETER, a = p1 * b + p2 * c);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::add(BaseMatrixT& b, T p1, BaseMatrixT& c, T p2) {
   applyTernary(ternary::Add1<T>(p1, p2), b, c);
 }
 
 DEFINE_MATRIX_TERNARY_OP(Sub, a = b - c);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::sub(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::Sub<T>(), b, c);
 }
 
 DEFINE_MATRIX_TERNARY_PARAMETER_OP(Sub1, TWO_PARAMETER, a = p1 * b - p2 * c);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::sub(BaseMatrixT& b, T p1, BaseMatrixT& c, T p2) {
   applyTernary(ternary::Sub1<T>(p1, p2), b, c);
 }
 
 DEFINE_MATRIX_TERNARY_OP(Add2, a = a + b + c);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::add2(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::Add2<T>(), b, c);
 }
 
-DEFINE_MATRIX_TERNARY_PARAMETER_OP(Add3,
-                                   THREE_PARAMETER,
+DEFINE_MATRIX_TERNARY_PARAMETER_OP(Add3, THREE_PARAMETER,
                                    a = p1 * a + p2 * b + p3 * c);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::add2(BaseMatrixT& b, BaseMatrixT& c, T p1, T p2, T p3) {
   applyTernary(ternary::Add3<T>(p1, p2, p3), b, c);
 }
 
-DEFINE_MATRIX_TERNARY_PARAMETER_OP(SgdUpdate,
-                                   THREE_PARAMETER,
+DEFINE_MATRIX_TERNARY_PARAMETER_OP(SgdUpdate, THREE_PARAMETER,
                                    c = p2 * c - p1 * (b + p3 * a);
                                    a = a + c);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::sgdUpdate(BaseMatrixT& b,  // grad
                                BaseMatrixT& c,  // mom
-                               T p1,            // learningRate,
-                               T p2,            // momentum,
-                               T p3) {          // decayRate
+                               T p1,        // learningRate,
+                               T p2,        // momentum,
+                               T p3) {      // decayRate
   applyTernary(ternary::SgdUpdate<T>(p1, p2, p3), b, c);
 }
 
-DEFINE_MATRIX_QUATERNARY_PARAMETER_OP(SgdUpdate,
-                                      THREE_PARAMETER,
+DEFINE_MATRIX_QUATERNARY_PARAMETER_OP(SgdUpdate, THREE_PARAMETER,
                                       c = p2 * c - p1 * d * (b + p3 * a);
                                       a += c);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::sgdUpdate(BaseMatrixT& b,  // grad,
                                BaseMatrixT& c,  // mom,
                                BaseMatrixT& d,  // lr,
-                               T p1,            // learningRate,
-                               T p2,            // momentum,
-                               T p3) {          // decayRate
+                               T p1,        // learningRate,
+                               T p2,        // momentum,
+                               T p3) {      // decayRate
   applyQuaternary(quaternary::SgdUpdate<T>(p1, p2, p3), b, c, d);
 }
 
@@ -1023,22 +929,19 @@ DEFINE_MATRIX_BINARY_PARAMETER_OP(ApplyL1, ONE_PARAMETER, T lambda = p * b;
                                   a = (a > lambda)
                                           ? (a - lambda)
                                           : (a < -lambda) ? (a + lambda) : 0);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::applyL1(BaseMatrixT& lr, T learningRate, T decayRate) {
   applyBinary(binary::ApplyL1<T>(learningRate * decayRate), lr);
 }
 
-template <>
+template<>
 void BaseMatrixT<real>::applyL1(BaseMatrixT& lr,
                                 real learningRate,
                                 real decayRate) {
   if (useGpu_) {
     applyBinary(binary::ApplyL1<real>(learningRate * decayRate), lr);
   } else {
-    simd::decayL1(this->data_,
-                  this->data_,
-                  lr.data_,
-                  learningRate * decayRate,
+    simd::decayL1(this->data_, this->data_, lr.data_, learningRate * decayRate,
                   height_ * width_);
   }
 }
@@ -1047,25 +950,24 @@ DEFINE_MATRIX_UNARY_PARAMETER_OP(ApplyL1, ONE_PARAMETER, T lambda = p;
                                  a = (a > lambda)
                                          ? (a - lambda)
                                          : (a < -lambda) ? (a + lambda) : 0);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::applyL1(T learningRate, T decayRate) {
   applyUnary(unary::ApplyL1<T>(learningRate * decayRate));
 }
 
-template <>
+template<>
 void BaseMatrixT<real>::applyL1(real learningRate, real decayRate) {
   if (useGpu_) {
     applyUnary(unary::ApplyL1<real>(learningRate * decayRate));
   } else {
-    simd::decayL1(
-        this->data_, this->data_, learningRate * decayRate, height_ * width_);
+    simd::decayL1(this->data_, this->data_, learningRate * decayRate,
+                  height_ * width_);
   }
 }
 
-DEFINE_MATRIX_BINARY_PARAMETER_OP(ApplyL2,
-                                  ONE_PARAMETER,
+DEFINE_MATRIX_BINARY_PARAMETER_OP(ApplyL2, ONE_PARAMETER,
                                   a *= (1.0f / (1.0f + p * b)));
-template <class T>
+template<class T>
 void BaseMatrixT<T>::applyL2(BaseMatrixT& lr, T learningRate, T decayRate) {
   if (useGpu_) {
     applyBinary(binary::ApplyL2<T>(learningRate * decayRate), lr);
@@ -1078,33 +980,32 @@ void BaseMatrixT<T>::applyL2(BaseMatrixT& lr, T learningRate, T decayRate) {
   }
 }
 
-template <class T>
+template<class T>
 void BaseMatrixT<T>::applyL2(T learningRate, T decayRate) {
   BaseMatrixT<T>::mulScalar(1.0f / (1.0f + learningRate * decayRate));
 }
 
 DEFINE_MATRIX_BINARY_OP(DotMul, a *= b);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::dotMul(BaseMatrixT& b) {
   applyBinary(binary::DotMul<T>(), b);
 }
 
 DEFINE_MATRIX_TERNARY_OP(DotMul, a = b * c);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::dotMul(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::DotMul<T>(), b, c);
 }
 
 DEFINE_MATRIX_TERNARY_OP(DotDiv, a = (b == 0.0) ? 0.0 : b / c);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::dotDiv(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::DotDiv<T>(), b, c);
 }
 
-DEFINE_MATRIX_TERNARY_PARAMETER_OP(DotDiv2P,
-                                   TWO_PARAMETER,
+DEFINE_MATRIX_TERNARY_PARAMETER_OP(DotDiv2P, TWO_PARAMETER,
                                    a = (b + p1) / (c + p2));
-template <class T>
+template<class T>
 void BaseMatrixT<T>::dotDiv(BaseMatrixT& b, BaseMatrixT& c, T p1, T p2) {
   applyTernary(ternary::DotDiv2P<T>(p1, p2), b, c);
 }
@@ -1114,7 +1015,7 @@ DEFINE_MATRIX_QUATERNARY_OP(RankLoss, const T THRESHOLD = 40.0; a = b - c;
                                     ? THRESHOLD
                                     : ((a < -THRESHOLD) ? (-THRESHOLD) : a);
                             a = log(1 + exp(a)) - a * d);
-template <>
+template<>
 void BaseMatrixT<real>::rankLoss(BaseMatrixT& b,
                                  BaseMatrixT& c,
                                  BaseMatrixT& d) {
@@ -1125,9 +1026,8 @@ DEFINE_MATRIX_QUATERNARY_OP(RankLossBp, const T THRESHOLD = 40.0; a = b - c;
                             a = (a > THRESHOLD)
                                     ? THRESHOLD
                                     : ((a < -THRESHOLD) ? (-THRESHOLD) : a);
-                            a = exp(a);
-                            a = (a / (1 + a) - d));
-template <>
+                            a = exp(a); a = (a / (1 + a) - d));
+template<>
 void BaseMatrixT<real>::rankLossBp(BaseMatrixT& b,
                                    BaseMatrixT& c,
                                    BaseMatrixT& d) {
@@ -1140,7 +1040,7 @@ DEFINE_MATRIX_TERNARY_OP(LogisticRegressionLoss, const T THRESHOLD = 40.0;
                                                                  ? -THRESHOLD
                                                                  : b;
                          a = log(1 + exp(x)) - c * x);
-template <>
+template<>
 void BaseMatrixT<real>::logisticRegressionLoss(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::LogisticRegressionLoss<real>(), b, c);
 }
@@ -1150,23 +1050,22 @@ DEFINE_MATRIX_TERNARY_OP(LogisticRegressionLossBp, const T THRESHOLD = 40.0;
                          T x = (b > THRESHOLD) ? THRESHOLD : (b < -THRESHOLD)
                                                                  ? -THRESHOLD
                                                                  : b;
-                         x = exp(x);
-                         a = x / (1 + x) - c);
-template <>
+                         x = exp(x); a = x / (1 + x) - c);
+template<>
 void BaseMatrixT<real>::logisticRegressionLossBp(BaseMatrixT& b,
                                                  BaseMatrixT& c) {
   applyTernary(ternary::LogisticRegressionLossBp<real>(), b, c);
 }
 
 DEFINE_MATRIX_TERNARY_OP(BiggerThan, a = (b > c) ? 1.0f : 0.0f);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::biggerThan(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::BiggerThan<T>(), b, c);
 }
 
 DEFINE_MATRIX_QUATERNARY_OP(
     BiggerThan, a = ((b > c && d > 0.5f) || (b < c && d < 0.5f)) ? 1.0f : 0.0f);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::biggerThan(BaseMatrixT& b,
                                 BaseMatrixT& c,
                                 BaseMatrixT& d) {
@@ -1174,34 +1073,25 @@ void BaseMatrixT<T>::biggerThan(BaseMatrixT& b,
 }
 
 DEFINE_MATRIX_TERNARY_OP(Max, a = (b > c) ? b : c);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::max2(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::Max<T>(), b, c);
 }
 
-DEFINE_MATRIX_TERNARY_PARAMETER_OP(BinaryClassificationError,
-                                   ONE_PARAMETER,
+DEFINE_MATRIX_TERNARY_PARAMETER_OP(BinaryClassificationError, ONE_PARAMETER,
                                    c += ((a > p) == (b > p)) ? 0.0f : 1.0f);
-template <class T>
-void BaseMatrixT<T>::binaryClassificationError2(size_t destCol,
-                                                BaseMatrixT& b,
-                                                BaseMatrixT& c,
-                                                T p) {
+template<class T>
+void BaseMatrixT<T>::binaryClassificationError2(size_t destCol, BaseMatrixT& b,
+                                                BaseMatrixT& c, T p) {
   CHECK(!useGpu_) << "do not support gpu";
   MatrixOffset offset(0, 0, 0, 0, destCol, 0);
   int numRows = b.height_;
   int numCols = b.width_;
-  b.applyTernary(ternary::BinaryClassificationError<T>(p),
-                 c,
-                 *this,
-                 numRows,
-                 numCols,
-                 offset,
-                 false_type(),
-                 true_type() /*cAsColVector*/);
+  b.applyTernary(ternary::BinaryClassificationError<T>(p), c, *this, numRows,
+                 numCols, offset, false_type(), true_type() /*cAsColVector*/);
 }
 
-template <>
+template<>
 void BaseMatrixT<real>::binaryClassificationError(size_t destCol,
                                                   BaseMatrixT& b,
                                                   BaseMatrixT& c,
@@ -1209,148 +1099,127 @@ void BaseMatrixT<real>::binaryClassificationError(size_t destCol,
   MatrixOffset offset(destCol, 0, 0, 0, 0, 0);
   int numRows = b.height_;
   int numCols = b.width_;
-  aggregate(aggregate::sum(),
-            base::binary::classificationError(p),
-            base::binary::add(),
-            b,
-            c,
-            numRows,
-            numCols,
-            offset,
-            false_type(),
+  aggregate(aggregate::sum(), base::binary::classificationError(p),
+            base::binary::add(), b, c, numRows, numCols, offset, false_type(),
             true_type() /*aAsColVector*/);
 }
 
-DEFINE_MATRIX_QUATERNARY_PARAMETER_OP(Add3,
-                                      THREE_PARAMETER,
+DEFINE_MATRIX_QUATERNARY_PARAMETER_OP(Add3, THREE_PARAMETER,
                                       a = p1 * b + p2 * c + p3 * d);
-template <class T>
-void BaseMatrixT<T>::add3(
-    BaseMatrixT& b, BaseMatrixT& c, BaseMatrixT& d, T p1, T p2, T p3) {
+template<class T>
+void BaseMatrixT<T>::add3(BaseMatrixT& b, BaseMatrixT& c, BaseMatrixT& d, T p1,
+                          T p2, T p3) {
   applyQuaternary(quaternary::Add3<T>(p1, p2, p3), b, c, d);
 }
 
 DEFINE_MATRIX_TERNARY_OP(DotMulSquare, a = b * c * c);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::dotMulSquare(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::DotMulSquare<T>(), b, c);
 }
 
 DEFINE_MATRIX_TERNARY_OP(DotSquareSquare, a = b * b * c * c);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::dotSquareSquare(BaseMatrixT& b, BaseMatrixT& c) {
   applyTernary(ternary::DotSquareSquare<T>(), b, c);
 }
 
 DEFINE_MATRIX_BINARY_OP(DotMulSquare, a *= b * b);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::dotMulSquare(BaseMatrixT& b) {
   applyBinary(binary::DotMulSquare<T>(), b);
 }
 
 DEFINE_MATRIX_BINARY_OP(DotSquareMul, a = a * a * b);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::dotSquareMul(BaseMatrixT& b) {
   applyBinary(binary::DotSquareMul<T>(), b);
 }
 
-DEFINE_MATRIX_QUATERNARY_PARAMETER_OP(AddSquareSum,
-                                      THREE_PARAMETER,
+DEFINE_MATRIX_QUATERNARY_PARAMETER_OP(AddSquareSum, THREE_PARAMETER,
                                       T tmp = p1 * b + p2 * c + p3 * d;
                                       a += tmp * tmp);
-template <class T>
-void BaseMatrixT<T>::addSquareSum(
-    BaseMatrixT& b, BaseMatrixT& c, BaseMatrixT d, T p1, T p2, T p3) {
+template<class T>
+void BaseMatrixT<T>::addSquareSum(BaseMatrixT& b, BaseMatrixT& c, BaseMatrixT d,
+                                  T p1, T p2, T p3) {
   applyQuaternary(quaternary::AddSquareSum<T>(p1, p2, p3), b, c, d);
 }
 
 DEFINE_MATRIX_BINARY_PARAMETER_OP(AddSquare, ONE_PARAMETER, a += p * b * b);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::addSquare(BaseMatrixT& b, T p) {
   applyBinary(binary::AddSquare<T>(p), b);
 }
 
-DEFINE_MATRIX_BINARY_PARAMETER_OP(DecayAddSquare,
-                                  TWO_PARAMETER,
+DEFINE_MATRIX_BINARY_PARAMETER_OP(DecayAddSquare, TWO_PARAMETER,
                                   a = p1 * a + p2 * b * b);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::decayAddSquare(BaseMatrixT& b, T p1, T p2) {
   applyBinary(binary::DecayAddSquare<T>(p1, p2), b);
 }
 
-DEFINE_MATRIX_TERNARY_PARAMETER_OP(DecayAddSquareMul,
-                                   TWO_PARAMETER,
+DEFINE_MATRIX_TERNARY_PARAMETER_OP(DecayAddSquareMul, TWO_PARAMETER,
                                    a = p1 * a + p2 * b * b * c * c);
-template <class T>
-void BaseMatrixT<T>::decayAddSquareMul(BaseMatrixT& b,
-                                       BaseMatrixT& c,
-                                       T p1,
+template<class T>
+void BaseMatrixT<T>::decayAddSquareMul(BaseMatrixT& b, BaseMatrixT& c, T p1,
                                        T p2) {
   applyTernary(ternary::DecayAddSquareMul<T>(p1, p2), b, c);
 }
 
-DEFINE_MATRIX_TERNARY_PARAMETER_OP(ReciprocalSum,
-                                   THREE_PARAMETER,
+DEFINE_MATRIX_TERNARY_PARAMETER_OP(ReciprocalSum, THREE_PARAMETER,
                                    a = 1 / (p1 * b + p2 * c + p3));
-template <class T>
-void BaseMatrixT<T>::reciprocalSum(
-    BaseMatrixT& b, BaseMatrixT& c, T p1, T p2, T p3) {
+template<class T>
+void BaseMatrixT<T>::reciprocalSum(BaseMatrixT& b, BaseMatrixT& c, T p1, T p2,
+                                   T p3) {
   applyTernary(ternary::ReciprocalSum<T>(p1, p2, p3), b, c);
 }
 
-DEFINE_MATRIX_BINARY_PARAMETER_OP(Reciprocal2,
-                                  TWO_PARAMETER,
+DEFINE_MATRIX_BINARY_PARAMETER_OP(Reciprocal2, TWO_PARAMETER,
                                   a = 1 / (p1 * b + p2));
-template <class T>
+template<class T>
 void BaseMatrixT<T>::reciprocal2(BaseMatrixT& b, T p1, T p2) {
   applyBinary(binary::Reciprocal2<T>(p1, p2), b);
 }
 
-DEFINE_MATRIX_TERNARY_PARAMETER_OP(DotMulSquareSum,
-                                   TWO_PARAMETER,
+DEFINE_MATRIX_TERNARY_PARAMETER_OP(DotMulSquareSum, TWO_PARAMETER,
                                    T tmp = p1 * b + p2 * c;
                                    a *= tmp * tmp);
-template <class T>
-void BaseMatrixT<T>::dotMulSquareSum(BaseMatrixT& b,
-                                     BaseMatrixT& c,
-                                     T p1,
+template<class T>
+void BaseMatrixT<T>::dotMulSquareSum(BaseMatrixT& b, BaseMatrixT& c, T p1,
                                      T p2) {
   applyTernary(ternary::DotMulSquareSum<T>(p1, p2), b, c);
 }
 
-DEFINE_MATRIX_TERNARY_PARAMETER_OP(DotSquareSum,
-                                   TWO_PARAMETER,
+DEFINE_MATRIX_TERNARY_PARAMETER_OP(DotSquareSum, TWO_PARAMETER,
                                    T tmp = p1 * b + p2 * c;
                                    a = tmp * tmp);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::dotSquareSum(BaseMatrixT& b, BaseMatrixT& c, T p1, T p2) {
   applyTernary(ternary::DotSquareSum<T>(p1, p2), b, c);
 }
 
-DEFINE_MATRIX_TERNARY_PARAMETER_OP(DotMulSum,
-                                   TWO_PARAMETER,
+DEFINE_MATRIX_TERNARY_PARAMETER_OP(DotMulSum, TWO_PARAMETER,
                                    a *= p1 * b + p2 * c);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::dotMulSum(BaseMatrixT& b, BaseMatrixT& c, T p1, T p2) {
   applyTernary(ternary::DotMulSum<T>(p1, p2), b, c);
 }
 
 DEFINE_MATRIX_BINARY_OP(CopyAndClear, b = a; a = 0);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::copyAndClear(BaseMatrixT& b) {
   applyBinary(binary::CopyAndClear<T>(), b);
 }
 
-DEFINE_MATRIX_TERNARY_PARAMETER_OP(AddDotMul,
-                                   TWO_PARAMETER,
+DEFINE_MATRIX_TERNARY_PARAMETER_OP(AddDotMul, TWO_PARAMETER,
                                    a = p1 * a + p2 * b * c);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::addDotMul(BaseMatrixT& b, BaseMatrixT& c, T p1, T p2) {
   applyTernary(ternary::AddDotMul<T>(p1, p2), b, c);
 }
 
 DEFINE_MATRIX_BINARY_OP(Assign, a = b;);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::assign(BaseMatrixT& b) {
   if (useGpu_) {
     applyBinary(binary::Assign<T>(), b);
@@ -1361,7 +1230,7 @@ void BaseMatrixT<T>::assign(BaseMatrixT& b) {
   }
 }
 
-template <class T>
+template<class T>
 void BaseMatrixT<T>::assignAtOffset(BaseMatrixT& b, int64_t columnOffset) {
   if (columnOffset + b.width_ <= width_) {
     int numRows = height_;
@@ -1381,31 +1250,24 @@ void BaseMatrixT<T>::assignAtOffset(BaseMatrixT& b, int64_t columnOffset) {
 }
 
 DEFINE_MATRIX_BINARY_OP(DeepSwap, T tmp = a; a = b; b = tmp);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::deepSwap(BaseMatrixT& b) {
-  applyBinary(binary::DeepSwap<T>(), b);
+    applyBinary(binary::DeepSwap<T>(), b);
 }
 
-template <>
+template<>
 void BaseMatrixT<real>::rowDotMul(size_t destCol,
                                   BaseMatrixT& b,
                                   BaseMatrixT& c) {
   int numRows = b.height_;
   int numCols = b.width_;
   MatrixOffset offset(destCol, 0, 0, 0, 0, 0);
-  aggregate(aggregate::sum(),
-            base::binary::mul(),
-            base::binary::add(),
-            b,
-            c,
-            numRows,
-            numCols,
-            offset,
-            false_type(),
+  aggregate(aggregate::sum(), base::binary::mul(), base::binary::add(), b, c,
+            numRows, numCols, offset, false_type(),
             true_type() /*aAsColVector*/);
 }
 
-template <class T>
+template<class T>
 void BaseMatrixT<T>::rowDotMul2(size_t destCol,
                                 BaseMatrixT& b,
                                 BaseMatrixT& c) {
@@ -1428,24 +1290,17 @@ void BaseMatrixT<T>::rowDotMul2(size_t destCol,
   }
 }
 
-template <>
+template<>
 void BaseMatrixT<real>::addDotMulVMM(BaseMatrixT& b, BaseMatrixT& c) {
   MatrixOffset offset(0, 0, 0, 0, 0, 0);
   int numRows = b.height_;
   int numCols = b.width_;
-  aggregate(aggregate::sum(),
-            base::binary::mul(),
-            base::binary::add(),
-            b,
-            c,
-            numRows,
-            numCols,
-            offset,
-            true_type() /*aAsRowVector*/,
+  aggregate(aggregate::sum(), base::binary::mul(), base::binary::add(), b, c,
+            numRows, numCols, offset, true_type() /*aAsRowVector*/,
             false_type());
 }
 
-template <class T>
+template<class T>
 void BaseMatrixT<T>::addDotMulVMM2(BaseMatrixT& b, BaseMatrixT& c) {
   CHECK(!useGpu_) << "do not support gpu";
 
@@ -1466,22 +1321,16 @@ void BaseMatrixT<T>::addDotMulVMM2(BaseMatrixT& b, BaseMatrixT& c) {
 }
 
 DEFINE_MATRIX_TERNARY_OP(addDotMulMMV, a += b * c);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::addDotMulMMV(BaseMatrixT& b, BaseMatrixT& c) {
   MatrixOffset offset(0, 0, 0, 0, 0, 0);
   int numRows = height_;
   int numCols = width_;
-  applyTernary(ternary::addDotMulMMV<T>(),
-               b,
-               c,
-               numRows,
-               numCols,
-               offset,
-               true_type() /*cAsRowVector*/,
-               false_type());
+  applyTernary(ternary::addDotMulMMV<T>(), b, c, numRows, numCols, offset,
+               true_type() /*cAsRowVector*/, false_type());
 }
 
-template <class T>
+template<class T>
 void BaseMatrixT<T>::addDotMulMMV2(BaseMatrixT& b, BaseMatrixT& c) {
   CHECK(!useGpu_) << "do not support gpu";
 
@@ -1501,22 +1350,16 @@ void BaseMatrixT<T>::addDotMulMMV2(BaseMatrixT& b, BaseMatrixT& c) {
   }
 }
 
-template <class T>
+template<class T>
 void BaseMatrixT<T>::rowScale(size_t cCol, BaseMatrixT& b, BaseMatrixT& c) {
   MatrixOffset offset(0, 0, 0, 0, cCol, 0);
   int numRows = height_;
   int numCols = width_;
-  applyTernary(ternary::DotMul<T>(),
-               b,
-               c,
-               numRows,
-               numCols,
-               offset,
-               false_type(),
-               true_type() /*cAsColVector*/);
+  applyTernary(ternary::DotMul<T>(), b, c, numRows, numCols, offset,
+    false_type(), true_type() /*cAsColVector*/);
 }
 
-template <class T>
+template<class T>
 void BaseMatrixT<T>::rowScale2(size_t cCol, BaseMatrixT& b, BaseMatrixT& c) {
   CHECK(!useGpu_) << "do not support gpu";
 
@@ -1536,82 +1379,52 @@ void BaseMatrixT<T>::rowScale2(size_t cCol, BaseMatrixT& b, BaseMatrixT& c) {
   }
 }
 
-template <class T>
+template<class T>
 void BaseMatrixT<T>::colScale(size_t cRow, BaseMatrixT& b, BaseMatrixT& c) {
   MatrixOffset offset(0, 0, 0, 0, 0, cRow);
   int numRows = height_;
   int numCols = width_;
-  applyTernary(ternary::DotMul<T>(),
-               b,
-               c,
-               numRows,
-               numCols,
-               offset,
-               true_type() /* cAsRowVector */,
-               false_type() /* cAsColVector */);
+  applyTernary(ternary::DotMul<T>(), b, c, numRows, numCols, offset,
+               true_type() /* cAsRowVector */, false_type() /* cAsColVector */);
 }
 
-template <class T>
+template<class T>
 void BaseMatrixT<T>::addColScale(size_t cRow, BaseMatrixT& b, BaseMatrixT& c) {
   MatrixOffset offset(0, 0, 0, 0, 0, cRow);
   int numRows = height_;
   int numCols = width_;
-  applyTernary(ternary::addDotMulMMV<T>(),
-               b,
-               c,
-               numRows,
-               numCols,
-               offset,
-               true_type() /* cAsRowVector */,
-               false_type() /* cAsColVector */);
+  applyTernary(ternary::addDotMulMMV<T>(), b, c, numRows, numCols, offset,
+               true_type() /* cAsRowVector */, false_type() /* cAsColVector */);
 }
 
-template <class T>
+template<class T>
 void BaseMatrixT<T>::addRowScale(size_t cCol, BaseMatrixT& b, BaseMatrixT& c) {
   MatrixOffset offset(0, 0, 0, 0, cCol, 0);
   int numRows = height_;
   int numCols = width_;
-  applyTernary(ternary::addDotMulMMV<T>(),
-               b,
-               c,
-               numRows,
-               numCols,
-               offset,
-               false_type(),
-               true_type() /*cAsColVector*/);
+  applyTernary(ternary::addDotMulMMV<T>(), b, c, numRows, numCols, offset,
+               false_type(), true_type() /*cAsColVector*/);
 }
 
 DEFINE_MATRIX_TERNARY_PARAMETER_OP(RowAdd, ONE_PARAMETER, a = b + p * c);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::rowAdd(size_t cCol, BaseMatrixT& b, BaseMatrixT& c, T p) {
   MatrixOffset offset(0, 0, 0, 0, cCol, 0);
   int numRows = height_;
   int numCols = width_;
-  applyTernary(ternary::RowAdd<T>(p),
-               b,
-               c,
-               numRows,
-               numCols,
-               offset,
-               false_type(),
-               true_type() /*cAsColVector*/);
+  applyTernary(ternary::RowAdd<T>(p), b, c, numRows, numCols, offset,
+    false_type(), true_type() /*cAsColVector*/);
 }
 
 DEFINE_MATRIX_TERNARY_OP(RowPow, a = pow(b, c));
-template <>
+template<>
 void BaseMatrixT<real>::rowPow(size_t cCol, BaseMatrixT& b, BaseMatrixT& c) {
   if (useGpu_) {
     MatrixOffset offset(0, 0, 0, 0, cCol, 0);
     int numRows = height_;
     int numCols = width_;
-    applyTernary(ternary::RowPow<real>(),
-                 b,
-                 c,
-                 numRows,
-                 numCols,
-                 offset,
-                 false_type(),
-                 true_type() /*cAsColVector*/);
+    applyTernary(ternary::RowPow<real>(), b, c, numRows, numCols, offset,
+                 false_type(), true_type() /*cAsColVector*/);
   } else {
     size_t height = this->height_;
     size_t width = this->width_;
@@ -1628,64 +1441,44 @@ void BaseMatrixT<real>::rowPow(size_t cCol, BaseMatrixT& b, BaseMatrixT& c) {
   }
 }
 
-template <class T>
+template<class T>
 void BaseMatrixT<T>::mulRowVector(BaseMatrixT& b) {
   MatrixOffset offset(0, 0, 0, 0);
   int numRows = height_;
   int numCols = width_;
-  applyBinary(binary::DotMul<T>(),
-              b,
-              numRows,
-              numCols,
-              offset,
-              true_type() /* bAsRowVector */,
-              false_type());
+  applyBinary(binary::DotMul<T>(), b, numRows, numCols, offset,
+              true_type() /* bAsRowVector */, false_type());
 }
 
 DEFINE_MATRIX_BINARY_OP(DotDiv, a /= b);
-template <class T>
+template<class T>
 void BaseMatrixT<T>::divRowVector(BaseMatrixT& b) {
   MatrixOffset offset(0, 0, 0, 0);
   int numRows = height_;
   int numCols = width_;
-  applyBinary(binary::DotDiv<T>(),
-              b,
-              numRows,
-              numCols,
-              offset,
-              true_type() /* bAsRowVector */,
-              false_type());
+  applyBinary(binary::DotDiv<T>(), b, numRows, numCols, offset,
+              true_type() /* bAsRowVector */, false_type());
 }
 
-template <class T>
+template<class T>
 void BaseMatrixT<T>::mulColVector(BaseMatrixT& b) {
   MatrixOffset offset(0, 0, 0, 0);
   int numRows = height_;
   int numCols = width_;
-  applyBinary(binary::DotMul<T>(),
-              b,
-              numRows,
-              numCols,
-              offset,
-              false_type(),
-              true_type() /* bAsColVector */);
+  applyBinary(binary::DotMul<T>(), b, numRows, numCols, offset,
+              false_type(), true_type() /* bAsColVector */);
 }
 
-template <class T>
+template<class T>
 void BaseMatrixT<T>::divColVector(BaseMatrixT& b) {
   MatrixOffset offset(0, 0, 0, 0);
   int numRows = height_;
   int numCols = width_;
-  applyBinary(binary::DotDiv<T>(),
-              b,
-              numRows,
-              numCols,
-              offset,
-              false_type(),
-              true_type() /* bAsColVector */);
+  applyBinary(binary::DotDiv<T>(), b, numRows, numCols, offset,
+              false_type(), true_type() /* bAsColVector */);
 }
 
-template <>
+template<>
 template <class Agg>
 int BaseMatrixT<real>::applyRow(Agg agg, BaseMatrixT& b) {
   MatrixOffset offset(0, 0, 0, 0, 0, 0);
@@ -1693,20 +1486,13 @@ int BaseMatrixT<real>::applyRow(Agg agg, BaseMatrixT& b) {
   size_t numCols = b.width_;
   CHECK_EQ(height_, numRows);
   CHECK_EQ(width_, 1UL);
-  aggregate(agg,
-            base::unary::identity(),
-            base::binary::second(),
-            b,
-            numRows,
-            numCols,
-            offset,
-            false_type(),
-            true_type() /*aAsColVector*/);
+  aggregate(agg, base::unary::identity(), base::binary::second(), b, numRows,
+            numCols, offset, false_type(), true_type() /*aAsColVector*/);
 
   return 0;
 }
 
-template <>
+template<>
 template <class Agg, class Saver>
 int BaseMatrixT<real>::applyRow(Agg agg, Saver sv, BaseMatrixT& b) {
   MatrixOffset offset(0, 0, 0, 0, 0, 0);
@@ -1714,25 +1500,16 @@ int BaseMatrixT<real>::applyRow(Agg agg, Saver sv, BaseMatrixT& b) {
   size_t numCols = b.width_;
   CHECK_EQ(height_, numRows);
   CHECK_EQ(width_, 1UL);
-  aggregate(agg,
-            base::unary::identity(),
-            sv,
-            b,
-            numRows,
-            numCols,
-            offset,
-            false_type(),
-            true_type() /*aAsColVector*/);
+  aggregate(agg, base::unary::identity(), sv, b, numRows, numCols, offset,
+            false_type(), true_type() /*aAsColVector*/);
 
   return 0;
 }
 
-template <>
+template<>
 template <class Agg>
-int BaseMatrixT<real>::applyRow(Agg agg,
-                                real scaleDest,
-                                real scaleAgg,
-                                BaseMatrixT& b) {
+int BaseMatrixT<real>::applyRow(
+     Agg agg, real scaleDest, real scaleAgg, BaseMatrixT& b) {
   if (scaleDest != 0) {
     applyRow(agg, base::binary::add2(scaleDest, scaleAgg), b);
   } else {
@@ -1744,10 +1521,10 @@ int BaseMatrixT<real>::applyRow(Agg agg,
   return 0;
 }
 
-template <>
+template<>
 template <class Agg, class Op, class Saver>
-int BaseMatrixT<real>::applyRow(
-    Agg agg, Op op, Saver sv, BaseMatrixT& b, BaseMatrixT& c) {
+int BaseMatrixT<real>::applyRow(Agg agg, Op op, Saver sv,
+                                BaseMatrixT& b, BaseMatrixT& c) {
   MatrixOffset offset(0, 0, 0, 0, 0, 0);
   size_t numRows = b.height_;
   size_t numCols = b.width_;
@@ -1755,27 +1532,16 @@ int BaseMatrixT<real>::applyRow(
   CHECK_EQ(width_, 1UL);
   CHECK_EQ(c.height_, numRows);
   CHECK_EQ(c.width_, numCols);
-  aggregate(agg,
-            op,
-            sv,
-            b,
-            c,
-            numRows,
-            numCols,
-            offset,
-            false_type(),
-            true_type() /*aAsColVector*/);
+  aggregate(agg, op, sv,
+            b, c, numRows, numCols, offset,
+            false_type(), true_type() /*aAsColVector*/);
   return 0;
 }
 
-template <>
+template<>
 template <class Agg, class Op>
-int BaseMatrixT<real>::applyRow(Agg agg,
-                                Op op,
-                                real scaleDest,
-                                real scaleAgg,
-                                BaseMatrixT& b,
-                                BaseMatrixT& c) {
+int BaseMatrixT<real>::applyRow(Agg agg, Op op, real scaleDest, real scaleAgg,
+                                BaseMatrixT& b, BaseMatrixT& c) {
   if (scaleDest != 0) {
     applyRow(agg, op, base::binary::add2(scaleDest, scaleAgg), b, c);
   } else {
@@ -1787,7 +1553,7 @@ int BaseMatrixT<real>::applyRow(Agg agg,
   return 0;
 }
 
-template <>
+template<>
 template <class Agg>
 int BaseMatrixT<real>::applyCol(Agg agg, BaseMatrixT& b) {
   MatrixOffset offset(0, 0, 0, 0, 0, 0);
@@ -1795,20 +1561,13 @@ int BaseMatrixT<real>::applyCol(Agg agg, BaseMatrixT& b) {
   size_t numCols = b.width_;
   CHECK_EQ(width_, numCols);
   CHECK_EQ(height_, 1UL);
-  aggregate(agg,
-            base::unary::identity(),
-            base::binary::second(),
-            b,
-            numRows,
-            numCols,
-            offset,
-            true_type() /*aAsRowVector*/,
-            false_type());
+  aggregate(agg, base::unary::identity(), base::binary::second(), b, numRows,
+            numCols, offset, true_type() /*aAsRowVector*/, false_type());
 
   return 0;
 }
 
-template <>
+template<>
 template <class Agg, class Saver>
 int BaseMatrixT<real>::applyCol(Agg agg, Saver sv, BaseMatrixT& b) {
   MatrixOffset offset(0, 0, 0, 0, 0, 0);
@@ -1816,25 +1575,16 @@ int BaseMatrixT<real>::applyCol(Agg agg, Saver sv, BaseMatrixT& b) {
   size_t numCols = b.width_;
   CHECK_EQ(width_, numCols);
   CHECK_EQ(height_, 1UL);
-  aggregate(agg,
-            base::unary::identity(),
-            sv,
-            b,
-            numRows,
-            numCols,
-            offset,
-            true_type() /*aAsRowVector*/,
-            false_type());
+  aggregate(agg, base::unary::identity(), sv, b, numRows, numCols, offset,
+            true_type() /*aAsRowVector*/, false_type());
 
   return 0;
 }
 
-template <>
+template<>
 template <class Agg>
-int BaseMatrixT<real>::applyCol(Agg agg,
-                                real scaleDest,
-                                real scaleAgg,
-                                BaseMatrixT& b) {
+int BaseMatrixT<real>::applyCol(
+     Agg agg, real scaleDest, real scaleAgg, BaseMatrixT& b) {
   if (scaleDest != 0) {
     applyCol(agg, base::binary::add2(scaleDest, scaleAgg), b);
   } else {
@@ -1846,51 +1596,48 @@ int BaseMatrixT<real>::applyCol(Agg agg,
   return 0;
 }
 
-template <>
+template<>
 void BaseMatrixT<real>::sumRows(BaseMatrixT& b, real scaleSum, real scaleDest) {
   applyRow(aggregate::sum(), scaleDest, scaleSum, b);
 }
 
-template <>
+template<>
 void BaseMatrixT<real>::maxRows(BaseMatrixT& b) {
   applyRow(aggregate::max(), b);
 }
 
-template <>
+template<>
 void BaseMatrixT<real>::minRows(BaseMatrixT& b) {
   applyRow(aggregate::min(), b);
 }
 
-template <>
+template<>
 void BaseMatrixT<real>::maxCols(BaseMatrixT& b) {
   applyCol(aggregate::max(), b);
 }
 
-template <>
+template<>
 void BaseMatrixT<real>::minCols(BaseMatrixT& b) {
   applyCol(aggregate::min(), b);
 }
 
-template <>
+template<>
 void BaseMatrixT<real>::sumCols(BaseMatrixT& b, real scaleSum, real scaleDest) {
   applyCol(aggregate::sum(), scaleDest, scaleSum, b);
 }
 
-template <>
-void BaseMatrixT<real>::sumOfSquaredDiffs(BaseMatrixT& b,
-                                          BaseMatrixT& c,
-                                          real scaleSum,
-                                          real scaleDest) {
-  applyRow(
-      aggregate::sum(), base::binary::squaredDiff(), scaleDest, scaleSum, b, c);
+template<>
+void BaseMatrixT<real>::sumOfSquaredDiffs(
+    BaseMatrixT& b, BaseMatrixT& c, real scaleSum, real scaleDest) {
+  applyRow(aggregate::sum(), base::binary::squaredDiff(),
+           scaleDest, scaleSum, b, c);
 }
 
-template <>
-void BaseMatrixT<real>::sumOfProducts(BaseMatrixT& b,
-                                      BaseMatrixT& c,
-                                      real scaleSum,
-                                      real scaleDest) {
-  applyRow(aggregate::sum(), base::binary::mul(), scaleDest, scaleSum, b, c);
+template<>
+void BaseMatrixT<real>::sumOfProducts(
+    BaseMatrixT& b, BaseMatrixT& c, real scaleSum, real scaleDest) {
+  applyRow(aggregate::sum(), base::binary::mul(),
+           scaleDest, scaleSum, b, c);
 }
 
 template class BaseMatrixT<real>;

From 4b41a28d641007a4b237c818e70cdd6e079465e8 Mon Sep 17 00:00:00 2001
From: Yi Wang <yi.wang.2005@gmail.com>
Date: Thu, 3 Aug 2017 21:32:35 -0700
Subject: [PATCH 19/36] Disable MKL and OpenMP by default

---
 CMakeLists.txt | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index b174831109..c7d743e193 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -36,8 +36,8 @@ include(simd)
 ################################ Configurations #######################################
 option(WITH_GPU         "Compile PaddlePaddle with NVIDIA GPU"          ${CUDA_FOUND})
 option(WITH_AVX         "Compile PaddlePaddle with AVX intrinsics"      ${AVX_FOUND})
-option(WITH_MKLDNN      "Compile PaddlePaddle with mkl-dnn support."    ${AVX_FOUND})
-option(WITH_MKLML       "Compile PaddlePaddle with mklml package."      ${AVX_FOUND})
+option(WITH_MKLDNN      "Compile PaddlePaddle with mkl-dnn support."    OFF)
+option(WITH_MKLML       "Compile PaddlePaddle with mklml package."      OFF)
 option(WITH_DSO         "Compile PaddlePaddle with dynamic linked CUDA" ON)
 option(WITH_TESTING     "Compile PaddlePaddle with unit testing"        ON)
 option(WITH_SWIG_PY     "Compile PaddlePaddle with inference api"       ON)

From 9e904e5077a512eaf0b7b96d9465a9bf10a21289 Mon Sep 17 00:00:00 2001
From: Yi Wang <yi.wang.2005@gmail.com>
Date: Thu, 3 Aug 2017 21:47:53 -0700
Subject: [PATCH 20/36] Disable MKLML

---
 CMakeLists.txt | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index b174831109..c7d743e193 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -36,8 +36,8 @@ include(simd)
 ################################ Configurations #######################################
 option(WITH_GPU         "Compile PaddlePaddle with NVIDIA GPU"          ${CUDA_FOUND})
 option(WITH_AVX         "Compile PaddlePaddle with AVX intrinsics"      ${AVX_FOUND})
-option(WITH_MKLDNN      "Compile PaddlePaddle with mkl-dnn support."    ${AVX_FOUND})
-option(WITH_MKLML       "Compile PaddlePaddle with mklml package."      ${AVX_FOUND})
+option(WITH_MKLDNN      "Compile PaddlePaddle with mkl-dnn support."    OFF)
+option(WITH_MKLML       "Compile PaddlePaddle with mklml package."      OFF)
 option(WITH_DSO         "Compile PaddlePaddle with dynamic linked CUDA" ON)
 option(WITH_TESTING     "Compile PaddlePaddle with unit testing"        ON)
 option(WITH_SWIG_PY     "Compile PaddlePaddle with inference api"       ON)

From ddacdf17353f33d7697f38b90a330ecc142e6194 Mon Sep 17 00:00:00 2001
From: Superjom <superjom@gmail.com>
Date: Fri, 4 Aug 2017 13:29:51 +0800
Subject: [PATCH 21/36] init enforce eq

---
 paddle/platform/enforce.h       |  9 ++++---
 paddle/platform/enforce_test.cc | 47 +++++++++++++++++++++++++++++++++
 2 files changed, 52 insertions(+), 4 deletions(-)

diff --git a/paddle/platform/enforce.h b/paddle/platform/enforce.h
index 7e03bf4425..a0d93a38ce 100644
--- a/paddle/platform/enforce.h
+++ b/paddle/platform/enforce.h
@@ -162,10 +162,11 @@ inline void throw_on_error(T e) {
     }                                                                   \
   } while (0)
 
-#define PADDLE_ENFORCE_EQ(__VAL0, __VAL1)                                   \
-  PADDLE_ENFORCE((__VAL0) == (__VAL1), "enforce %s == %s failed, %s != %s", \
-                 #__VAL0, #__VAL1, std::to_string(__VAL0),                  \
-                 std::to_string(__VAL1));
+#define PADDLE_ENFORCE_EQ(__VAL0, __VAL1, ...)                              \
+  PADDLE_ENFORCE((__VAL0) == (__VAL1),                                      \
+                 "enforce %s == %s failed, %s != %s\n%s", #__VAL0, #__VAL1, \
+                 std::to_string(__VAL0), std::to_string(__VAL1),            \
+                 paddle::string::Sprintf("" __VA_ARGS__));
 
 }  // namespace platform
 }  // namespace paddle
diff --git a/paddle/platform/enforce_test.cc b/paddle/platform/enforce_test.cc
index 2ac31812a8..c44fb4360d 100644
--- a/paddle/platform/enforce_test.cc
+++ b/paddle/platform/enforce_test.cc
@@ -34,3 +34,50 @@ TEST(ENFORCE, FAILED) {
   }
   ASSERT_TRUE(in_catch);
 }
+
+TEST(ENFORCE, NO_ARG_OK) {
+  int a = 2;
+  int b = 2;
+  PADDLE_ENFORCE_EQ(a, b);
+  // test enforce with extra message.
+  PADDLE_ENFORCE_EQ(a, b, "some thing wrong %s", "info");
+}
+
+TEST(ENFORCE_EQ, NO_EXTRA_MSG_FAIL) {
+  int a = 2;
+  bool in_catch = false;
+
+  try {
+    PADDLE_ENFORCE_EQ(a, 1 + 3);
+
+  } catch (paddle::platform::EnforceNotMet error) {
+    in_catch = true;
+    const std::string msg = "enforce a == 1 + 3 failed, 2 != 4";
+    const char* what = error.what();
+    for (size_t i = 0; i < msg.length(); ++i) {
+      ASSERT_EQ(what[i], msg[i]);
+    }
+  }
+
+  ASSERT_TRUE(in_catch);
+}
+
+TEST(ENFORCE_EQ, EXTRA_MSG_FAIL) {
+  int a = 2;
+  bool in_catch = false;
+
+  try {
+    PADDLE_ENFORCE_EQ(a, 1 + 3, "%s size not match", "their");
+
+  } catch (paddle::platform::EnforceNotMet error) {
+    in_catch = true;
+    const std::string msg =
+        "enforce a == 1 + 3 failed, 2 != 4\ntheir size not match";
+    const char* what = error.what();
+    for (size_t i = 0; i < msg.length(); ++i) {
+      ASSERT_EQ(what[i], msg[i]);
+    }
+  }
+
+  ASSERT_TRUE(in_catch);
+}

From 6bb970b52b25fcf9b49311288de15f5ae167f4e6 Mon Sep 17 00:00:00 2001
From: caoying03 <caoying03@baidu.com>
Date: Fri, 4 Aug 2017 13:47:00 +0800
Subject: [PATCH 22/36] enable defining sub-sequence data in test layer
 gradients.

---
 paddle/gserver/tests/LayerGradUtil.cpp | 14 +++++++++++++-
 paddle/gserver/tests/LayerGradUtil.h   |  5 ++++-
 2 files changed, 17 insertions(+), 2 deletions(-)

diff --git a/paddle/gserver/tests/LayerGradUtil.cpp b/paddle/gserver/tests/LayerGradUtil.cpp
index 9eca58f1a1..fd9cfa1dc7 100644
--- a/paddle/gserver/tests/LayerGradUtil.cpp
+++ b/paddle/gserver/tests/LayerGradUtil.cpp
@@ -400,7 +400,6 @@ void initDataLayer(TestConfig testConf,
         const std::vector<int>& labelSeqStartPositions =
             testConf.inputDefs[i].labelSeqStartPositions;
         if (labelSeqStartPositions.size() != 0) {
-          CHECK(!sequenceStartPositions);
           CHECK_GE(static_cast<int>(labelSeqStartPositions.size()), 2);
 
           sequenceStartPositions =
@@ -410,6 +409,19 @@ void initDataLayer(TestConfig testConf,
                                            useGpu);
           data.sequenceStartPositions = sequenceStartPositions;
         }
+
+        const std::vector<int>& labelSubSeqStartPositions =
+            testConf.inputDefs[i].labelSubSeqStartPositions;
+        if (labelSubSeqStartPositions.size() != 0) {
+          CHECK_GE(static_cast<int>(labelSubSeqStartPositions.size()), 2);
+
+          subSequenceStartPositions =
+              ICpuGpuVector::create(labelSubSeqStartPositions.size(), useGpu);
+          subSequenceStartPositions->copyFrom(labelSubSeqStartPositions.data(),
+                                              labelSubSeqStartPositions.size(),
+                                              useGpu);
+          data.subSequenceStartPositions = subSequenceStartPositions;
+        }
         break;
       }
       default:
diff --git a/paddle/gserver/tests/LayerGradUtil.h b/paddle/gserver/tests/LayerGradUtil.h
index d299b4dd09..5debedf5ef 100644
--- a/paddle/gserver/tests/LayerGradUtil.h
+++ b/paddle/gserver/tests/LayerGradUtil.h
@@ -67,6 +67,7 @@ struct InputDef {
   bool isStatic;
   std::vector<int> labelInitValue;
   std::vector<int> labelSeqStartPositions;
+  std::vector<int> labelSubSeqStartPositions;
   MatrixPtr selfDefinedData;
 
   InputDef(InputType type, string nameIn, size_t dimIn, size_t sizeIn) {
@@ -81,8 +82,10 @@ struct InputDef {
   InputDef(InputType type,
            string nameIn,
            MatrixPtr selfDefinedData,
-           std::vector<int> selfDefinedSeqStartPos = {})
+           std::vector<int> selfDefinedSeqStartPos = {},
+           std::vector<int> selfDefinedSubSeqStartPos = {})
       : labelSeqStartPositions(selfDefinedSeqStartPos),
+        labelSubSeqStartPositions(selfDefinedSubSeqStartPos),
         selfDefinedData(selfDefinedData) {
     inputType = type;
     name = nameIn;

From 5201b911a4fcca0e1091e59434b1f863ffef6c20 Mon Sep 17 00:00:00 2001
From: Superjom <superjom@gmail.com>
Date: Fri, 4 Aug 2017 14:56:22 +0800
Subject: [PATCH 23/36] add other enforces

---
 paddle/platform/enforce.h       |  47 +++++++++++--
 paddle/platform/enforce_test.cc | 115 ++++++++++++++++++++++++++++++++
 2 files changed, 158 insertions(+), 4 deletions(-)

diff --git a/paddle/platform/enforce.h b/paddle/platform/enforce.h
index a0d93a38ce..166d7032cd 100644
--- a/paddle/platform/enforce.h
+++ b/paddle/platform/enforce.h
@@ -162,11 +162,50 @@ inline void throw_on_error(T e) {
     }                                                                   \
   } while (0)
 
-#define PADDLE_ENFORCE_EQ(__VAL0, __VAL1, ...)                              \
-  PADDLE_ENFORCE((__VAL0) == (__VAL1),                                      \
-                 "enforce %s == %s failed, %s != %s\n%s", #__VAL0, #__VAL1, \
-                 std::to_string(__VAL0), std::to_string(__VAL1),            \
+/*
+ * Some enforce helpers here, usage:
+ *    int a = 1;
+ *    int b = 2;
+ *    PADDLE_ENFORCE_EQ(a, b);
+ *
+ *    will raise an expression described as follows:
+ *    "enforce a == b failed, 1 != 2" with detailed stack infomation.
+ *
+ *    extra messages is also supported, for example:
+ *    PADDLE_ENFORCE(a, b, "some simple enforce failed between %d numbers", 2)
+ */
+
+#define PADDLE_ENFORCE_EQ(__VAL0, __VAL1, ...) \
+  __PADDLE_BINARY_COMPARE(__VAL0, __VAL1, ==, !=, __VA_ARGS__)
+#define PADDLE_ENFORCE_NE(__VAL0, __VAL1, ...) \
+  __PADDLE_BINARY_COMPARE(__VAL0, __VAL1, !=, ==, __VA_ARGS__)
+#define PADDLE_ENFORCE_GT(__VAL0, __VAL1, ...) \
+  __PADDLE_BINARY_COMPARE(__VAL0, __VAL1, >, <=, __VA_ARGS__)
+#define PADDLE_ENFORCE_GE(__VAL0, __VAL1, ...) \
+  __PADDLE_BINARY_COMPARE(__VAL0, __VAL1, >=, <, __VA_ARGS__)
+#define PADDLE_ENFORCE_LT(__VAL0, __VAL1, ...) \
+  __PADDLE_BINARY_COMPARE(__VAL0, __VAL1, <, >=, __VA_ARGS__)
+#define PADDLE_ENFORCE_LE(__VAL0, __VAL1, ...) \
+  __PADDLE_BINARY_COMPARE(__VAL0, __VAL1, <=, >, __VA_ARGS__)
+
+// if two values have different data types, choose a compatible type for them.
+template <typename T1, typename T2>
+struct CompatibleType {
+  static constexpr const bool& t1_to_t2 = std::is_convertible<T1, T2>::value;
+  typedef typename std::conditional<t1_to_t2, T2, T1>::type type;
+};
+
+#define __PADDLE_BINARY_COMPARE(__VAL0, __VAL1, __CMP, __INV_CMP, ...)        \
+  PADDLE_ENFORCE(__COMPATIBLE_TYPE(__VAL0, __VAL1, __VAL0)                    \
+                     __CMP __COMPATIBLE_TYPE(__VAL0, __VAL1, __VAL1),         \
+                 "enforce %s " #__CMP " %s failed, %s " #__INV_CMP " %s\n%s", \
+                 #__VAL0, #__VAL1, std::to_string(__VAL0),                    \
+                 std::to_string(__VAL1),                                      \
                  paddle::string::Sprintf("" __VA_ARGS__));
 
+#define __COMPATIBLE_TYPE(__VAL0, __VAL1, __VAL)              \
+  typename paddle::platform::CompatibleType<decltype(__VAL0), \
+                                            decltype(__VAL1)>::type(__VAL)
+
 }  // namespace platform
 }  // namespace paddle
diff --git a/paddle/platform/enforce_test.cc b/paddle/platform/enforce_test.cc
index c44fb4360d..7117b49474 100644
--- a/paddle/platform/enforce_test.cc
+++ b/paddle/platform/enforce_test.cc
@@ -81,3 +81,118 @@ TEST(ENFORCE_EQ, EXTRA_MSG_FAIL) {
 
   ASSERT_TRUE(in_catch);
 }
+
+TEST(ENFORCE_NE, OK) {
+  PADDLE_ENFORCE_NE(1, 2);
+  PADDLE_ENFORCE_NE(1.0, 2UL);
+}
+TEST(ENFORCE_NE, FAIL) {
+  bool in_catch = false;
+
+  try {
+    // 2UL here to check data type compatible
+    PADDLE_ENFORCE_NE(1.0, 1UL);
+
+  } catch (paddle::platform::EnforceNotMet error) {
+    in_catch = true;
+    const std::string msg = "enforce 1.0 != 1UL failed, 1.000000 == 1";
+    const char* what = error.what();
+    for (size_t i = 0; i < msg.length(); ++i) {
+      ASSERT_EQ(what[i], msg[i]);
+    }
+  }
+
+  ASSERT_TRUE(in_catch);
+}
+
+TEST(ENFORCE_GT, OK) { PADDLE_ENFORCE_GT(2, 1); }
+TEST(ENFORCE_GT, FAIL) {
+  bool in_catch = false;
+
+  try {
+    // 2UL here to check data type compatible
+    PADDLE_ENFORCE_GT(1, 2UL);
+
+  } catch (paddle::platform::EnforceNotMet error) {
+    in_catch = true;
+    const std::string msg = "enforce 1 > 2UL failed, 1 <= 2";
+    const char* what = error.what();
+    for (size_t i = 0; i < msg.length(); ++i) {
+      ASSERT_EQ(what[i], msg[i]);
+    }
+  }
+
+  ASSERT_TRUE(in_catch);
+}
+
+TEST(ENFORCE_GE, OK) {
+  PADDLE_ENFORCE_GE(2, 2UL);
+  PADDLE_ENFORCE_GE(3, 2UL);
+  PADDLE_ENFORCE_GE(3, 2);
+  PADDLE_ENFORCE_GE(3.21, 2UL);
+}
+TEST(ENFORCE_GE, FAIL) {
+  bool in_catch = false;
+
+  try {
+    PADDLE_ENFORCE_GE(1, 2UL);
+
+  } catch (paddle::platform::EnforceNotMet error) {
+    in_catch = true;
+    const std::string msg = "enforce 1 >= 2UL failed, 1 < 2";
+    const char* what = error.what();
+    for (size_t i = 0; i < msg.length(); ++i) {
+      ASSERT_EQ(what[i], msg[i]);
+    }
+  }
+
+  ASSERT_TRUE(in_catch);
+}
+
+TEST(ENFORCE_LE, OK) {
+  PADDLE_ENFORCE_LE(1, 1);
+  PADDLE_ENFORCE_LE(1, 1UL);
+  PADDLE_ENFORCE_LE(2, 3UL);
+  PADDLE_ENFORCE_LE(2UL, 3);
+  PADDLE_ENFORCE_LE(2UL, 3.2);
+}
+TEST(ENFORCE_LE, FAIL) {
+  bool in_catch = false;
+
+  try {
+    PADDLE_ENFORCE_GT(1, 2UL);
+
+  } catch (paddle::platform::EnforceNotMet error) {
+    in_catch = true;
+    const std::string msg = "enforce 1 > 2UL failed, 1 <= 2";
+    const char* what = error.what();
+    for (size_t i = 0; i < msg.length(); ++i) {
+      ASSERT_EQ(what[i], msg[i]);
+    }
+  }
+
+  ASSERT_TRUE(in_catch);
+}
+
+TEST(ENFORCE_LT, OK) {
+  PADDLE_ENFORCE_LT(3, 10);
+  PADDLE_ENFORCE_LT(2, 3UL);
+  PADDLE_ENFORCE_LT(2UL, 3);
+}
+TEST(ENFORCE_LT, FAIL) {
+  bool in_catch = false;
+
+  try {
+    PADDLE_ENFORCE_LT(1UL, 0.12);
+
+  } catch (paddle::platform::EnforceNotMet error) {
+    in_catch = true;
+    const std::string msg = "enforce 1UL < 0.12 failed, 1 >= 0.12";
+    const char* what = error.what();
+    for (size_t i = 0; i < msg.length(); ++i) {
+      ASSERT_EQ(what[i], msg[i]);
+    }
+  }
+
+  ASSERT_TRUE(in_catch);
+}

From 62e592e58b04617127619dc20b2b0c45c13eddf5 Mon Sep 17 00:00:00 2001
From: Superjom <superjom@gmail.com>
Date: Fri, 4 Aug 2017 17:17:04 +0800
Subject: [PATCH 24/36] fix ci error

---
 paddle/platform/enforce.h | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/paddle/platform/enforce.h b/paddle/platform/enforce.h
index 166d7032cd..bc0715656a 100644
--- a/paddle/platform/enforce.h
+++ b/paddle/platform/enforce.h
@@ -191,7 +191,7 @@ inline void throw_on_error(T e) {
 // if two values have different data types, choose a compatible type for them.
 template <typename T1, typename T2>
 struct CompatibleType {
-  static constexpr const bool& t1_to_t2 = std::is_convertible<T1, T2>::value;
+  static const bool t1_to_t2 = std::is_convertible<T1, T2>::value;
   typedef typename std::conditional<t1_to_t2, T2, T1>::type type;
 };
 

From cbabaa45444e3f2fe183ff69c78d753f3a5c2234 Mon Sep 17 00:00:00 2001
From: Yancey1989 <yancey1989@gmail.com>
Date: Fri, 4 Aug 2017 18:05:50 +0800
Subject: [PATCH 25/36] convert dataset into recordio format

---
 python/paddle/v2/dataset/cifar.py       |  8 +++----
 python/paddle/v2/dataset/common.py      | 30 ++++++++++++++++++++-----
 python/paddle/v2/dataset/conll05.py     |  4 ++--
 python/paddle/v2/dataset/imdb.py        |  4 ++--
 python/paddle/v2/dataset/imikolov.py    |  5 +++--
 python/paddle/v2/dataset/mnist.py       |  4 ++--
 python/paddle/v2/dataset/movielens.py   |  4 ++--
 python/paddle/v2/dataset/sentiment.py   |  4 ++--
 python/paddle/v2/dataset/uci_housing.py |  4 ++--
 python/paddle/v2/dataset/wmt14.py       |  5 +++--
 10 files changed, 46 insertions(+), 26 deletions(-)

diff --git a/python/paddle/v2/dataset/cifar.py b/python/paddle/v2/dataset/cifar.py
index f885b2834e..0a2a1ced11 100644
--- a/python/paddle/v2/dataset/cifar.py
+++ b/python/paddle/v2/dataset/cifar.py
@@ -133,7 +133,7 @@ def convert(path):
     """
     Converts dataset to recordio format
     """
-    paddle.v2.dataset.common.convert(path, train100(), 10, "cifar_train100")
-    paddle.v2.dataset.common.convert(path, test100(), 10, "cifar_test100")
-    paddle.v2.dataset.common.convert(path, train10(), 10, "cifar_train10")
-    paddle.v2.dataset.common.convert(path, test10(), 10, "cifar_test10")
+    paddle.v2.dataset.common.convert(path, train100(), 1000, "cifar_train100")
+    paddle.v2.dataset.common.convert(path, test100(), 1000, "cifar_test100")
+    paddle.v2.dataset.common.convert(path, train10(), 1000, "cifar_train10")
+    paddle.v2.dataset.common.convert(path, test10(), 1000, "cifar_test10")
diff --git a/python/paddle/v2/dataset/common.py b/python/paddle/v2/dataset/common.py
index 111496618d..053ae151c5 100644
--- a/python/paddle/v2/dataset/common.py
+++ b/python/paddle/v2/dataset/common.py
@@ -32,17 +32,22 @@ __all__ = [
 
 DATA_HOME = os.path.expanduser('~/.cache/paddle/dataset')
 
+
 # When running unit tests, there could be multiple processes that
 # trying to create DATA_HOME directory simultaneously, so we cannot
 # use a if condition to check for the existence of the directory;
 # instead, we use the filesystem as the synchronization mechanism by
 # catching returned errors.
-try:
-    os.makedirs(DATA_HOME)
-except OSError as exc:
-    if exc.errno != errno.EEXIST:
-        raise
-    pass
+def must_mkdirs(path):
+    try:
+        os.makedirs(DATA_HOME)
+    except OSError as exc:
+        if exc.errno != errno.EEXIST:
+            raise
+        pass
+
+
+must_mkdirs(DATA_HOME)
 
 
 def md5file(fname):
@@ -93,6 +98,19 @@ def fetch_all():
                 "fetch")()
 
 
+def fetch_all_recordio(path):
+    for module_name in filter(lambda x: not x.startswith("__"),
+                              dir(paddle.v2.dataset)):
+        if "convert" in dir(
+                importlib.import_module("paddle.v2.dataset.%s" % module_name)) and \
+                not module_name == "common":
+            ds_path = os.path.join(path, module_name)
+            must_mkdirs(ds_path)
+            getattr(
+                importlib.import_module("paddle.v2.dataset.%s" % module_name),
+                "convert")(ds_path)
+
+
 def split(reader, line_count, suffix="%05d.pickle", dumper=cPickle.dump):
     """
     you can call the function as:
diff --git a/python/paddle/v2/dataset/conll05.py b/python/paddle/v2/dataset/conll05.py
index f8aae52e7c..23f5a24a1c 100644
--- a/python/paddle/v2/dataset/conll05.py
+++ b/python/paddle/v2/dataset/conll05.py
@@ -233,5 +233,5 @@ def convert(path):
     """
     Converts dataset to recordio format
     """
-    paddle.v2.dataset.common.convert(path, test(), 10, "conl105_train")
-    paddle.v2.dataset.common.convert(path, test(), 10, "conl105_test")
+    paddle.v2.dataset.common.convert(path, test(), 1000, "conl105_train")
+    paddle.v2.dataset.common.convert(path, test(), 1000, "conl105_test")
diff --git a/python/paddle/v2/dataset/imdb.py b/python/paddle/v2/dataset/imdb.py
index c0ec5992e0..93dd3e8f7d 100644
--- a/python/paddle/v2/dataset/imdb.py
+++ b/python/paddle/v2/dataset/imdb.py
@@ -173,5 +173,5 @@ def convert(path):
     Converts dataset to recordio format
     """
     w = word_dict()
-    paddle.v2.dataset.common.convert(path, lambda: train(w), 10, "imdb_train")
-    paddle.v2.dataset.common.convert(path, lambda: test(w), 10, "imdb_test")
+    paddle.v2.dataset.common.convert(path, lambda: train(w), 1000, "imdb_train")
+    paddle.v2.dataset.common.convert(path, lambda: test(w), 1000, "imdb_test")
diff --git a/python/paddle/v2/dataset/imikolov.py b/python/paddle/v2/dataset/imikolov.py
index b18ee8e9ba..617c722c41 100644
--- a/python/paddle/v2/dataset/imikolov.py
+++ b/python/paddle/v2/dataset/imikolov.py
@@ -155,6 +155,7 @@ def convert(path):
     N = 5
     word_dict = build_dict()
     paddle.v2.dataset.common.convert(path,
-                                     train(word_dict, N), 10, "imikolov_train")
+                                     train(word_dict, N), 1000,
+                                     "imikolov_train")
     paddle.v2.dataset.common.convert(path,
-                                     test(word_dict, N), 10, "imikolov_test")
+                                     test(word_dict, N), 1000, "imikolov_test")
diff --git a/python/paddle/v2/dataset/mnist.py b/python/paddle/v2/dataset/mnist.py
index ea5891f4f3..9f675bed89 100644
--- a/python/paddle/v2/dataset/mnist.py
+++ b/python/paddle/v2/dataset/mnist.py
@@ -119,5 +119,5 @@ def convert(path):
     """
     Converts dataset to recordio format
     """
-    paddle.v2.dataset.common.convert(path, train(), 10, "minist_train")
-    paddle.v2.dataset.common.convert(path, test(), 10, "minist_test")
+    paddle.v2.dataset.common.convert(path, train(), 1000, "minist_train")
+    paddle.v2.dataset.common.convert(path, test(), 1000, "minist_test")
diff --git a/python/paddle/v2/dataset/movielens.py b/python/paddle/v2/dataset/movielens.py
index d9372d422a..5b61a9420a 100644
--- a/python/paddle/v2/dataset/movielens.py
+++ b/python/paddle/v2/dataset/movielens.py
@@ -254,8 +254,8 @@ def convert(path):
     """
     Converts dataset to recordio format
     """
-    paddle.v2.dataset.common.convert(path, train(), 10, "movielens_train")
-    paddle.v2.dataset.common.convert(path, test(), 10, "movielens_test")
+    paddle.v2.dataset.common.convert(path, train(), 1000, "movielens_train")
+    paddle.v2.dataset.common.convert(path, test(), 1000, "movielens_test")
 
 
 if __name__ == '__main__':
diff --git a/python/paddle/v2/dataset/sentiment.py b/python/paddle/v2/dataset/sentiment.py
index e33f120c87..b0b9757c1a 100644
--- a/python/paddle/v2/dataset/sentiment.py
+++ b/python/paddle/v2/dataset/sentiment.py
@@ -137,5 +137,5 @@ def convert(path):
     """
     Converts dataset to recordio format
     """
-    paddle.v2.dataset.common.convert(path, train, 10, "sentiment_train")
-    paddle.v2.dataset.common.convert(path, test, 10, "sentiment_test")
+    paddle.v2.dataset.common.convert(path, train, 1000, "sentiment_train")
+    paddle.v2.dataset.common.convert(path, test, 1000, "sentiment_test")
diff --git a/python/paddle/v2/dataset/uci_housing.py b/python/paddle/v2/dataset/uci_housing.py
index ec10ce646e..ce60aa21c2 100644
--- a/python/paddle/v2/dataset/uci_housing.py
+++ b/python/paddle/v2/dataset/uci_housing.py
@@ -119,5 +119,5 @@ def convert(path):
     """
     Converts dataset to recordio format
     """
-    paddle.v2.dataset.common.convert(path, train(), 10, "uci_housing_train")
-    paddle.v2.dataset.common.convert(path, test(), 10, "uci_houseing_test")
+    paddle.v2.dataset.common.convert(path, train(), 1000, "uci_housing_train")
+    paddle.v2.dataset.common.convert(path, test(), 1000, "uci_houseing_test")
diff --git a/python/paddle/v2/dataset/wmt14.py b/python/paddle/v2/dataset/wmt14.py
index 2a631c365f..95a35d97ce 100644
--- a/python/paddle/v2/dataset/wmt14.py
+++ b/python/paddle/v2/dataset/wmt14.py
@@ -169,5 +169,6 @@ def convert(path):
     Converts dataset to recordio format
     """
     dict_size = 30000
-    paddle.v2.dataset.common.convert(path, train(dict_size), 10, "wmt14_train")
-    paddle.v2.dataset.common.convert(path, test(dict_size), 10, "wmt14_test")
+    paddle.v2.dataset.common.convert(path,
+                                     train(dict_size), 1000, "wmt14_train")
+    paddle.v2.dataset.common.convert(path, test(dict_size), 1000, "wmt14_test")

From 1ff8b8dd20b7a8eee4ff9dc947edb0bd4ff24f6d Mon Sep 17 00:00:00 2001
From: Yi Wang <yi.wang.2005@gmail.com>
Date: Fri, 4 Aug 2017 10:22:04 -0700
Subject: [PATCH 26/36] Update new source files

---
 paddle/framework/grad_op_builder_test.cc | 64 +++++++++++-------------
 1 file changed, 28 insertions(+), 36 deletions(-)

diff --git a/paddle/framework/grad_op_builder_test.cc b/paddle/framework/grad_op_builder_test.cc
index 96d7f309d6..cf7143eba4 100644
--- a/paddle/framework/grad_op_builder_test.cc
+++ b/paddle/framework/grad_op_builder_test.cc
@@ -83,24 +83,21 @@ TEST(GradOpBuilder, MutiInOut) {
   EXPECT_EQ(grad_test_op->Input("Out1"), "out1");
   EXPECT_EQ(grad_test_op->Inputs("Out2_mult"),
             std::vector<std::string>({"out2_1", "out2_2"}));
-  EXPECT_EQ(grad_test_op->Input("Out1" + f::OperatorBase::GRAD_VAR_SUFFIX()),
-            "out1" + f::OperatorBase::GRAD_VAR_SUFFIX());
-  EXPECT_EQ(
-      grad_test_op->Inputs("Out2_mult" + f::OperatorBase::GRAD_VAR_SUFFIX()),
-      std::vector<std::string>(
-          {"out2_1" + f::OperatorBase::GRAD_VAR_SUFFIX(),
-           "out2_2" + f::OperatorBase::GRAD_VAR_SUFFIX()}));
+  EXPECT_EQ(grad_test_op->Input("Out1" + f::kGradVarSuffix),
+            "out1" + f::kGradVarSuffix);
+  EXPECT_EQ(grad_test_op->Inputs("Out2_mult" + f::kGradVarSuffix),
+            std::vector<std::string>(
+                {"out2_1" + f::kGradVarSuffix, "out2_2" + f::kGradVarSuffix}));
 
   ASSERT_EQ(grad_test_op->outputs_.size(), 5UL);
-  EXPECT_EQ(grad_test_op->Output("In1" + f::OperatorBase::GRAD_VAR_SUFFIX()),
-            "in1" + f::OperatorBase::GRAD_VAR_SUFFIX());
-  EXPECT_EQ(
-      grad_test_op->Outputs("In2_mult" + f::OperatorBase::GRAD_VAR_SUFFIX()),
-      std::vector<std::string>({"in2_1" + f::OperatorBase::GRAD_VAR_SUFFIX(),
-                                "in2_2" + f::OperatorBase::GRAD_VAR_SUFFIX(),
-                                "in2_3" + f::OperatorBase::GRAD_VAR_SUFFIX()}));
-  EXPECT_EQ(grad_test_op->Output("In3" + f::OperatorBase::GRAD_VAR_SUFFIX()),
-            "in3" + f::OperatorBase::GRAD_VAR_SUFFIX());
+  EXPECT_EQ(grad_test_op->Output("In1" + f::kGradVarSuffix),
+            "in1" + f::kGradVarSuffix);
+  EXPECT_EQ(grad_test_op->Outputs("In2_mult" + f::kGradVarSuffix),
+            std::vector<std::string>({"in2_1" + f::kGradVarSuffix,
+                                      "in2_2" + f::kGradVarSuffix,
+                                      "in2_3" + f::kGradVarSuffix}));
+  EXPECT_EQ(grad_test_op->Output("In3" + f::kGradVarSuffix),
+            "in3" + f::kGradVarSuffix);
 }
 
 TEST(GradOpBuilder, IOIgnoredInGradient) {
@@ -116,30 +113,25 @@ TEST(GradOpBuilder, IOIgnoredInGradient) {
   ASSERT_EQ(grad_test_op->inputs_.size(), 5UL + 3UL + 3UL);
   EXPECT_EQ(grad_test_op->Input("In1"), "in1");
   EXPECT_EQ(grad_test_op->Inputs("In2_mult"),
-            std::vector<std::string>({f::OperatorBase::EMPTY_VAR_NAME(),
-                                      f::OperatorBase::EMPTY_VAR_NAME()}));
+            std::vector<std::string>({f::kEmptyVarName, f::kEmptyVarName}));
   EXPECT_EQ(grad_test_op->Inputs("In3_mult"),
             std::vector<std::string>({"in3_1", "in3_2"}));
   EXPECT_EQ(grad_test_op->Inputs("Out1_mult"),
             std::vector<std::string>({"out1_1", "out1_2"}));
-  EXPECT_EQ(grad_test_op->Input("Out2"), f::OperatorBase::EMPTY_VAR_NAME());
-  EXPECT_EQ(
-      grad_test_op->Inputs("Out1_mult" + f::OperatorBase::GRAD_VAR_SUFFIX()),
-      std::vector<std::string>(
-          {"out1_1" + f::OperatorBase::GRAD_VAR_SUFFIX(),
-           "out1_2" + f::OperatorBase::GRAD_VAR_SUFFIX()}));
-  EXPECT_EQ(grad_test_op->Input("Out2" + f::OperatorBase::GRAD_VAR_SUFFIX()),
-            "out2" + f::OperatorBase::GRAD_VAR_SUFFIX());
+  EXPECT_EQ(grad_test_op->Input("Out2"), f::kEmptyVarName);
+  EXPECT_EQ(grad_test_op->Inputs("Out1_mult" + f::kGradVarSuffix),
+            std::vector<std::string>(
+                {"out1_1" + f::kGradVarSuffix, "out1_2" + f::kGradVarSuffix}));
+  EXPECT_EQ(grad_test_op->Input("Out2" + f::kGradVarSuffix),
+            "out2" + f::kGradVarSuffix);
 
   ASSERT_EQ(grad_test_op->outputs_.size(), 5UL);
-  EXPECT_EQ(grad_test_op->Output("In1" + f::OperatorBase::GRAD_VAR_SUFFIX()),
-            "in1" + f::OperatorBase::GRAD_VAR_SUFFIX());
-  EXPECT_EQ(
-      grad_test_op->Outputs("In2_mult" + f::OperatorBase::GRAD_VAR_SUFFIX()),
-      std::vector<std::string>({"in2_1" + f::OperatorBase::GRAD_VAR_SUFFIX(),
-                                "in2_2" + f::OperatorBase::GRAD_VAR_SUFFIX()}));
-  EXPECT_EQ(
-      grad_test_op->Outputs("In3_mult" + f::OperatorBase::GRAD_VAR_SUFFIX()),
-      std::vector<std::string>({"in3_1" + f::OperatorBase::GRAD_VAR_SUFFIX(),
-                                "in3_2" + f::OperatorBase::GRAD_VAR_SUFFIX()}));
+  EXPECT_EQ(grad_test_op->Output("In1" + f::kGradVarSuffix),
+            "in1" + f::kGradVarSuffix);
+  EXPECT_EQ(grad_test_op->Outputs("In2_mult" + f::kGradVarSuffix),
+            std::vector<std::string>(
+                {"in2_1" + f::kGradVarSuffix, "in2_2" + f::kGradVarSuffix}));
+  EXPECT_EQ(grad_test_op->Outputs("In3_mult" + f::kGradVarSuffix),
+            std::vector<std::string>(
+                {"in3_1" + f::kGradVarSuffix, "in3_2" + f::kGradVarSuffix}));
 }

From 3c798828a9f043ed824b8cf5983df5dccd250f06 Mon Sep 17 00:00:00 2001
From: xuwei06 <xuwei06@baidu.com>
Date: Fri, 4 Aug 2017 13:21:33 -0700
Subject: [PATCH 27/36] SKip cpplint if source is not changed.

---
 cmake/cpplint.cmake                 | 5 ++++-
 cmake/util.cmake                    | 1 -
 paddle/gserver/tests/CMakeLists.txt | 7 ++++++-
 3 files changed, 10 insertions(+), 3 deletions(-)

diff --git a/cmake/cpplint.cmake b/cmake/cpplint.cmake
index 656e1a0803..e50530411c 100644
--- a/cmake/cpplint.cmake
+++ b/cmake/cpplint.cmake
@@ -56,11 +56,14 @@ macro(add_style_check_target TARGET_NAME)
                 # cpplint code style
                 get_filename_component(base_filename ${filename} NAME)
                 set(CUR_GEN ${CMAKE_CURRENT_BINARY_DIR}/${base_filename}.cpplint)
-                add_custom_command(TARGET ${TARGET_NAME} PRE_BUILD
+                add_custom_command(OUTPUT ${CUR_GEN} PRE_BUILD
                     COMMAND "${PYTHON_EXECUTABLE}" "${PROJ_ROOT}/paddle/scripts/cpplint.py"
                             "--filter=${STYLE_FILTER}"
                             "--write-success=${CUR_GEN}" ${filename}
+                    DEPENDS ${filename} ${PROJ_ROOT}/paddle/scripts/cpplint.py
                     WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR})
+                add_custom_target(${base_filename}.cpplint DEPENDS ${CUR_GEN})
+                add_dependencies(${TARGET_NAME} ${base_filename}.cpplint)
             endif()
         endforeach()
     endif()
diff --git a/cmake/util.cmake b/cmake/util.cmake
index 87ad9d91d8..a9b9d4a9fa 100644
--- a/cmake/util.cmake
+++ b/cmake/util.cmake
@@ -118,7 +118,6 @@ endfunction()
 macro(add_unittest_without_exec TARGET_NAME)
     add_executable(${TARGET_NAME} ${ARGN})
     link_paddle_test(${TARGET_NAME})
-    add_style_check_target(${TARGET_NAME} ${ARGN})
 endmacro()
 
 # add_unittest
diff --git a/paddle/gserver/tests/CMakeLists.txt b/paddle/gserver/tests/CMakeLists.txt
index a43adc7ce7..4546d12a90 100644
--- a/paddle/gserver/tests/CMakeLists.txt
+++ b/paddle/gserver/tests/CMakeLists.txt
@@ -1,5 +1,10 @@
 # gserver pacakge unittests
 
+file(GLOB_RECURSE GSERVER_HEADER RELATIVE "${CMAKE_CURRENT_SOURCE_DIR}" "*.h")
+file(GLOB_RECURSE GSERVER_SOURCES RELATIVE "${CMAKE_CURRENT_SOURCE_DIR}" "*.cpp")
+add_style_check_target(paddle_gserver ${GSERVER_SOURCES})
+add_style_check_target(paddle_gserver ${GSERVER_HEADER})
+
 ################### test_ProtoDataProvider ############
 add_unittest_without_exec(test_ProtoDataProvider
     test_ProtoDataProvider.cpp)
@@ -50,7 +55,7 @@ add_unittest_without_exec(test_DetectionOutput
     test_DetectionOutput.cpp
     LayerGradUtil.cpp)
 
-add_test(NAME test_DetectionOutput 
+add_test(NAME test_DetectionOutput
     COMMAND test_DetectionOutput)
 ################# test_ConvUnify #######################
 add_unittest_without_exec(test_ConvUnify

From 93ced954a0dec8d8f18967591978a182003e8606 Mon Sep 17 00:00:00 2001
From: Yi Wang <yi.wang.2005@gmail.com>
Date: Fri, 4 Aug 2017 14:03:47 -0700
Subject: [PATCH 28/36] Simplify test_matrixCompare

---
 paddle/math/MathUtils.cpp                |   2 +-
 paddle/math/tests/test_matrixCompare.cpp | 130 ++++++++++++-----------
 2 files changed, 67 insertions(+), 65 deletions(-)

diff --git a/paddle/math/MathUtils.cpp b/paddle/math/MathUtils.cpp
index 5bbc3e4e37..980b6e1388 100644
--- a/paddle/math/MathUtils.cpp
+++ b/paddle/math/MathUtils.cpp
@@ -25,7 +25,7 @@ namespace paddle {
  */
 void sparseRand(
     int* major, int* minor, int nnz, int majorLen, int minorMax, bool useGpu) {
-  CHECK(size_t(nnz) > size_t(1));
+  CHECK(size_t(nnz) >= size_t(1));
   int* cpuMajor;
   int* cpuMinor;
   CpuIVector cpuMinorVec(nnz);
diff --git a/paddle/math/tests/test_matrixCompare.cpp b/paddle/math/tests/test_matrixCompare.cpp
index 4980208e65..dd02111799 100644
--- a/paddle/math/tests/test_matrixCompare.cpp
+++ b/paddle/math/tests/test_matrixCompare.cpp
@@ -79,8 +79,8 @@ void testMatrixMaxSequence(int batchSize, int inputDim) {
 }
 
 TEST(Matrix, maxSequence) {
-  for (auto batchSize : {1, 10, 128, 1000, 6000}) {
-    for (auto inputDim : {1, 32, 100, 512}) {
+  for (auto batchSize : {1, 3, 997}) {   // prime numbers close to 1, 4, 1024
+    for (auto inputDim : {1, 7, 131}) {  // prime numbers close to 1, 8, 128
       VLOG(3) << " batchSize=" << batchSize << " inputDim=" << inputDim;
       testMatrixMaxSequence(batchSize, inputDim);
     }
@@ -240,14 +240,10 @@ TEST(Matrix, unary) {
     // inverse matrix
     testMatrixInverse(height);
 #else
-    LOG(WARNING) << "Cannot run Matrix Inverse Unit Test.\n"
-                 << "Failed to find lapack library in current system.\n"
-                 << "To address this issue, Please adopt one of the following "
-                    "approaches: \n"
-                 << "1. Simply issue `sudo apt-get install liblapacke-dev` to "
-                    "avoid re-build source code. \n"
-                 << "2. Install MKL/Openblas/ATLAS and re-build PaddlePaddle "
-                    "source code.";
+    LOG(WARNING) << "This version of PaddlePaddle was not built with LAPACK"
+                 << "support so we cannot test matrix inverse. To test "
+                 << "matrix inverse, please install LAPACKE "
+                 << "and MKL/Openblas/ATLAS, and re-build PaddlePaddle.";
 #endif
   }
 }
@@ -341,8 +337,8 @@ void testMatrixSoftmaxBp(int height, int width) {
 }
 
 TEST(Matrix, softmax) {
-  for (auto height : {1, 11, 73, 128, 200}) {
-    for (auto width : {1, 32, 100, 512, 1000}) {
+  for (auto height : {1, 3, 131}) {    // prime numbers close to 1, 4, 127
+    for (auto width : {1, 17, 251}) {  // prime numbers close to 1, 16, 256
       VLOG(3) << " height=" << height << " width=" << width;
 
       testMatrixSoftmax(height, width);
@@ -527,7 +523,7 @@ void testVectorRowFunc(int size) {
 }
 
 TEST(Vector, rowFunc) {
-  for (auto size : {1, 5, 31, 90, 150, 500, 1000, 4000}) {
+  for (auto size : {1, 3, 997}) {  // prime numbers close to 1, 4, 1024
     VLOG(3) << " size=" << size;
     testVectorRowFunc(size);
   }
@@ -604,7 +600,7 @@ void testVectorIsEqual(int size) {
 }
 
 TEST(Vector, Equal) {
-  for (auto size : {1, 5, 31, 90, 150, 500, 1000, 4000}) {
+  for (auto size : {1, 3, 997}) {  // prime numbers close to 1, 4, 1024
     VLOG(3) << " size=" << size;
     testVectorReset<int>(size);
     testVectorReset<real>(size);
@@ -635,9 +631,8 @@ void testMatrixTopK(int samples, int dim, int beamSize) {
 }
 
 TEST(Matrix, topK) {
-  for (auto samples : {1, 5, 31, 90, 150, 500}) {
-    for (auto dim :
-         {1, 5, 8, 10, 15, 64, 80, 120, 256, 300, 1280, 5120, 50000}) {
+  for (auto samples : {1, 17, 131}) {  // prime numbers close to 1, 16, 127
+    for (auto dim : {1, 3, 997}) {     // prime numbers close to 1, 4, 1024
       for (auto beamSize : {1, 5, 10, 20, 40, (int)rand() % dim + 1}) {
         if (beamSize > dim) continue;
         VLOG(3) << " samples=" << samples << " beamSize=" << beamSize
@@ -650,6 +645,7 @@ TEST(Matrix, topK) {
 
 void testSMatrixTopK(int samples, int dim, int beamSize, real ratio) {
   int nnz = samples * dim * ratio;
+  if (nnz < 1) nnz = 1;  // Because sparseRand in MathUtil.cpp requires this.
   MatrixPtr cpuSrc = std::make_shared<CpuSparseMatrix>(samples, dim, nnz);
   MatrixPtr gpuSrc = std::make_shared<GpuSparseMatrix>(samples, dim, nnz);
   MatrixPtr cpuVal = std::make_shared<CpuMatrix>(samples, beamSize);
@@ -683,9 +679,9 @@ void testSMatrixTopK(int samples, int dim, int beamSize, real ratio) {
 }
 
 TEST(SMatrix, topK) {
-  for (auto samples : {1, 5, 100}) {
-    for (auto dim : {10000, 10000, 50000}) {
-      for (auto beamSize : {1, 5, 40, 100, 500}) {
+  for (auto samples : {1, 3, 61}) {
+    for (auto dim : {1, 3, 61}) {
+      for (auto beamSize : {1, 3, 61}) {
         for (auto ratio : {0.01, 0.001}) {
           if (beamSize > dim) continue;
           VLOG(3) << " samples=" << samples << " beamSize=" << beamSize
@@ -806,10 +802,9 @@ void testClassificationError(int numSamples, int dim, int topkSize) {
 }
 
 TEST(Matrix, classificationError) {
-  for (auto numSamples : {1, 5, 31, 90, 150, 300}) {
-    for (auto dim :
-         {1, 5, 8, 10, 15, 64, 80, 120, 256, 300, 1280, 5120, 50000}) {
-      for (auto topkSize : {1, 5, 10, 20, 40, (int)rand() % dim + 1}) {
+  for (auto numSamples : {1, 3, 31}) {
+    for (auto dim : {1, 3, 31}) {
+      for (auto topkSize : {1, 3, (int)rand() % dim + 1}) {
         if (topkSize > dim) continue;
         VLOG(3) << " sample= " << numSamples << " topkSize= " << topkSize
                 << " dim= " << dim;
@@ -1016,13 +1011,15 @@ void testAvgPoolFwdBwd(int numSamples,
   TensorCheckErr(*inputGrad, *inputGpuGrad);
 }
 
+// TODO(yi): I noticed many such blindly combinatorial tests in this
+// file.  They are no help to locate defects at all.
 TEST(Matrix, PoolFwdBwd) {
-  for (auto numSamples : {5, 32}) {
-    for (auto channels : {1, 9, 32}) {
-      for (auto imgSizeH : {14, 28}) {
-        for (auto imgSizeW : {16, 30}) {
-          for (auto sizeX : {2, 5}) {
-            for (auto sizeY : {2, 5}) {
+  for (auto numSamples : {1, 3}) {
+    for (auto channels : {1, 3}) {
+      for (auto imgSizeH : {13, 17}) {
+        for (auto imgSizeW : {17, 19}) {
+          for (auto sizeX : {2, 3}) {
+            for (auto sizeY : {2, 3}) {
               for (auto sH : {1, 2}) {
                 for (auto sW : {1, 2}) {
                   for (auto pH : {0, (sizeY - 1) / 2}) {
@@ -1128,8 +1125,8 @@ TEST(Matrix, MaxOutFwdBwd) {
 }
 
 TEST(CpuMatrix, copyFrom) {
-  const size_t height = 1000;
-  const size_t width = 1000;
+  const size_t height = 31;
+  const size_t width = 53;
   CpuMatrix cpu(height, width);
   GpuMatrix gpu(height, width);
   CpuMatrix copy(height, width);
@@ -1149,6 +1146,10 @@ void testBatch2seqPadding(int batchSize, int inputDim) {
 
   IVectorPtr cpuSequence;
   generateSequenceStartPositions(batchSize, cpuSequence);
+  for (int i = 0; i < cpuSequence->getSize(); ++i) {
+    (cpuSequence->getData())[i] += 1;  // so no way that maxSeqLen is 0;
+  }
+
   IVectorPtr gpuSequence = IVector::create(cpuSequence->getSize(), true);
   gpuSequence->copyFrom(*cpuSequence);
 
@@ -1156,45 +1157,46 @@ void testBatch2seqPadding(int batchSize, int inputDim) {
   size_t maxSeqLen = *std::max_element(cpuSequence->getData(),
                                        cpuSequence->getData() + numSeq);
 
+  printf("numSeq = %ld, maxSeqLen = %ld\n", numSeq, maxSeqLen);
   MatrixPtr cBatch = std::make_shared<CpuMatrix>(numSeq * maxSeqLen, inputDim);
   MatrixPtr gBatch = std::make_shared<GpuMatrix>(numSeq * maxSeqLen, inputDim);
   MatrixPtr cCheck = std::make_shared<CpuMatrix>(numSeq * maxSeqLen, inputDim);
 
-  hl_sequence2batch_copy_padding(gBatch->getData(),
-                                 gpuInput->getData(),
-                                 cpuSequence->getData(),
-                                 inputDim,
-                                 maxSeqLen,
-                                 numSeq,
-                                 false,
-                                 true);
-  cCheck->copyFrom(*gBatch);
-
-  int* seqStart = cpuSequence->getData();
-  float* batchData = cBatch->getData();
-  float* seqData = cpuInput->getData();
-  for (size_t i = 0; i < maxSeqLen; i++) {
-    for (size_t j = 0; j < numSeq; j++) {
-      size_t sequenceStart = seqStart[j];
-      size_t sequenceLength = seqStart[j + 1] - seqStart[j];
-      if (i < sequenceLength) {
-        memcpy(batchData + (i * numSeq + j) * inputDim,
-               seqData + (sequenceStart + i) * inputDim,
-               inputDim * sizeof(real));
-      } else {
-        memset(batchData + (i * numSeq + j) * inputDim,
-               0,
-               inputDim * sizeof(real));
-      }
-    }
-  }
-
-  TensorCheckErr(*cBatch, *cCheck);
+  // hl_sequence2batch_copy_padding(gBatch->getData(),
+  //                                gpuInput->getData(),
+  //                                cpuSequence->getData(),
+  //                                inputDim,
+  //                                maxSeqLen,
+  //                                numSeq,
+  //                                false,
+  //                                true);
+  // cCheck->copyFrom(*gBatch);
+
+  // int* seqStart = cpuSequence->getData();
+  // float* batchData = cBatch->getData();
+  // float* seqData = cpuInput->getData();
+  // for (size_t i = 0; i < maxSeqLen; i++) {
+  //   for (size_t j = 0; j < numSeq; j++) {
+  //     size_t sequenceStart = seqStart[j];
+  //     size_t sequenceLength = seqStart[j + 1] - seqStart[j];
+  //     if (i < sequenceLength) {
+  //       memcpy(batchData + (i * numSeq + j) * inputDim,
+  //              seqData + (sequenceStart + i) * inputDim,
+  //              inputDim * sizeof(real));
+  //     } else {
+  //       memset(batchData + (i * numSeq + j) * inputDim,
+  //              0,
+  //              inputDim * sizeof(real));
+  //     }
+  //   }
+  // }
+
+  // TensorCheckErr(*cBatch, *cCheck);
 }
 
 TEST(Matrix, warpCTC) {
-  for (auto batchSize : {51, 526, 2884}) {
-    for (auto inputDim : {32, 512, 2026}) {
+  for (auto batchSize : {1, 3, 17}) {
+    for (auto inputDim : {1, 3, 31}) {
       VLOG(3) << " batchSize=" << batchSize << " inputDim=" << inputDim;
       testBatch2seqPadding(batchSize, inputDim);
     }

From a40b755b6a048c72fddab1261cefec6b267017bf Mon Sep 17 00:00:00 2001
From: Yi Wang <yi.wang.2005@gmail.com>
Date: Fri, 4 Aug 2017 14:15:39 -0700
Subject: [PATCH 29/36] Add explicit to some constructors

---
 paddle/operators/recurrent_op.h  | 2 --
 paddle/platform/device_context.h | 2 +-
 paddle/platform/place.h          | 2 +-
 paddle/string/piece.h            | 4 ++--
 4 files changed, 4 insertions(+), 6 deletions(-)

diff --git a/paddle/operators/recurrent_op.h b/paddle/operators/recurrent_op.h
index 35e6d9d50d..f859dc333d 100644
--- a/paddle/operators/recurrent_op.h
+++ b/paddle/operators/recurrent_op.h
@@ -19,8 +19,6 @@
 namespace paddle {
 namespace operators {
 
-using namespace paddle::framework;  // NOLINT
-
 namespace rnn {
 
 /**
diff --git a/paddle/platform/device_context.h b/paddle/platform/device_context.h
index 48b9f5dcb5..08b5b2cff9 100644
--- a/paddle/platform/device_context.h
+++ b/paddle/platform/device_context.h
@@ -55,7 +55,7 @@ class CPUDeviceContext : public DeviceContext {
 
 class CUDADeviceContext : public DeviceContext {
  public:
-  CUDADeviceContext(GPUPlace);  // NOLINT
+  explicit CUDADeviceContext(GPUPlace);
   virtual ~CUDADeviceContext();
 
   /*! \brief  Wait for all operations completion in the stream. */
diff --git a/paddle/platform/place.h b/paddle/platform/place.h
index a37ad38a8f..a82e8c942f 100644
--- a/paddle/platform/place.h
+++ b/paddle/platform/place.h
@@ -32,7 +32,7 @@ struct CPUPlace {
 
 struct GPUPlace {
   GPUPlace() : GPUPlace(0) {}
-  GPUPlace(int d) : device(d) {}  // NOLINT
+  explicit GPUPlace(int d) : device(d) {}
 
   // needed for variant equality comparison
   inline bool operator==(const GPUPlace &o) const { return device == o.device; }
diff --git a/paddle/string/piece.h b/paddle/string/piece.h
index 3b887490b5..7deeacd8ca 100644
--- a/paddle/string/piece.h
+++ b/paddle/string/piece.h
@@ -39,8 +39,8 @@ public:
   // size_ is 0.
   Piece();
   Piece(const char* d, size_t n);
-  Piece(const char* d);         // NOLINT
-  Piece(const std::string& s);  // NOLINT
+  explicit Piece(const char* d);
+  explicit Piece(const std::string& s);
 
   const char* data() const { return data_; }
   size_t len() const { return size_; }

From 7aac1218166393d1b4c37369c78f7b05d00e36de Mon Sep 17 00:00:00 2001
From: Yi Wang <yi.wang.2005@gmail.com>
Date: Fri, 4 Aug 2017 15:41:23 -0700
Subject: [PATCH 30/36] Fix bugs

---
 paddle/platform/device_context_test.cc | 16 ++++++++++------
 paddle/string/piece.h                  |  4 ++--
 2 files changed, 12 insertions(+), 8 deletions(-)

diff --git a/paddle/platform/device_context_test.cc b/paddle/platform/device_context_test.cc
index af2ce17fc2..65345c433c 100644
--- a/paddle/platform/device_context_test.cc
+++ b/paddle/platform/device_context_test.cc
@@ -15,24 +15,28 @@ limitations under the License. */
 #include "paddle/platform/device_context.h"
 #include "gtest/gtest.h"
 
-using DEVICE_GPU = Eigen::GpuDevice;
 TEST(Device, Init) {
+  using paddle::platform::DeviceContext;
+  using paddle::platform::CUDADeviceContext;
+  using paddle::platform::GPUPlace;
+
   int count = paddle::platform::GetDeviceCount();
   for (int i = 0; i < count; i++) {
-    paddle::platform::DeviceContext* device_context =
-        new paddle::platform::CUDADeviceContext(i);
+    DeviceContext* device_context = new CUDADeviceContext(GPUPlace(i));
     Eigen::GpuDevice* gpu_device =
-        device_context->template get_eigen_device<DEVICE_GPU>();
+        device_context->template get_eigen_device<Eigen::GpuDevice>();
     ASSERT_NE(nullptr, gpu_device);
     delete device_context;
   }
 }
 
 TEST(Device, CUDADeviceContext) {
+  using paddle::platform::CUDADeviceContext;
+  using paddle::platform::GPUPlace;
+
   int count = paddle::platform::GetDeviceCount();
   for (int i = 0; i < count; i++) {
-    paddle::platform::CUDADeviceContext* device_context =
-        new paddle::platform::CUDADeviceContext(i);
+    CUDADeviceContext* device_context = new CUDADeviceContext(GPUPlace(i));
     Eigen::GpuDevice* gpu_device = device_context->eigen_device();
     ASSERT_NE(nullptr, gpu_device);
     cudnnHandle_t cudnn_handle = device_context->cudnn_handle();
diff --git a/paddle/string/piece.h b/paddle/string/piece.h
index 7deeacd8ca..03ae9243a4 100644
--- a/paddle/string/piece.h
+++ b/paddle/string/piece.h
@@ -39,8 +39,8 @@ public:
   // size_ is 0.
   Piece();
   Piece(const char* d, size_t n);
-  explicit Piece(const char* d);
-  explicit Piece(const std::string& s);
+  Piece(const char* d);         // NOLINT: accept C string into Piece.
+  Piece(const std::string& s);  // NOLINT: accept C++ string into Piece.
 
   const char* data() const { return data_; }
   size_t len() const { return size_; }

From 8faf905e0074a92329ef6a67e0b7550e211fe4a1 Mon Sep 17 00:00:00 2001
From: Yi Wang <yi.wang.2005@gmail.com>
Date: Fri, 4 Aug 2017 15:49:15 -0700
Subject: [PATCH 31/36] Correct dependencies

---
 paddle/framework/CMakeLists.txt | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/paddle/framework/CMakeLists.txt b/paddle/framework/CMakeLists.txt
index 454e8d54d4..1db042c6fc 100644
--- a/paddle/framework/CMakeLists.txt
+++ b/paddle/framework/CMakeLists.txt
@@ -12,14 +12,14 @@ cc_test(variable_test SRCS variable_test.cc)
 cc_library(scope SRCS scope.cc)
 cc_test(scope_test SRCS scope_test.cc DEPS scope)
 
-cc_library(attribute SRCS attribute.cc)
-
 proto_library(attribute_proto SRCS attribute.proto)
 proto_library(op_proto SRCS op_proto.proto DEPS attribute_proto)
 proto_library(op_desc SRCS op_desc.proto DEPS attribute_proto)
 cc_test(op_proto_test SRCS op_proto_test.cc DEPS op_proto protobuf)
 cc_test(op_desc_test SRCS op_desc_test.cc DEPS op_desc protobuf)
 
+cc_library(attribute SRCS attribute.cc DEPS op_desc op_proto)
+
 cc_library(operator SRCS operator.cc DEPS op_desc device_context tensor scope attribute)
 cc_test(operator_test SRCS operator_test.cc DEPS operator op_registry)
 

From f0cf8ac6f0d608cfb01940310dba138160d93009 Mon Sep 17 00:00:00 2001
From: Helin Wang <helinwang@baidu.com>
Date: Fri, 4 Aug 2017 17:11:09 -0700
Subject: [PATCH 32/36] reduce compare sparse test time by reducing dimensions

---
 paddle/trainer/tests/compare_sparse_data      | Bin 0 -> 193173 bytes
 .../sample_trainer_config_compare_sparse.conf | 154 ++++++++++++++++++
 paddle/trainer/tests/test_CompareSparse.cpp   |   2 +-
 paddle/trainer/tests/train_sparse.list        |   1 +
 4 files changed, 156 insertions(+), 1 deletion(-)
 create mode 100644 paddle/trainer/tests/compare_sparse_data
 create mode 100644 paddle/trainer/tests/sample_trainer_config_compare_sparse.conf
 create mode 100644 paddle/trainer/tests/train_sparse.list

diff --git a/paddle/trainer/tests/compare_sparse_data b/paddle/trainer/tests/compare_sparse_data
new file mode 100644
index 0000000000000000000000000000000000000000..18fc6541383d8e8e1687b8fe1abd57aece3d4cfc
GIT binary patch
literal 193173
zcmd?S34GVbbuZf49j9*7f8*OUwQ)ik`^K@G>$q8*)Nz{EBu$#6y~&N6=DFB?Y0OJa
zZu;I$n<nvf0Bs<IFi3!q1ZER5Ncyu|8=C;JN*0Js5~~&#vx8VH0p@+r{C>ax`uqQ-
zfc_Hd`y@vH-^`hrbIzPOGjrz5nXlci?_(d>(eQ&i{wwbjAK+(M-~)l*>y=Msv)@^u
zH?m3MiV8dsc>jFmCgh617XqJuOC8mXtV17X^mo0gG>z;S@8R?}$I!p4)lPnt-(WFS
zeIoGKTdG4-$qs!@P?=hjV`>e-A2X57^ohsE0w0a8-D&wl)O;`7qv>zpj{|=cQ7N^w
z-e%UC4>Pu;AJqO~;18l(dA`~NelPI55w*V1H_!ewFp|(AZmm}3VhP*HqidbZGDP4*
zf&Wr#I`nGw>xkMZ2e{tu2d<wD{CRY(UYpbt4T9Q!a3}vcrKa%)>E#AK9{5;9gM`8{
z(<mI^T0@|e);E=(3OpIzeo(cUuQZ#DyxDZ}pqVE2iMRAWjaaECiwsdH0{=DeXhg#V
z{f`aY53-*O=u>9;1o&a#2X`vmbL4dMuD&LB>Sxp0HF-l*Z{z1>c}~#Jz!wA0^i%lf
z$TeoaSPQ1_7gW4Mg8_T`Ap!Tw*o+@F&?8`eL~lQTMS-Y-eh?L3*_{l*KMFi}K=#T!
zmMx0(UcJ_e|MQh1fa(v(Jmn?V8YBX<?ft-Ps0Umi@PX(7w?zbgKkz^Vm$wipbNfL`
zpChAB0BDhDWR9_`817yC$%SgIT&SjS{3il`5cvHF{4TP$NVZS)1H*eowm%wpq*q4F
zH8i%P2@gQl2!tk^4jn-)C@ty-r2`}Im`$S5+QeU1=h+q=crfsX5lDH-K(3nwOh8@b
zjb=>v2Z%{$A89nV_*p((U*)s-N4liKboE~XAB@d7!I2(c#oq?L{pCWrL>^+@x={40
zW%4TDrZ=etSVt_ye@FEaStGjHd-B8Cx|e@=#5yxYd^nelI3j{(s%}%4MYsM!xBh6i
zuEVb%2mU(nwNQm~w10Jbl&$Pjk#$w-n3_Oz1gRm+2Y}}L1NU9!Y3AkU-(&$Dkmvc!
zFQT!W6mj^&fe$sBQXMpv>VOKG8a<g+^INinmKEry$h=xz&CAeFz-DoZu)#7fkMCFe
z%|US<U7cfoR;{wcY?db)O$)0Oo&0sNMYM?)7Qo6V44McEsQ$`FtOlT$ppE9~1L_vP
z${SQ3+a|}*ayMO5!Y+kRG@Y9wF8xX1k88{Xy-=MOhtb?wUZjs==(RGMl|WmK*~jBD
zfDh)(kf4Ts3;-`a5*Xo+&q1+F=dj}<@KE5x@kn{O!0hGJAZCfYz{dncfKi96v^um<
zzRiMWI@`yWi$X<fawla5v)_<<`lkFHa;|Qa^e;vO=1fYT!MxOW?aH=~+C~OGQYiN-
zr@lf}q<VNhYRJ~5db=*f*I^mJ7<6D}Fb|?jQvO96Yo&vaG&VmSGMca=T`yem^0FL$
zxfwtdN&$0ybg>k3*K*F`Z92F`{pU#)ZHk=!ip>G4^9LVQ@RUR<sEYJKJ=(!FN33I~
zBuUl`7M1aB;JAG7afD6{cb_AiC2ESQmQ`jphQMX094y4#0TMJb*hR4jxlNcXx@k2w
z3{hS`_*}*$S17l!*{+f)WEY?ars!hTDjW2_?^PrwC48-##RHE79xjwiIcXga>`i5X
zW?-i{i-YHtgHM1JlU#F*CDm%s`GwMf^3`h<gO4~Ss&SfF>qz-bzE2agYjrz+L$-@4
znq+$%w&G6ydFJGFk{SlOzZ<x}Rv#7DS*G5vV!j>?{3)fEi<x3SuVRzrQ8C9HQ8VQT
zvCeE)-8$WL>vm1c7J@sO94c8$(6M72B!Xr?C!HLZ0(A3|qe~VeONz+E+HXH6t$CT>
zmnMk=J~<D>kQ<F46j+udvP7*;17$8!p|nhzI)K!r<VX!34?i9FZ%!{RhjpoyU)68w
zLzr(H)K&c!QpU3#dNTO(4?FY(wVyi+t2-zIl9whYd0_hiJIvRucpi|23LT-AimN)P
z4(S$EAcfsgJRJCwFi5(H2B3{bb#jCUuaB@W4G9nlRcK<zE;N*pDZFH$emFVm1Iufe
zaDE&#hvaKPL!xw6mq1bu$e{V*Ynkk_zO3^_mYFGM#VUY1EC=$S>7$2T^w;3^3_1Wi
z4iYr%viGYu^`};=y^^d0KFL6QYI4K}wqLL@vqPIxA2>1(%T{C(Nja=3*k@;oDl=D9
zsHopiW^<9AAsSSLI?N{P_v|{K(l!IuO-WQ5>-|hIozE510AHb&;T&X+o-6k9Y&lH?
zopTY)jL|UjU5FbZm(=9+R3V4K?=(!P5sLKh6_ELxlYE>GU|$)T{jP|}1X`0*g%*~^
zSu)&m&|HM&CaB!)Ms(H{=rd<BnUN}VMg$(pWOH1Ep4u;0aAMaky-d8nk~V_GCO5xG
z9>Ur<A`@)-k0@!1l#{!YEJ$%Cdc^6pp92pJe@dWkN@HkvR;n0+WmC9!h#wW|il{J?
zA+=Y;d7Q}5{yq$GNQU#rNoy}!kSf%$mYyr9=@aM&2emDxft_dT^f>)jHR!H4VY^?b
z7O4P)-vjLeh7Q;c2PiM4{3C&~Jx8K)lLfJ|=+p(g10uGR#$6xz=-QKv%-@+}vFzrn
zO^Y!Zx|7qo&r51nHs#L(PjvEbe%}cJm<E-Glgf#@8rF_9IZ^M?ne4ns*EMpxUde60
zVb18}>EeWFRvz@b+<_b~BjEbgI1c49af+KMj)=o7jkTF-VC$gL$usnLoi4+M#SbkK
zPdW`#UWRrJi!=BzAoR<DFImDeIJn%&9ilVzF+LyME#TXA7Yvo@avT<6@9A}XF+U;>
z!EPF{3wSc{Ng_UjH>*zmA?iA(;5#B+PLovV6bpkx0FDd?0kDdb1R%28kMVJ`UVIFv
zc4V6TP`J;-8K7_DaG(zw_#!mQQTEqCvs>dl1j@ZfA7zE&Fj+s^h64@I)UMb%BCONc
zUy^YC$eMPrgmYxlN+;ztisPgkan9B+9WbN{2-?gUizOimY=C(x)2udOi9Bw|x8p-4
z!jZ%lLD|ml3uI4e9}bk-8Dp`$$qUSNJ(EER(Y#QsD)b+nL}!vknP!G|6`uzZZw?0%
zAxT!dHYnS7#WGJHQpK3*OL)C}OZ{k<*p8X(TUYfgT|<Y8I7KF9+MuW}H=8izK^_4H
z>S2Vq_eJ@Mz~g<*rSnClKFQ1FK1Iu~*!eV^3zCmAI^7=+%{-lN=bh#|XCxWsy@W1<
zZ}9s(W}fk;LRx_L^mOiiY?jWC#a`|fJt_b%DhK|yJcDusd|MLaT1jxXB?0x>>SKYA
z$2F90o5>RQQL7vIh(kCzCW(%0WEVBW#+#+`O>)Re<9#<ZGz5Mw@R|AIWuoLP24<#k
zSvo58>kL+b;|*B8MLTKV=`<)o{Si~}wzQ>)-vrrZyb^y4Kro^Hp6z8!D<pa=r7K%C
za=qB1=-k6eCX$>qkg@NcB?IQQ_p~L!{xhnWS4i~M8HcRR*y@n=^gVrBqN^zLZ_nTt
zrT_n746eOr`^~ER>F5uu*s9Tmr2R<rNbu+z{R15XHJW3(a3<Ts7x8TDnr_N2nXc2t
z9y%w6nQFPAyb4%|qjI2|s2r7fSLB)^T_6vNBhsFHLm-x$3Lck!r)_;H@E5H-U!D-u
zVv%+*t%7A~ovFe}Lk|1`=-)0y|5o7NTY8nD-}N{htrvm+7Wgx#{Bqz)w5&%dDtQ*=
zmILw#{%*20IVHfF3v5`h1}lJ59Ol?AoB>~x*U%HxBR#xal(1aO6Kes-nOY231v=FM
zT5hbf4OGyb_RnC-0wmItyECA7tLT&q<Y}_UK(mt6g;Up)h{F+dIFN;HB9Y~YHXI^Y
zk-lzy4=|2t1XgfL3~I*=2zSfjKooHI`l?oMw&cKHh&svrME_tFGaN{P3LzCo<OJ;y
zD|HplCRM{)<(skwrpQaW0RmYsI>j~Xu1zJDn;_^dwQ7c7*WtftNHAgg@L&R*O1=IJ
zVg>Lz&oyo4`xE&m4~ofptGcYK7#$?%;MBKE?a?!3FHeJJO(O#`7)Tu-H0N+Wp19O<
zKszPCmiHJLFw@zn>(FIw>WE6$lVDfLH|eP7vTp4&8xzqSvxHHBBWfAk{N9G-0T~z(
zCmAPoxxPUuch?R~TgzmV9uqX(Y9jU;^}zDFZ5D3&;7gu9qE7QXzDk|OEJNqvA@Hwz
zka;+~3B%o{<x`N~C0?*jrn42CC?$Q8YyKKnPIwNl7h}~leVv^LZn@;b9l#Ne2N^`t
ze~*MJaAEF_M>tAeqbITpU`?qajH=ivUM)vWQr}5u8$kLxIIrfh)8Yo)`gZVr;*l|d
zPX<1*QAd}kmne|SqQM*ZBjoB<d$;_0D)6aZ+iiP9fvU$r-x1ZMPlz^*;axlpBYQPO
zx|IK8*i1=V7N^JoWcwG`%p>6Mj)}N5a$6h~Rcx1fonJzSjw;}1&@l0{P35bFtU#q>
zSu~k-=^WD}0x%CHEpXcce*?^eBECD^uoR*3|8ylVIEr2-oPs7_)$12WcFJ|8Os|6X
zP5>K<5ZDeY2+=^R?{+YPijkx!N|=K~Gv?B>;6|6SOCcD-e6rm|(2cuo{Q1EDXu?qk
z`aq642V2cdFd`izjhK<i8sx|7#aA8SpCo%(E9*43pg4N?^9|~?L;9ITm|ZU8PE!t?
zYL2mGI<%zzcHnQEdh4WD?M6)%-B95w3uKZC7s1;lRNdY6^uGrFXO$RLFADfAzQOJ1
zBi8NwAG>uX@7B#ot`h&aO;(9?_K&yt7<@SY){8MA7@N730Jn=<9Di=IYV+hFxmlF!
zm-fNI_&epMnN5LdEAUT&7u^=K`fhJIRcZh6Z|w->Q(Nh5slKM>i)OZh)a`F*ht$L8
zu`XGp-vLT--&noOgMSp|k<yI$?5i~LsqR|+!V3QU1nVE*e7}S*v=5hozN(06G3K+c
z(wGkCu~BIMpx6LiwF0WF8<tes!26{GrLt6`1f@~RPl^``;gPh0uY$r@fvIX5#Q!#C
z9na5&l*T+32ei?IL4YjI>ignA48vkR`zmeu)P=L)cSN};Fod{ODcE^XM|$b=nB7oi
zq#7M8ujjEbCuON>H|sGJgVq=kk(5bN4cmTSbj7eC=CiNT-w1qt6K0}$P_yrdG&AZJ
zuVuS&T;9!^_%==x^_y&hSj-z)I%~j~+sJdpLL3Rx;fpshI$wdO15ZU&wMFda-K+v;
zaHo=TPF38*YS1efq~nY7RFn94;J;F5j|v(Z{ORax_{)h*_O3nv17|Z_gwtW0c-bB&
zLA7Eq`9m(G4oNw-7*oKYNWXAaIm5geyAr~`lwXioaUE8jrbW_{FCJ_jBcOWezyRB{
zRPz>VaYqZjBUbS5(2*$w&Pll_=o?5hFmgcIuD_SbTJ@79ybR;7UXC1(KSizrLuQ9g
z*JZdv6HZqFK{twU6XL}?s{jl8HZ_@1vq6Q1gQkOh)wb<>sR1k{@D2c{V-)~cVB<hW
zTy9u6RMbF!)xsa5RnL%?h9^H-!yZ^}=xC@G*UV=~VEg1p*Rkbvya3fdG(3kjsX*GE
zwn%z6Pwah^4+a9r>(D^dOMjP+q4y6Jve+>cS(aK{Z;AyfgLlG;dRjKKzi4I;See1!
z<)#ZJg5_qLq<h>&;5JBz0YAk^XifnNiv--R0$t08iY{oe#m06*CTn2@xLid9He-v{
zq^l))H6XhKlslQ{ZPpR$inoUfWpqVQk#uhoGzh_Y2j!qic&h_WUO_}ya0;ZOOPaCM
zi@D#iYY6EfYFt|A=T_XA7)cxXW~-5AGI-v*zY4AAAoNd%EszcYv(Q1^40SXfM9#!L
zE5~|>b;8h$Y#9288Y0CGmu)!Rh6b9)-i4WrTxluSjtt6K$1=IqM4N^RUmVm<7sci>
zcL%~Rmoi7FM$!Z{lZCcZFt59SG$ejm%`mvj#D)+6hQ&Mf=0^kKS>(dac0cdI)|c#1
zF)2{dktyY3)FNv)O_UyALwpL3V>jY1ahA%#r3Y&FCY=5~JXY|ddYU48%NFd>M-;Lx
zat^jQc??D|EXSze@`S}2cw8ZnivEg6B0eP%Nr}?qYlu(5(kDz>4~PW&=#p6_7LIRX
z{kdH2l#P<E82NxL)M<P<BLEPAlfC%r<5LnLn<zcLhWHd{r8Zo>4r7=NnJHAW_*nHO
zvl|Y$!X$wpUvDQ`OSp<b6gQmEkeFQ-VKH;>{Nbv8Yz|%eJ2Z5xhEbBtDumSuu)G|`
z1&?QQaZ7P5e-D?h=d)_PRTh|XzLk!<VU+B<Oexzc|Hw|^ZwwuE5G{w_9!(_D(J5d*
z9A)BVFg_)bL?=p*uOU7K3Z`7lkc85B(IE3pfhvTI@8Zdf!dR2X7uvy+n1zRqKnzre
z-#0Pig=H&b*XSc3y|Z%YkjHdQ$d`+-E~3T9Wqt)m?Bp5{n;X=Z`8C?FHCp3Vo7$^a
zvirxhS*Otx%KeSVK0W-Pyo_;I!Z%~BJm!p?VeYR~*-&y9VLTYG7wE&VOCOXtN5cGb
zPK+SWYDx-xCh&Cf!a;q4#S}b|3>$cBon&L~Z^P26&90$h6F?5`%i`X_upsBYfCeqJ
ziw^w)0Zqe)04NEkKd$gAVm_>Fq@1EtK+x{tLlBIE4*CbhRna16(-aaS$w}Kt3yw>}
zha|W`X2~9Y9;b&vSm@`o9(Dhiw|JYLiW3I!PA%401XPd!<N=V3t>SPQS6I3@z4+|{
zaZJ0nYk+(x@k7H-Dm{HhO4zz>K`I?3?WKUE;idYV-XPWI`~m@IhL4P4-JfV!xpOXN
zWdAYc&b#O>(B7>si409~lqTYm5jicFb4pt!M(%_2d<9I^Ii}A2yAcL#=N@a18hIJf
zhjPqK3$UD$<7>l;*{cn=$wY>9syv2R4c$0o?bdk+RkRlN@xOCEKY?0s2;D<>&j5Xy
zCxrYgdTV^@34oMe0)m%i9-JT=^fDfJf8c#L5IHbUd|(-!CQM8{4ls34hd8VYnqN(q
zc3X#omx)+HISI6jdn5IzKuzbvW={XhWf{C(mZ_ua9d?OxCy_3WgaMB0h%6xJ+}how
z_Q*22E(39Cael$TM5!6rG?lScBA@>se?MK+uuoi*OC{NxTaa~uBY6xG^Xz40pIWdy
zrqspe0^C@gnraxOyj;V`un%)^i<^6a*RU2!C%)lu71xw}DjXQJ(Cj(=pi}+dPuA6@
z9Fk8|A(iMa#@R9@0h39o#RQ$R80I8G#bHkv9js&TYmpat1TwFu78z)#qngmjF&|uI
zaoQw4xDHoQfAEJp6|v_iq$45;?3t2UjIc+kvhuRn<l@lwgeYTUF4>4-=)x+<OE~@C
z9NQ>PJyIz-xVlSy)#3Km3Z5aqa*XW~ts+az!T6{bxsc=43Ts3R%oYG%z_EA?&<+5;
zP1~$rq!d>i!<}J^6dh__ldJ7~vRBNYcI)h!;3b|W=ZQK!P3{nMW*7C1^MfXRiSN}{
zFc`~4C5$LX0DDaDu;xsR!*KTbn9SI^V!z=GK!uOsAhrtrGV55Dbg)<o6L*(&XLFlB
zEn)%oxE{1`4J`>6DnUggY>@P?gMJBj?PNGz@yjJ!83LolvLp68m8{1yIH-=`d}W8g
z`O0}VhIX15*<ND0Ucj9r+ZjWPD3<0&)M4o|6fyDWix_y)di6xf>R>YP-vd8?c?W!N
zHtP&gDd8PzrpY$70>@6%U@f5tp5!rFg;T`u!<i61V3bq>=kF%y&K`c6)0jFU=;XT+
zVl#?DI~A%joHp)N<v5HR2Rp|155erxq*q~VgbYppGcd-s+o=6p&Er)n8!L}wP2wIs
zZtnN1Jun(Ebz&JC`<+Tj#RwxMQ4C+#S}~6mYiEpAbGy>Q8FPYMT0UT95sPZ<cPdfG
z+~kcX(r59bY)@#E!LSpHS?qTzF~w1KlP;HCSb`9y<Rwc!5<A2vvmqz+S-^LQr!kws
z<=KPW1B*ZiZi@YIp}_h@LrV~hH7yukq~9XdTR6>AZ*SO06ltabgR)&sf^|37TB>4F
zz7qH{`PikIJz|n>V_S8D+=UWOS`fE6gQi`zvUWREgQ^C88E|P+&(N7wx~{Tw*<S>{
z5U%4Wd`J`3a0LFQq4E`OX>505aEedCsst{(prH-5PlaDwnt8lQO)@LlHQ-UImV^UL
z;(#p@v`#)g4az1K3?12R?bdxZjXiIgp=P(TGKnV?EF*(zJC07>Fsgk+#1j;sf(TU9
z&K#_++SO*!4rS{wYt%Q_%Y*P(zQxP%?;ZqHF2aSdbUsDQhqevC^UEu@8rL<6y<Ul8
zv7Pnu;t(u|p8B6jD(sa2l8O@6j#mvx&JW@+)#;-2&_Sdl4q=!hIs`$w6jznvdm}!j
z?_Ta3BEHu66f8W`%q1~Njv8Hr!APi9;O|&k7Lr#)!c35|;6GFE;uP~8oUb(V-y3xa
zUYlF>c6abCKoqJPIS$K?THFsEYtKaB2tmNDCI*(p0D?(J@2&oZ=_wtAy(d;OBJv<k
z8GHC7{WxOgs;%ZtRjZfT(~^F|{U;pb<oe;wDWvKicePx|xdld;28@52b?Rh%K3Iat
z<nbddKBeyw+&4sgt??=7%N9wl<Zu=S(kEb)OhZ>Mg;A2mdyQ~+1=wM4gqSCSqTRw~
z8#iN@_(-!2?zG%AA;<>py7#~b>mdC`(26Egrmo53qKnag5x@~Ym+}c3(+O6k1bZG4
z#GD$Of8AVcq#}yMH3fVlvZ<}*hW;&uf0ySS>C|^#EH~!`rCaYvSn2wx8g`^6lOKtD
zlX=6~O0k~IXHK<m;K`Q0YQo;N$;6<!U)5NzUJp6?26JorL~9V48_xk^?RAlFW!vMx
zc|j?_9l_lOjineBaV&j)fhZOfr@9myNqUvV<L%!UBRn-F0?9RfA~}c*#^f3y7ENXf
z_L~P~2QCqT01RS>fIM|pQVOsibg7LQz1f5qq~9B=^bNF@-b+k{3|^Kw@|ON_2V4_v
z_-q^^I7u(N!LkRPj}hHWEKM-_^Eut0YSKRlnmy3WSK~f$vvR5+Ppcp7!Lt~XRm8{h
z#WLb+zPhRw8}h5333cv5hkgP!^xK6@-Y%X?Dd$vu2(xbe*pFA?P^?=|6)O<dntr{b
z=EF+s{GJS7RW!5MeEeIN#K-5WS69GUuZjn7TeClfevKlpQ2|KTId+e71)3s?Cy)Jj
zJ$v;6UyManhIy_~;NISoMcBs9S8MenwB4U6Li}@Kx0=5y6kiWRfn2zXChv@)5(1pi
zMM&5Naoe#QVZ4Qe$tKbkXYajA1XgZVim$>dvj=xWoAg-tg_rP7{HFa5&3Sr0e=9x<
zR2_&LkTE?qR9*8*;3sk8^Xn_kDluP8#<-gh8kA#b@cm@6doB$D#qSPyG}MR=cK=s8
z;AuVqS9GSSf9qgvstMz|gLPxoI0>VCGDbI56~JRm$*cXkt#lhIrYbv8N74$3vG=OD
zV0{@i#KBbJ!D;pER<oMr8QLF5jOuW91<#|i&h&d#VqigwC2X?#YZ8P5c#+~Vqa)O9
z_TTkzm3#6srXxz6tmt3z_l>3+Ww#-&%w_iRZS3PzVj`rb7&BBcY4Ef6YWKpF70ZQL
z+;U;9-VFD%->t!1`{d`=>I*6WGhZ~#8~8RB0d@!<7ibNSyChHxo5W8S@VTrI@f~P$
zv;dFj+23&0y&$%!Ul*!TwQ&BhV8>wdT!7atU*|127+j5j<+G)Gj}`}e7ZAYTg<il2
zbhRcxIA<e(%*!t(YYdCvLuLU#WU`cP$Qt@_4n&EaW`T1lck8`_FP%`R23UvlRW(0{
z*Wxb1*)|P_nagyy-6<x{1>><VfwB4xbAL0!KGf>(cd15p$Qr03)Am_&da=I0!2ELw
zBN+0y^S)2oaCDLI3F-iAZJ7&l8KNn>2NGDb+r&%Q&U$8XTwxzPtkBXa0Ti0mKNDgH
zWuraY^U^NK6XaL9VlYv{xVgp-m=Ej|c@+6V9GBqyc~vLs#ruf250;4sv8zDWUt@bs
z3{0cg#~z$XI4>SdoT2uU;!Mkg1lR)AErW?Ff(Ru=6%0PacbE|sn!@`&2&V<xA-<fR
zh4|DKv{BF^4hK(zC%Lx&qr~Jq?qt6wzjTPagJbv|kp(={1{2Ts1q|f37%`m!;h#VP
zUQL6?EX*&$j%nzyEW5;r_yjWZ1``?d&2D~59Henwte3I%V!d$#(!%l;%G#{M89;HY
zofZ$VG#HOy^@5vRI}|v6!9gh#ZixSSh@GTIRbIz+$O=U+nPk$*<Wb4Xt>Mw95^PF(
z5%Q06Ub}#$NVR>1oRZp^{R9TM4~B`^r!X#5OvSSS`*;nGZz;b9+l1}9SM4(U^$osM
zE`Tj*K4~oqbFfI&*|-g~!3!5_2Pxq~dE$_sk0bZ2MEJs{QmgZE?JG?@Lfa6`Nc7##
z=nJ^QGT@KvfN%@j2WojGE;!D?8>?wJ|9M-Ulq+%FfF5vP$yVunxI*U3x%lrhZ{W3u
zjq0SN|0wec3SPwDdOUQA-&h`x1Ndy!BA#mz6LD-zHLcQhvJ}7W3w%BB)pi_-%#rQv
zi7Tio7q0{?l4Y_)QpLN~Zsk;Z5Frkn3QI-4EK$!L5<378st8<JcMtU-MgeiI&CFF>
z)EwEQe($z=(=_3rm~Qd5vo1usjY<aoze;7NLZk?xZG5wAGI-Y+^3%@ftCFTu#F6tC
zs38!3+<v-ghw5KeGV(so5-0R3ev?nYdHYMv`UmN7zn*R7@`yO0n)OukHhf=CVL+C0
zx{!MlgW49|$o&eov-vW*5a`E~*8cPl$biB*G4cLyD;ZI9L4K-41HsqY%qe&`wZNmu
zS@5(oKx{;Ck(m4))I(K?FdTv&f^QJfL;qcqZ3gOr?_hPt26us+wL?)|lT*ywd>U={
z{xy}X#iUDUJdY>b5z3^Uy?_ScSmEE9L%^zM0-uZM`VFQ5*Y?AGzd$#`m!?<M@m6z-
zU6!ZSSVJn7QpmBwl?cCLw}n&aL%HH6Z8KqX_a}NlBp5q<BIAf?Kp?_$@!B;Q04QNI
zdq?ck-4bq^`ggndZiRm+Y)(6?k{k4!5CgdH;EeFJh=#ex1R6XdYJz4q=DY^=o_q}}
zW9ws#EnGYH*t6MYfz%hRQ!yS)P9dwoy(3_B2L9_+oA}%O7+)pc#*NY=f)uw^7Vv*N
zB6i5zVh3-5xEz6_q*W4l55^y}A&`8COu7idbP*x{xqP>t!o%|K$P~06Zs0h;uEfUz
zw&QVR$V_@7`UXVE!Bs+NK5Sj|ca<K?Fi~2CMrrNrExm<SUx-e0&u|$xb8307`mz-Z
zC`0>Ud4(Wa{#XtOui)=;QZH6-@mySQd~H-Ed-<AOuF^!j7)Ip{SS$Y>-E2b7#sRh?
zsAB{eU28&w1AlCXKypFb&!$tzaFT)sOwk~(&19M5{JOXxa?Li=CKfWh7=x{|1K7@z
zfPuPVMpvk|v*)wnS#v<qR&hIf!Ty9R#`CLXq3D&!%uxuR>ixKY_~Vy(uY4*?EMs)p
z;YEUa!GW=V9EkbK0wihxw_MQhG=u8*m}UHBG7#E?7wjjn!_<+eFwRFBWsW+{8qD+f
ze>QKFrx|^%#_MU$qt6lfFEk^!!CX@b>jTFu7m9If|2?=xPSumu>pE9X#=*p9J^^u`
zchhM-%;?}x7^p^1ky9jP@6kZ`7YXaf%A}QV7T;XSf$K@Rovl$%%#+`=hE9ZGaPwY>
z$ayhgUD$)75?Wcv0DplN7BG}0VidNvoeF;a_~%>rFPnqR)oP1<{xTxt1ur>KJ(%=+
zz(iDVRljsay);4Hl(Qi$H3&@uTl86QCl~iQ?8ys^!36t4G~@<;PJ1B0d5*>TidZPW
zH4SlAX_Yj3zx6h*kV{x4=I@zuw?W=nZ0{DzHL?fW(g#-{G8Fm&R7FBfGNaewsJO)t
z8{(>j8#Sd>$k*Asc<FLIx0MD>4}xRWGTN?>u0Z4*%9#Z1(8IRVkqGSJew9HNQ)M#=
z>$Cj9rE&^pX4(gjo+&4p@7gcFa+p0UP-?fSFs00vZB#9C0qenDbRpbWKY?dGQMUuL
z!A!ytMh_c(P(1-uFv|R@#73UVBEoz$WeqsX?O}h~BwOh+5+rXlfp`Rla`Uurtr!VO
zYVB1G_OvBIwUm7yFmCq87z!*&-RNGdZVr$g4OTWEq-Tm3ZLS|P{ygyM*s9OsbtU2i
zrB}!c7|D~>yZkM7TwXw*W#Qf^IUYo`;}w87L_)uZ7t=r!Zgl!JjE;?M*mkee_IN`^
zV{E!3nwf+^HH6oA1m5(m(iPYqUM8n%S6UiK92~<a#00fDc~n;qUc4YX=)d_^2GK0Q
z6`Ct}bE8#|#<(tg;X;l2N)s6ed`Lj6SakZa1;QCQLM=;(Pj@knA<0z3N%=&Ra=CI4
zFDe}*g@EPo=#%p4QZ~s@S{HTLG=I$QbOiS`Fe>25l5o8B;?-Ij7&vrGz^x=gbf-f(
zv4U8DMdKPdSAXk0KjCz8?Tm&PHh%b~a3Ci}n#N26d$1VuO@a~C#5R-a#tPF9=@g9A
z<j8ungTD&4a|N*djW4qO9kzX9V21~m);^>6yLOl$inJfMQ1L(yU|>P>+gZL&J5zC~
z)y+NDEst{21kF;VY;+GfYUcVQcBkVP-9N)FC3>6%0Nz?uyLh|7^102NfJUCDNUUaX
zaEjDwDEId%3-}<+ega0NVC;T3@OK&V4L+UkHVeg1n^=yl!=^P$E`(((U08K`495gF
zuu7uV8(1r%^au4`=0cyt#E}OdnYY+Jet{pCw7$SYu;Dt_>BtHv8Lzg{4e*Y3Dq5#6
z=*T)~Es{WirBETjhn6TjsA49j8@z{&*g`6oq?@w6B~B;@_!jyLQ3`Yc)+|<ru_fD&
z#ezFSK?kg(6(S}m$_-Ek)`^=)z*9Q%SL2qH%bWP+--~O>YEk0Pn-q+E><AL}p}U~O
zE-0=OoyBB=ox+{!0fa$GGG6EE3AjIqUTeTcvff;Awv+w~xUYP75_KbPat@wez->4W
z`!v?1_Osn)t0{AK6b)(t{18^*c1)Q&_Ioh$vjmNOZ>8%MYR4ACgKvjB18Iu)a0ozS
z95xR>f>Jof|1$7gLiwN!tM5AWB^+zEicGBLC-GL8q)+QyHUXO)*Igh^enw9+<%mH)
ziSINHAT5(&CG(>$1sVZH3a78!eQX1EM+b1C{9=aK$q-D%nU#0jo`}i;mOu4HvcIbW
z*eP-iwH>)w_DshxyyO~hwd`1qamMV&lN4wIR5@4FG7K<>H8D!v*%=XMR?F}DELp&r
zL0;DPYrhLe{RI3=Lgk$<>!B&B)`M!dDU%=B>&-M|5XK0g#E;S(16JWSydPRA9LTT+
zdbovmX->*XO<Q5Iwh)qbtA<}E^*qv{j;W6TG1SA>pcD+s<iuB~E`&KsvXQI6NjYug
z9FyBJR%u!h>ctwK!XKFKs@P#QPfjylV$hhYm`k4CB<j5jt5xhLQMpZUesnU?X<klD
z%~%Y1IhW;4ISXd)31TNyV6Ji6Bhy$U#1i;9>{GesC%_pOdK1@-O^R3U9koZ52r}h0
z!Q~vc<CEnjt`RO@Rj^$-94f^Tg(;S&WTlvdh!~AxCLfEpM5c%y`$m^TH*C%^CFX|U
zBj7-aV>$6Ek6{vIEL;s3|1`O(_$DSs{w})^C?eiV%BoLNGqi)p7Lt%3WQZjU|IkZ8
ze(6ATM>0f{b$znD#H7Pg=M0W6xd6lC4|`bw_b|g!nLRz0zk=s9MUnDEgt`yMHC60K
zPLYRW3efAD6q^XNI7?cux)jKT#iK29SYN}NSLL#aPcv_e9BnQ7u%%UD8{nY<5exw-
z`@qmdyOs3vW6-=y(Muv5-wgcqG8`H^Bl5Otl{I+TuoVut1^h5S35PRuMn1yOn5Xf~
z@M=KT;Fx^8Xy!f81l>?hh;ZQrclfKoS0d|L$h?}4pq_{OSqpkBsUl4#Vaf6mOCQ!B
z9^30or`pHkRp@C+=RDC+AvJoMHcrlT??J?LpRc0vO-zg>_L5%h5S|{m6-AB(?0jN!
z9pT57ti)BOPO7lASjN@}N2-7>^?fV+f_e~~@U(c^nV0Oiu(MYJ$U6BGJ2ae?fJa{p
zZ<F<Tvb>bB1;XH*p(a4sx8Hpe6Qc;OwL(LB<Mx?97<C%gJ>2=;@)dJ_6vR{vLF2H~
zIXg;#UFu{4>p-u~Ws-*3X}kgcc}EnckikA;I&uKg)aQRvODY^MMkVG&vQAExm$*i}
zJ<}j5_EuPiiNV#l4z@{bf$I&njxo;&K;UDGOyyAp!fy!7PDYKdAowOG#vjrVz0&L!
zPcJ~|zo*ZN9SUz6S@T$Ep=mRlRHMxSvk~eman-3457g|5$1S-AOkT>Y+SnpO^9$zC
zFvw9JlMU39N_H|?NS2qF8Q6+=`1nm5osgf%X@g+AN#jS935?s4G26G>eG?Poh?rHh
z@bxqWWY=n6ywXZB|8ng*X}0VRt-b3IOPGWQkI*C7*I64d29Bz+b^M4bNXO()>ntiy
z<&YRE)Yqs@ogl%PD|V-~i|4X^*z-8^(KElolI4iBQL^p!A~X~d!hxELHbCue-O94z
zJx>1>L#3YObVToyid%}i;R?I}_umkS7k6^AF#$UNos@JHt^p?CTJa{_8VKqyf@X?n
z(TkzQX=!_RrTsDTPlbm~F+AOhvFh8c$IxX4`fMTBl|_kY^RJ0+kfG>xT)lN_vzOD{
zl-)W3pZx3kKLh_TTX*ZnyY&~SwqxR=*sasyS8`d#rdzyY6LF6n)HLbOk&6ypb+`!i
zH$^x!ek<_JSoqz#kjJLw@fIDMhI(7@W}2;bk0A)~35QkwRQRXfUEkhaX@89TQ*jX`
zEEx}W>vDS$g_3q_`w7zVu9AOY|I~pL5h&kc-ihu#3IVx*_<F^BgYMKT<UySOtmC<I
zg(RPmFboM&b0|NZdTz>ZC*gO;`@1Xc&rttV7@3RtWi|`fm}kM-PcbK{+r~V9&>YwG
z_J!bLz8&m1$#I*u7*hOWN(Vz)hps=d=)$8dX1bn=bJyLtArXX4=%Dzbr*E(0koa9Z
z#o30qb*}P8q{BkB3o6qC|8_KR9``^&8lw66bIU*V?t1I)O8aBvpNcgRX|-h<U0fs^
z)LD2=E@XSm8e_KsIHiin?o^>nI`*g>y57cSpcoN{vD22HhVv?pC0$ts8H6w$yT<`Q
zT*vIDal6ijacY-MawlTmmB5IaVRwaI%0o2rOXPb9fZrsuO*1CyBY3%fovFuE08pGI
z_~mZXbSCRn;#Vz91x|9eZkM&1D*s_K|DAFyh0+CrY^v1?e#GdLhoS-InQ%7n$Jt6B
z4W$Tw7%?33T9iWv9!-}&KE>&REnNcjG9P-2A+?eAUhte58eFj^kLL9+cj`9uC9RL(
zdKThvI2qV(7%FVZ;-OEuTrGniC&@;;bVRR29yJ+;ZXcbn4#O+;L$M%-^%Qf0`2D)Q
z_Mc1$QzRST3;g$W<~!N42)@ov^GEqCF;yMK=ve{uw+g2_cH^-Jnq5oOLbh6OU?=Fk
zN%b}Qv0665MJL0Y6z^*ig<`cN|B^l`eJEVtGWgT%<zGyv6*JYb2Q`2rIP4!9353RV
zNN$3sd%L_POUP{lE9Qrsgfb_F*!7{p?@NKdD3Pt$gpF#K^=uoWezZaJXUN5JI$psg
z5u67#wNn@1wS;C~58t3ac>|%wXM>g?UWTDv#&2IfLpi0<F>enQ;Rs(9Rt-lv^~P9M
zEqnP{UMWxL-6Df+;%iuq*^L*{>FR@37XE-!gaZb8VEGstLBnR4eYRF#a7Wk?bdRS1
zX7OJgk~cZo5gd?*B6HVp$^`2Fo35lhn+IR@ht6x-#o6D_(KPz3O~a@b&mwP{zN~WX
z9utNHWIZ=mKl@xb(Z3cPBU4#`&d2TXmuX}7EETk0Xx%<tk+Rm&+Iha4KUAXdf1-`P
zMvg?g&Q1K3HH-<7$UZ2i^Bg|n5Pt-tAC{J9pIf4G@Xo`hfx#~agYUor|3~B0ug^XA
zoQ+)g|D?2KY6)%TaC&&^+2?Xd#{O4ITf{x1gAyH#CUHOZpd4x2{P&c$Nu3EQi_Nb*
z<}SeI5v2YmrOjez{p@!5adu&xJAG@#s>3Ec_Z-@<u#tT(h+U!=Hw|)Qzfi#y<>c;0
zF0F`sk}z%()&QOOXHD{@F7{F{BcLi)2&+`DEL4Yh6&{f5<aQ;CqfKA15*Y>px_GH9
zS!0MTSD>okC)x^f;#&){CUFFtzQfv$MFjixH=_YdWPuA}V-qE94U79++<n^xSAww!
zJb#_#3OA+)4j7!Aa_k|)=^)@INoxdcXXI*Ltm(cp4Z<_Bis#xZJ_#8NMe5-|CFplK
zc?>%-n-UiD=|-QVWX#4T#3D1^TmeI!R?1~N!d$!oSu5m)GN|8>E8$-;LuHC{=#*S6
zuSkAi<DLE676Li#_fpT(g)~;kd)c2gVpKG;qr4i1)@fp?6^CB<LFY1>2Z>%7exqRD
z!74Wza<2Qh&~tYr8^05<{{xHWCufmQ_xdCy>v60evg9F4V}+rB@8#<AXAzC92oEnT
z71j)ZEkhWDMdy<x01p3{<HzcSFo~T)(2aEah8un7a~xOUFmac;gt+To?gl-AoGhu(
zE`*ULpbZ+k+GLerKUZg7q8c{HI<rPmD>yKabJVM}pF>_gcXDQ<*Sh2zG+dm=TT+V{
zM8TtLE}s|WKsA?pIrAjBJQ1M;;~nG7#iMt#**w~%<RqtlKv)PiZG@a2WxH@S{S+P?
z%D0YV@ZP-5JJ3~b0<if_(ykZ~WUvpSE*!B0r$`V5D7@KhnV{cjA5J%rg`?_cm28~+
z-bRj?Q?cK$Qr6)epHW%j$!bJ7I*tRRI^&k05ek{D)9LU(zQKHQV{423#u#$z5>pVv
z?WJB70Gq-|ztc<N1^2hug0bJ&*w^VLrbVtX+xYv(Nw<nUc&{m!-#>Dv*e1`3O&Y;+
zFm2W8Rj|B8!p)T9O$Z{k?$~dT+yxGfa@(LscM8=JebjlL1M-(3mxl22zDY?f$FbE|
zCMOCPcZWBdusJ;}$<Zz%YdkL0AEqILn`E&Zi2WW+?qj*{^=T*i^OW9Z@vGD0jrR?t
z5BH69YWa*f)MMoe{#2D5C%>`<FEeiB^q~4q-6f8D<0sd~dUY?p!%W_1fhF)6wU52`
zgS^4)6RcC~v@22tyiUEV#^j1hSTgE#HJuaS1zge<{R2bqAr@n-h{b-Vw)Zd;D)A<(
z)r+9a8QD-)(TOym5A==dVD<z|-!9sx^&+{MFD2uB$kW)(A{`h5<xQ1tG6*Z`o3PaO
z0Txp(HWV=d6PNo%aT9L#joe^z9jo~!eN?YgZ6b(UJ)ho$JBYbv3OlQJ;@r!{J4-&Z
z8*~359GAH#V{oVq7u#(5R|?c`?3?=3b`4H-U7}W*335Ap3DOavr3QPsIt1!JEEnrh
zWD4_vIl(JoUk44x`lewpdk|5R@rL$s6J9#hX<87>6lHkEmKG2*v6NV-%AA;F7(fZZ
z$D5hreo(l&Zwgb}OW0!5s$`Ql*=OlR2ue?iIAIRZ#$GX2*T#MiX2;+zf-6SetdGBL
zmyGfHh<fH7)yi!I889_eV!R>f@g@Y>K`WYZHfFI4G!)BTxO=&+KeJ9R!yc=Z*J2&B
z3EE>RJ0te$GwP_`1QqhoQ}x(o1u?7~A@qh?yAFII@cD2Z8yM9<PZ}mFKi-7Pf(1Af
zi0#$b@4@V48c(5RQ5EYHQ^Ytq4`hdy)let<JwbK=itqxl&8BI%AB)t~4mRNDY(Tbg
zw_A$z3Rg~PWlejIP}Wi`R)KUz-*PyZoq#ZzeXc;q$}eD1y9D7!d-*1HPGo6!`TDuQ
zXYQb|UCfqnS{ZKS7sUis$(}kTx<n@4GtU$y;wbE4)p9&y+uq=~T!yv(CO%D_6(6Fk
zKTXqfMF0(liqZ;uu1QpU%ni;8^cmKLpy1dFL*}S5Dzn&xD+JWf38vAmS3_0*mRMo=
zA1dl$RRGVpB`lJt9Fy)@Qz4yUY-UN9J_7LKya(@!O|b69Ar$5^f+mExTp{TM1>4v#
zK9)Nzg7{q_KYcg7^=#man@lxglDeJk@g|H)WQS)W@_jn4!*ACs`FV0a$8ezHF_>9F
z$YkU3Sf~ey(S@fY??SBlF8b6z%&?K42$`@%+SI-aClqHK#rK0b>H3`RVnARw)?YL{
zRzjjHWT(dEWP0yDMy|)>+MZjW)1>LOh$=;(jtaU9WQV4x-`I+m9~wFpvX~C!qQ;gt
z(!=>+16&O6f|h$z1@%qP0{COb>(n*0JTJT}hTJ2{2K%dijHMi?nDIJYj#;O3#3N(K
zFD!Qar0K;XLyy_39~lGQOt>rF^xZ9~Q7rJ>Ou&pI2#`(_z|qhYP^|OF2P&Eqi$n`1
zU77=&Y;d9?#hgf}CHrP#!lGXb{8a)zM9$1KG>UQaX*WD@x8T)^4DrYmF;|UvvQQza
z&?8$kJv0|DCTnb=&2o!qj4c3mA^g={AbxLZ8O%0qq8|)}ropbWO~mqyrY5ka_^wzp
ztn^KjO4k|kl`eRql4Cr@VU1-<n$9GUQ-T1%9mF5M3&H8TXlgW0-|dz$hz0!ji2m>r
zic&!|cIkcBkZ_m}P0{3n=q+t&>CtKZl(1`z?|Ubk{Fch^iUs$k!hj1y5_J)|5jl?)
zt?Ltl!}AzEIlGZC2)H%(uDF%F>mu<==>`d=<Rt9zB#4H{7+SPEQX$J27A>&I#xMw*
zA`6wFT^Mi(u9L9x)T>kSb)E?qVtm8OzD<R`aD4DO-k-TBW-{-;B7I$qImN$P4KJN#
z+Fr*)W3f;{9RriR9ZUrt7H8n>aXox{6xzVS=L`$NQtq?})E!%iSI7r-xY-g?TNrMe
zY-6~jqR6eJgipqGnIo#3mza0(_T&k%fxWIK=zO!z<eMD`Xf$%JUI2H=0OE7G<vZ~-
zrGMFtEUM&uY`pqlD4boKT8YRr@N~H%_VH!1NcHf1M4->srFi(K5MMZdg+aoB4eB$z
z2I2oaxGqUh7ilKA7kjWszpgv+7R_aO9B-hLKKCTbOFu`bJMZERyB>rfXW|k`wfELD
z28{FVKJ{F8uZ$^JY<@xVGu{gSWQGyDmA@(9l<RC9phS7-nd5ztaBq$+I0`N{q`InL
z`>tkl^;?KW1y6DaU~GC7U7N$5y5w4Eu(TiS5#BH$EnBPW@$|-A-H0bQ=F*A~J?V^~
z*xYw%U4)Aa$;r4kdkf6n&UB{yHIeIRyb?79+s-O88$@5m5e~xtV`2zHT@;Iu--PQN
z-9-2T`=Y}{eG_k8by-)Y&~J2kCY#PjcnL)Yk@HCqd{S|e?19m#a_BeK7#T8D!!cHb
zFhHNo#igrOybCtsGMS9ARQCg^@Bo11n#4$ANtz+Hs+bzm@Z?mRxye?;r`J9ZLwF<x
z+pXTVUVkC9BS}brpF={Wd62xdVw$%!5&;|NL;}-GWPOppF+2Gc_3Fkus1R#E2&%l&
zAV0FU$lvhn3$fj0dK-@NF5|-B9xD~6;T+}+i&(fC<>Uc%1Qv^|H1fB<9Qdb3mW%wI
zfczpj(j7E&a5FLy`3}SeGPdqajAH6#16=m&oi0f|ST4Fng{mOsgK_E)R}ldPVi4{p
zl0T8Z6Yy#PL?wazIyIBt^h2El5D3pojIh5b_@_n^8u=T>vJB~s%42xv#TnLK7-9I`
z`DHutgr_A&E%kzdD;))9mZBJsaDk_vHn1a3R3piY{GGb~g$kLjLxX&}cGUsBhmmV=
zwt@cl%g@6hzdg=?Lu(|Wk-z<W(?2z`T;y*%Hsbp@OW;_MpJ9t^_zFi6B!b#YqKF54
zBdd-4o%;T!781;J;}j`^UP-c$ppz?v12l(LR7n(Cg5m?91K_F?Ap=E-MG!Gh2MPC}
zq+`V?n6W_z$n^s!r4W?!SWrT?tdVU>;!g3G693f5&W!wx)v6!cDV~;JI=BlrugD4_
zf2UqbaHq%*EvNq;a3ifInehQa(N>czhf*gYgnQx@)FE!8#8UIgfCzhdYe#ZD^0$BI
z`=>^hi~J4aKw=*6!}Gi(%JlDCooHGnG2W-=LX78P0|b<@41%BPm^5{Uug4{mHZ>QU
zS8}R%lk&Jtz<t3UnWpI8p#9sQGBEq3scW(uUcJ-gdi4gJZkDnxEPcYBMWi+2VaBO2
z1W=ruIux;e_!tNcV(C5;kAKzDzZl)v6k?c#a|%Q0Kqn)0=s+A6n<AVVrr}jt;#4pG
zr4!e1>NrJdKm+f4_ooxQ4)gx@rwlHVWQsIALb+6pT**%AJ!Z1*&<KHnn<`NmdkrN6
z8Qdo7PsJV*-rxR|!5$@Fk5l6iHzrMiHx!#RSB`x7s#<5RV!KD1tfT-y4@<fJH07b?
z{q0W~s5FlyPu9a9Z$ts#rWfI&(>c*4Z*f|IB+9=`oST|D)UdqunjVSGG7sVb<JZN=
zAni;c_z`(;gmZur9z^R8<sO&3zx^o#$r_oadR3&8`Dro1kjI<N@chat5vX9S;Wlr9
z=~db0)vGf414Hx%@5P;tpEmMe7w~5OFQe_XIE<pWbo<C&f_h*bLG6_JgKcp5B5O(H
zH_(_n7-&FU>a_wb&xWX{>)mEA9-r=2ueO<V7~o&Eq+tNwAA%^9$eroL8O9BW)H4dJ
z2;x!!2MT);FD#Sq)U|R2c7eO~1cXK&p|Q2K!4adt9Ds{*M8GZrFAN5%hz95OcAY2{
z^s`C6dRxDSSB??rWR{+cAR3WExKBJ#hWB>c%ne?IwV>sAgIIu<u@9T~lkaSwwRw`e
zPh_!2vc*jGGg}tYQ#Kd`W2?~&pL$$(RqOQxb>7n4Og*)RZ&x{Z!tnXinzkBAApQl&
zVgZ(VL4xNfh3`YGZ2oCt_%c~z4(e96#k`N+WnBgP-5JDrnlE$AKjfH+_^dMT@zd%(
zj@zhEUDsRyJp3Gy1MG1LCH2@tuM*PPd>aFM$6=>Q!qFmKPx)-&mjmRScLiNRN|iE$
zS;1`q?+)TF>0&hte&K|#7dgx)J6qU@%$UUog?o@vFplCR;7^D1Wdjp{vx)M+Kdb|R
z-cGTZx9YtJYz0F^qi}xW*6L1yw4nJE8FFJj6P3c;oQ9wb6ZK~9m7XsuwR?t~G#BX1
zNQ@3vY+i*=e9)~9)1#O6tecbwFD#0QO3?Fkfoav{!0w07Vo)GrNw%ILyRB<XBhhQ~
zvv@cMcww=VsA5dNRB<^t->OGun`y><BN@|gqlixaY{FU~Vo|lUusXSr(Z93EAc#gH
z>T1I?JZ+3JfZDGU)(MV<JHZXfgs45?G>XcUurweoZwt()+_IR%y%aZ|Q&wWO#E47G
zXCh|8LKjA_fR8>XCVHZiI15Zb+>b<6-lg0?VyR<-29hzdRc|-b<Z+4B1V5#(3Oe0r
z!~!*(cR`(_9bgrs?OwjjV_({*3S>6ciL{HIF6j%7u6RbPN#Dky^C1KT+X%H6L<@Dg
zOjL?3rciAcU!t<Gj+jmqnQ!ATAX;x^8LT}`Js$WV_#I+~j0R5HIy%F{imvrx%sXh&
ztv*P4(y~}Bd1b%$3L&{$lXk#Jbn5upD>I~%l(ZUXrBF2$DqlXH55~E22Bx}o*_;yP
zO55H(P#apN!i^|Ik;|ARY|I>X7NJ*Z{6?}TlmUigf=J4#0b;lhdSBb>g?ouXFO&iF
zuy#p`-q11~D#>H|PPt8zCym2r`U3V?CMLyxfS3zomxsm<Hq!gqi78>c+<~_}x=GPO
z#XGpUAX9i4;5~{OwWkkchnCe?=6ZzfV56QY#Dn4IbT!|q8-yhf)161&k4wdM*&r-Y
z*!T`c4`8<Pusg3#z>GmVP6r?78~i<MQMsV=<sM$Zv2$s%M!Dz&xFDUBb8t~FAH8=}
z)$mLl#~c)S?3!4Ea-+$uX$srJS7Af>y(MO~8jt_byXc&x<@V~BQaC~eW1<_6OTg??
z57S=0e3jZO#x>t&)61UxXbpP+UOt!-V{-SJCqKH5EvIe%rQt^{L@Y<{!qzHZ=9;fg
zVV3AZaJW%k!b*tjK8f;s=_mw&i{m&LmvC=&Fg(~n<qbp$cwj5!F&EF%mdXoy79+vf
zAzsZkSM_bRL1&w#Vk#Y_U=`pNcql120fQx1ho2O{_o5Lj$i}*63&NG>%PH^$w4$&S
z{$Ho@;svSFXpnkGR;n3ggY2x~CkfQCO>jlbHodaIObH1Aabc`_^`-gjwfUw2Z&Kn9
z9jIC0*-%b#pg#gc6M=yda8!yL0dWcU){wwXZ5O5$JN$#DNgseBK88~cQVWIlm5n|j
zK=_&AM>v*fL}N(rZGwxI=Y31MJ|c5Jwhmqvh{cO&ah)2MaBuZ8T)ksv({p;%_tuDA
zoNmeI!wC=PhwJQN{zA1#(b*f|!?UOlbPWkSLMOyg9+z-$u>v;tDnrYS@i?bi>rC~}
zPp}c^YhX->P6dfahaZX9(zW7=fmXbUPJ}k;owCt7iN>dbz@p(N&Yur_Hb$HqM3cFo
zSK;-WIi}t!FK0a&E7*w893|M{a%&=1p|+G2@L@RCaX&5F9AcmRyFbW*nel>t$6epp
zNqsAOTd#)E@&fPSzov`R{RD-aAZS6{(2h&Ex5hf;1gpB+`eXLVp4Gft@5f^cwR+SA
z-OfL?g%fMA+Hcamtb;dUF_3La^hGiOf{x$5WDgmm&JRB}jS9R_EZ@UXzy+%@s?DpX
z@icq3S#7?UDE%t7NB$*lt6kWkHSwvsoi*t^#N!J5L*Vayq1WJ*U7t$UU=^MqBV2h0
zHu_6x8**d#>1V7b6Rx-$<q@@1ZX^>1+yWxOLaS~EWI3(8vxlFs!I>>XG^l)*gYi}>
z^W{}5bX!Cb7NOaglULZ(Y#3-qLFK@Scf0flU8<>gwn;~fC-4G>-Z*s>mvC?CC(K4!
zYBt|$F5)`+1WOK)x`z%uSE<viz^uj?Dq`jG*E4wFw}J*k;CcYt^9fUdb=^$1K|Dyl
zPlEn}EgOWFK?Y^G!EO-3J$UjmB1>SK=p`@WHFATPj6K46c1n&}ZI5PQb;YWqM%D>R
zz9zj?pz+gz!va<>4~q@ri*8hISo+0&;l+&kw}ER7n*gu1&0yOKK4z(OAL@bSQ*0J{
z1X8w<(tl;(TEz)UxNlq=J<bf!J+5JX+yHhfR7|}o<vGS96m0#>3GtBzJi%3tvk>y!
zsyF*ZWE#j#8$c9bUGN(3;gjSj1pflDH|1vB4}rrLmg~YN9Z2L2AQF!SKJFp0S&(>-
zxx}W3bXKPJh&?Kw=UM++#L|UP3>{Ap|K{W$5#d}Q^~-@11b7Kd3-t@}#M^?>@y|4a
z)2eXNfVW(VwNjcH<uRoQ>VcdC(6XBYb#0T-@@__68OM1SUyJoslfJ17VNopQ;|2Yt
zYoK&b!O3rl$qj09plq@wj$=*Q6;UeE5*ZH>L`1Ph*?V_wV_-q)O+W~II+t^Qf}}Ki
zw`W+AgsuA}#G&ot`}KV0bOm+6F$|{&<1UyU3l-F17;E62G<=x=KjT>PhzY)zkm0o!
z3meo9WW+UO_<RjlA;;jmgl9C$MHm0v_lXVr5&OFl|6z>@^%~9#YA0tBnRf8r$#5kY
z#$9@9q6wZjm#}uCq2TC`>-v)mRfU?Yi3?NV5e%~kx_@>AXp2=v*L4<~tb^Kt8Q$E$
zp~oe5LXWDK7q!ERpd!Vb@J1@S{Ss^91l@v%EeST}Uh1vkI~eR}@8Yw}d<+T9PJUqt
zFv(wHu`m(30A~K-Iy55mzB44|*<ch??PPkDEFV~QIO@<D3B?#Eq%G`4>}p2S<Q4YV
zB!l;2@Ej6;PBpYgd%l$R<Dw2xEPLcCwE*EVm*7ca7qs1cZU_4zEuNm=f~P;C@~0X%
z*RN(6s8B_VruIhH^Ci@_^L3TpU|k@_ysq*PN(Xquo{!9lYIGyFe+eK<P<A1`sDP`~
zehpyZ7pfAbFi8zH@yRO9l$dd>TF;Sr+`g{kRZl=u%`TpXWvY{%D|~Cl?g2HgWK?54
z?qpPJUdDb{tg+jIAB4@CYQh=wXd8hzYko-L)#(tDM_4OPq3}udwrHn*%Ryo>^#bw3
zVd-&6s3$KPcrNfPASS9~*lps+R6~`zokCS^VKca`?pL|O56~B5xM%>jQ52!dZMxU8
z_2;>=$jlXG>H|5<vJ{dAptr?MyzeyC+)!>_E*Un?`FEGYR7V2lVh2mKUUxbOOH+#;
zCC}j3=^Z3LUOpfAA0F47Y8(!hvh4y-6IwxQ)@LEQ#9#040{KId=1GqDIVEmKF_|2!
z9mY*m#J+V1Z9EZIV9x4^ivEkOVXAS<gR3AHcPRXj1&7>L37aX1YCocuWzyAa%-e3x
zR1=x*R}1F<>2UB3jm8D)(P>_oA=DGfn~FzzKH=>9fYMffl;HRrffD@;i=o4q<|x)h
zN@4(`Erj(%<?xHR)vTu);*uw4zRZBiMF*cHo#Heb?j0HwWPkATJ)R#U17V#%A*oYZ
zSbj`0c?`%n3~~M?Mo}_Z-Y@fN{rGRn5OX&G!^$)gD`ErvHx(|e(I6lJHdMckO`Y<>
zEE!^Rga)|{ZMwu<=2ujeohSe^QQ7>7>b9B*x+n(-f8BXy3je}Uv{_fFCF;6(hGvXB
zMn9kdom4yuC4$Ivo_>V6Dv#a5+RT2Uo@e@~2X+{zo)u8WWW~y3^a~|l=%XYoA0A%W
z{D#gGlg%hXbJRMshSAec7<+_kD08EeWnX{#W*?PfRE=oXVa!I~;?{Q^b~mIuIF4Q`
zD2z8w9^EIo60iy(JtvAe^jfsb#tyiz+{SAHqh`zREfFu&WAba(PZpS|x>`2VThio@
zg+-rJifHgH@ve+408IX+4@9u1I?5)?dQ9K%;*r2bTz$4)(%Zpr^S$oh9jwlIEdaA+
zB<w#=F$6^aP9sz8H~MG_LwPUQ_m>XI>Ea1%3WC>}P0eF&3TpaMA2q?$?o>i{<q}>l
z=<T8zu&}4$JgWqZ`_fWUr<hmr*iyX%JBG;2?^~}Pj8X_@sr+J)U&3lB%fx=7kxkfO
zA3@a-P_38(+Ef<Y+1$r3`U#f2Ef|5_HtJaxRLV`>$lex9@$Yn=&RW#BvF}kYTx2io
z;ka1{4H1H#W^VBq$i2!11SgyBB`TqR{_l4oR2htT?vgN{%@p&|ZKZgJeYK|5Bw)tD
znL7$%2`lBtNCR~6*nW!PY(M*>pI|YS$9(=Q@Y4nCKk8x4$HfJ{jQ?;ZKf{l)f1jr7
zaYA2?XOM63HMrL`4I8cnxWx4bO?WAp=yz$~tLC#cVvZHyT{x=TBo3?ndJZRXY{fct
zwT=ANX*c%Pd++}WycFMH2XorHE}hmYb*QazJk-*gY!0u0Ye@1|tceJAvKT^RKKseM
zeuBkR9`lK%$s``ZGu#eAWQR$7pPbKDh_$%kF&T#}b?mC%pts;U_gOhZwd1b&ZavOW
zQ2j|f#DvJAt3|Sc5Hy&EVlavM>?d{o1dFLW<`b`noafU>c+@-<(nq`460t(<;<scL
z_WfzBSC!z3xTE{v8`SR-jzX-xmk7pOOMSl88!20%1j$s5Ib<A<O+{~=zn73li0VsN
z4~F`QbozAu8je1x^T-3Um7P-JrP~nGIyDL5ndubJuShzl64eO(=)rGPCuk|Q!QO?g
z(^qtsYL>5*;|-BfkCDIjE-xXSKSl=nEQ##B;w_ApwFFd$e7kDFeTAsJbc91d){Ar+
z&{w@s<jt~My(KTmEH#7Wnq#~n^g`h*RZmW~P~?6v;}Msqk**csV7DJF!BhbJv-xAo
z^htF^XRuB+4tBmOzKI_PADh)HA%ZZ_;z8fg(SZFT?=J(-y{j_V0`QAS$Wp6Sme_)$
znQHLJdBCQx$9u3+OI(HjYd*V%v`euL^t!7~|53PCJ#w8#q&`tE5WNV85x%fQmkW2D
zgcN>+_i7hogGPcwWb9)f>*TY=A+wLK<(+&TdOg?RP_S<hkcg{2{U9+_<B&Gb5YbnH
zW-Xq`ep`H_8K*&)@XV<@#xVvH=F>K%wO`l|$r!{=jz-@rS!ylzjfLth+cETbnIn;8
z8B73R-y~YrFVa%gG1z8OC(wUefU=`Ovha&cJn=b2G+MCg>W3%|NoQaU_T@IS!kmK+
z44O(y5&Gt_Nn)$mfJZUCVek9K95DX!@7};{n5>-l*xavZyWgS4@){HI3w=FF_F(Bc
z7S&|nQvNY4xj%Osa|k9HED0vb??<IC;t_?z6~eCIRMDXp+KAENFYteqZy7Aa2%Re9
zJV6b&6z3Bc{=*fAe<6P??|_#b8i@Ff>S3x5gN1+LC7=$KCW+u`#7QsZtHe!vqdJWh
zs2TDm-Va+21AezAts92SP6QRMIs6L_HepJ?d>yY$gKdztsKiCIh0pd!66Xs}FlxGN
z+kq7c^+UGF3Hi^HU8R$iNH1?4_Q!6J?JyeQU)b|Iq*P<!HijIOU_<dzJfELm`tl1*
zy~Q(OBCfOok|n%fenJx_@ECu#8s~!3VTpU10#3j*;GapcCKmgP4+O0P8#b@A$Sek%
z418&#Q?FUat2lIi8hE7wyepTpCDjl#)ZwetRn;Z`*E4M<8ym);I*qO1yRhuMg<-ao
z6`CvJkUotI@OxoB3xeMt!-vRMM??d5oH?+v6^a{rub!kHKP`6ZW4y&6q{2S4&jfxH
z_@{);-L!A<^`osrrqecy*WK}$U#OL4<un3TA=*>8Tf@H~Fw-%Nr{m%9k9o3EjzH}z
zMGIDKw2&wBbtJ?(L-{4vA0=E*_!k5u++nW7L?r;3Vt-_yfWnZ)`fasIK2^$2h+<KL
zo#R4vQsg4^&wG56b<T_i-6G2w!R=GI>T>`HBNYCH;pOOr0{!4>97Nl@j97|0iAA~+
zp>Ba4?$?LQgntc?Zo|A1)(+QkICEZjo>qS8z-O#KKEI{H!xDo!xI@*LG{l)ZF0aX%
zVml0$+v(U5z3iX6n`}92{V^B}m59Y%JJx<vSdFQ|sC>hm#@te6I!(8Fa5Vz%0C%{s
zB?5WTcIa|{^aom5VqcR1#kv9^3{J^o?Ac}P0`vzZ)L@o5!rT~!pePb-a~u=}0{n%q
z2>#YOwFUPLf@r)+p2i5TRxjHb1v^R_JO`m&BC_nf(rKsLJvgt*VeJ}0q0r<WGt1cD
zi1Y2_JW(dM@oaIOuR|QbO!0;~#}~6Ip3M)cCpM`Wrq0YT+vQd<PHz`gY?pAo`sv;X
z>awLLiGG*u(R9^40ZtIyGF&0dVN=v1y$JsXvDYnkylXHIl*w6UiYnD!dIkB`R3;-5
z<HTu-UUb;2&ciDB!9on2#f-EeSVtr{d0W_8aM#I5j3LCrsc;@HJ8n_m{$Rc$_66l)
zwvH`hf3pJXHQaK9G*Zn=3_vCs9|$0heOlsn?#150?7hbX<#rry=dic=F?gPTv`ykF
zy`+F`PSz|OOMLf+O$3QJYfDVxfcFi?VuH>NEsJcMu|4kP0^#mt2;Yl+0-F%^1_|zd
zjMN9q%ql)n)tO4XO6nOULG&!FY+@j=5R#4wa#b>-2fUYnaW5-_--UzqHMPesce3>a
zylv8q>FYNy(C{G`2WvkFbk)UVSl^3XWp%=nB{-{~z99N*^*hiTR}oS3ak?!}o9jJz
z+{po$g}YUu?76g*`6=n|6>`4F!L#B~zp;8aZ&R~1={1}aPmpEC`AAd-OC_gFjr<uE
z!a$`$&KFvPYkZ=jIC0Jt)A6P%A+lfXm(}*c1SkPYrdq;@iRvI=yw6HC{Obuk$Usk!
z65^SR%KzdP?alu+AqICsFt$HA;=E|rWyan9pq3mg{L75D`T0%41_y#<ET)Ozxmetn
zS%#tg2{QBvf`6Q_{W~ETtk2-Y;8MG@dY#iRw33<Hp2bA%^efI5#R(DKYEs9R^3Krp
zk^!gIYnGN<PGg`pwS5Yq@>+H8m$>7ol)G0<61RUReTq3a6GEILw%dLkJs(E@%}(HW
zJNzcdh>ZEP+)v#8K*)68^#5W&Wf~i<^VnqNh-!?X^I|JbtL$^!q|M|6C?ZN-My^VT
z512^z3<TjYy*M48t?6&Oz9#F9eJ>cM2@*a`X!3-1(tyr@D{pUT+n22&bk6XmFSLeT
zW-5t~==HEFbw-@0N`ILUfjbfV2%U0)b$WsITuztra2ja;b;6bhqTfT<Z&73qai?1Q
zfwuo6VcVf{zr_>{d`Y%W!QS+>a)^}6YjA&pw27;w$L`n2sqN1fi&lBqUcd2v0v10J
zHxh=f!}csUKE=NzG);@D6}fD&7)7-Pv4hINKJS#I1J47(P0r)r2HpRAz?;WF2jXZs
zXl6+V5qp5@pzo$1a3Yl!SeHJJ<Op)&X^l^b0FU^IeV#|X!@MctU0uKrtCNUk_3c90
z=Gb|#IwnpyARB}Su+-*)FFzY_zF?#iUuMf1>glL2wD+3<Zx8+8F@mJP+bfX)mMD)*
zL;H9^C4z|&KjZlxpArEc@e>}P4g#zATr{^$AGYp0<$5}9RbCXYbNa7RRa)VOuk-;C
z27Hs1>zNiH0w}d?+NK-SW>}kprq(puJD&$cbQ;=6sLBWmBYws+B|aqrJmM$LDX1^X
z#Y#jLCWf`Z0dp08_2OMHhk-NgD^p>pol!6c#7vqwrl$lo2Z8CZwYRBhs#R99!>W}3
zxsyDf)ryzNXn8<Pw_fO>`~&b&L!QGisM?=z616y-SzulJ?Z*up#d^FtCqCJ1e!jqF
z*2=ABw;`~j90!unqT}HeYqM`4LOErkSfc7Mv6qPZY~@}xEowY2K#-ARw+Ln2&})zg
z)UMbFu7iQv-vqv~Lwu3k>qD)@eqYtGDNdM&x#E)eC+Ds}F^qk0=m1U^0lJRas%}uR
z&~IBw=qsv%Tv3cG0-*ZTpizw{*X#K^vQ>wOu9e@K4(I2q`gO!8tyYdmgnNCi*l8xS
zqqtZ?S0k2~I<c9o;&A@0=Vzo#Z>@YYqJpqoIE78FpmL40fUX%dN)gUsoOZjnRpglI
zqCh&tU4?a|Kwsrc)Cug98`SG+uA-P0<8-K-B0)Ceu8uVslnxs1(7Z==1ET7NdWlAl
zgMGL9&HL%X5go&47`FqQ>>K+1jkG7l!EK@e33rQu9N(xeG=jVV{`0W#(3z^sQ_8)e
z-Mkwl3UC%0BrGAUAyM!|fTAfrzfv~CM)MAy==jFhPvSaO4qIl$+=f_$`(czsBrK6@
zLo$M*Ukw&P2$#{yE^`W-L4VQoqCsOO48!H}=U!(!>>O{>>=aS0?0kZw02hQ*!3~{`
zp08H6(^uOmqzS9PBl;H$unyjasE$k7JVonZN`9D~hNT<dSPd4yT>@a+Y{IYUYHY}5
z9fC!<54(BvKDF!2jv1;y)noKn9Oen93aXtfcUX!62`@EBCP1+FP`}ZJ+M(vjof@bw
zH%s7JI8Tj*nQAX03^)`Y3r9>KH$*riJRA#%;Af%LVLvHC$5?iiiy80*Ytqf|GM<M!
zEJg4IbN3pUbiuO+D0iWzyf-y%I6C@GU5YyeUZ-(=_tkmo6aqeGGP;k`W=7@0K7UGn
zu>fvj)L&Stg~bN2IJ?zxP@wU4ziAx09z^iqc?kB{27zeOW{sGMKkgWy8zSWRP69L!
z-FF$UklQUB_Es@vn$^SGHNmnFAUVq6YIHvZDaD<P<Ae}d6VRvI*iO89--B-5t9Pom
z^bg64<ac`2G)=l;Cr%pYsa)Jdm?<93z$Hxzu?!L~AvaOE)5vj3opj28{5;-Y@`tYf
zapTn$|02x(<zlt&;hlI@r-P9cWb&h$M)ZC?PLIP~(hgH$#_1rZ33$G)pr8qG!M1~e
zil5NCxmU2(c*RzVmk%%p8cez8w6UX$o!Bg4ZS19b+88T`ev0zY^(7FTEkctQQFIos
z@X)qrws2=HFA*Jq`2|+Fi~O`$&#P34eE6&7aGBc31K6=TscY23U)@A0a0R-EWoxA%
zxKe$Ym*B1Pa-NT;m1d}0`aFO5JbU=zQZb8@ZoI@R#TuOQ`+!|z4pe^|hBL`UUW&VZ
zC9<B|hMpb=ZB)Vch)+}~I{&BaH7YW53x5LCZR$UDIM+LkCHW?Ckvp82inkY+$n$&-
zf7ns@SaOCT)~LAr{*q(yEtU@-QAANC23du&TtgRK<Thgs+^n2L5CMnG{#HF?UG!Ih
zuY_fzjz9elqZeYAvJRQgdgNR9@4*alO;_MYw(OBx5E9{UvP3pphac+<{eo)_-57Vo
z#<zxf?6#)jH&H=M;mveZ06&@j@@eoo8+Nbtyg?SrPWC4S@IO4pPD<ib4~Kss`x7VO
zO(ei`inf9d@Of4s7KxLRuC*M3!I*v@<}{gN#nfLShfEl-w2Tx6`c0Bf+xLa624QJ2
zVPF~Ub@e5_Mm1_L2Q=a`Rexz5ypFUOWrzcI(AMFi;wPxbuy?q`52!WDrceiM??3WG
z)<M{6T;#7&pWyBjd-x*Vi^Z`v($>Job|<3*kg~r2qzqm^V0t5ga;AfF1U$`W58smH
zk$uTd0-+=jaKI8UL1e??+#pu5MwWr=p&%9v@KV=$X}HAGiaX^Oa2qRV2zC`<uZavS
zfL5|*Y^Kg*tLOS<!^<)ZyEYjl#Kvo>kM;rSVOgZhRIjuls(~q`uEi~DFAaok9!`Ye
z2our7Z_5`pOR|^S-?K<zBWO_n*)!DLgWwonrjrXtj=ori9buk4Be&{uh)AQFqmJPn
z7DQ*nNO0lSGC(bhg8<=<67Q#63^n0!XY!~f8Jxhz@mz$b8PS0Ym}CkJi>H_ME-4Q@
zb~AiB7oA3AP*-jc-Ed}Kz?#&0K2DYJ5mRXCLQY-r5F03W9*Htud-zX5EgbOa{wYpz
z{HU!^hsh>2&MruYiTGk?T3{bHXb>-LfmbroWq)im4T2JuAol>@B3Dby=h(P-(Esef
z;!h;xQNEv~8)2!2Pk-YAJW);aPrA6ozDKul%SExtH5t6YJh_mq;9W3ukRkG#W7|QH
z3@WiU439x?q4&GMK@Ct^?;zCa@Zkhj2_7d%m(fNa>mG+xHvuHgW3;Y&^rBd&Pv{!?
zzEg_)K^}9y9-znu&d>E;c<9K_WF;|&pw>gYRUE)gJg3w#wni=0FV2JmR5`9AtRt<8
zo#tc5cr46M9EeS%Zy<lk8hR%1xknMCPNKDs?1hQG7nh|nWUt<DoJOy))p8&1n;c`d
z;Z4{)gUX;;CMZmfE&A9;lNAFl_4)x@AQ>JotD>@AJX-5vk|8Uxc3ub{iwxYlJ;qMR
zE$lO;2pCbQ{@7NB@#+>K3=)DDS!}_H|2HWkU^*!0z3goS;EQB<(16@k0+Di(VUNYi
zqi?YFq!7bD(PUO~`9MggM;Fr`C-fs(Bd~coy%QD(w=2jo35qy2*K!?sKm_KEWL4j}
zpyF1D+iCe~k(Hfwx)BFfB&;rW&A3MrScbcxBWB1)^A-L-ff$9eD=PWeJmqlQD`l}h
zp`%N5(`@oyaw6^(QO3AfrJO#h;ET;iAkai%4`g_uC}mmt0vIrQF`h}Q6K^m)&5Efc
zs=#9&c&TuJ8`u&W$}^MGe^(L=Me=ARo~6sRxOx&+%BuN@h16T{4nzJlJSG?(9h7^W
zj!E$rax&=(Nq6W+GH6HjT@cf?gT-{5kl*0r^)3wk3y>l_G;cA23FNU@s2uIVSiF9c
z6s<cKdYoy_A-_2HFF1hxV=|iV714w(<x%Rt8o3RZyQ#Nt>lXeZ`WG{EM9wtaDM2a-
zt7EjF-3l+Gi)^te(;e&wxd>l=URLTYe4ZvFx0AWggtF>we5q;T8lNp!vd!Y8IL}ea
zDM2$S_5#xo8a^Vg-ri%lla?@1f3E~ilMB@p;d*4_$R0`4Jcn!qt+|tmvC>aK0+CN-
zK;_1f;pN>)i*TvftE;f*I|es4hg;3KGP{#?$x4+kM%!H@25K0nUWWnB!0&4>tvKJg
zGkP(-B%pVoyUbp-B;iQsBvv!o=-+==Z3or0A-SR^|G)O$1U{?lI`r+?(@FDgu5Z<s
z_xd`}guZ)k8`tSe(j+%c6KANCwyE2s>CJ7quH&|O_Dk&7wC<3!NmD=w#3VpWLd>&~
zg_teo!62}igqaKiWCkJ27=%F#1_QqTwa+=<Bz>P`SqRm?{t~0_?7jBhYpuQZ+SA%=
zF~CdA0oxIf7Z*r9);&^tziSbdAv|PX>c`OwIMzv%DnoCM$<C=0t@>8?i0i$6WCl<7
zVokU|YzXh@`{okG=`)pF=_fiO^DHds&W@n#Qm1AR&t{=JL#X$AmaCXi!CC!E@Vhl3
zjwB!5V>mTLDMg8u`c31LAZb_kNb0@*L@h^JNBZt`P@lxy=7O&dZ&0mfaU9tMVs><o
znBMOnc5P{*VhjF=nrLN=FK%Y;bGj7Us^hNQRQk}|8!+dHzqrdkr!Tk<912U-6oOew
z^620gRsjTd9ExrpN8)1p=r*haumA}~bulthWyZRwM5D_OUl;@WrOE8V&FV=|r~!fh
zu}l9Fb2k0bWcIi-*diQvkB~yYZ10R5c1>0I_I_#!7rDcsxk?K;9<@?c!lC{tVjith
zXCkMosA_?JEe77hLtkjl0sM9+9AqHN4bG2i!iddLlSPjVQ#kfu{LHgt3CD>j;1i*P
z$I^wFa__qZSzcgE)th<;hEzh+Qa3ty&9nuR-A;8#LmOIu0iJ!6{AIlFl-%9W-AB8M
z1)}uPHbPWIqLEVG2;n(BQ{|>Z$Ns+GRgm?h^pBVN5y8v8+iEZx7V+~rBH<T#J0OYB
z^g?Ge-GgC-G_6ug%sKs+hr;10RaEJhqV!Ib_x}x7k;3umP;#j=O78tY;&xMn?oCeB
zuWEW@bTHEHc1!WD5+%#Hx`3KHV#HhA2J@yKZ1RA$$--%MXC&W)&SOO&Dq;w_^BRLo
zCL(60B<W2#9|ZG8@9X4Md&b}*irr<4<?rW;KHIFSRg<{Wk*t**%8G}mMt--sQDKw0
z#!=v?@LMB-f0eJD<kzxMs}8pFB(VtlqGt8WHQ{`7(RKlxr?ffkvmuw1ny?wq)ith0
zH>)GI#x;Ojh1%%Gx!7`(^}3u4=7SO|&cBqGx;fReTa%PuIb)jrGmjP<{cI1(4QI0w
z*wbcM^30e`e6wo7yHoNoj+3tTCGRy08J_E0nWua?Y)csev-Fqr7QD=)Q{mJ1JD{QK
zd_qx7=OIL;EpsWM8G$~Rl?gmd^8O-Dqdiu0eUE7@e5Yb`;AIc9pTFP9!NnlgX1^zY
zgpj?Aj~a4*yi-zl%FzF22Xu6uah%<kaoQv;%IGV@l$AQ!hxI+?e6r{h7j=`JiUalr
z+-OQf75Q3);`r|)h#^_7_qh%F4%amo@jG7;OvPVwbs)+>iq)HDMru}p64M?W;>UDE
zeAhY3m2@-D_^xT;=`8>6bpE!PTX^9c5%jNh|MxQ{KDNOaD1vPvnn{a|;7+EX;^+0e
zbY@|A6u)iz)hab!;~|hokw?P~LHvbANb<h5CY1B|DC?0<$}twD+=5W*T&3c-w<zfi
zfuvOjiH3=eVGCdYA(eK5tHne9QSV`HKX|f4q}J4OiWSKsy!1={QZ^3N=!Do}q%d{R
zDp-E^V>b<yBd{BS=r?`!cb!n!UCw}!;4bYxYs$QDiE6xxZIr_%EU*eAd^ef#uIdK)
zS)C!@U5;V(vx^rYiG=P7$~^Z(LO*w%gMc#Zl6Di@<}o?s*aa^m*?l?w1<cDqxv)3d
z&fOzfW8xPYYLNb7b2Jpw?&;<@o1N3{_jiM`Y&+wFx(&#11hp=VU|w~Hf*1fgSZNm)
zlkRdF{v~{#XRGkk{<;2d1_MqLLzfLQhtm;j=h@{!oZ)@SMa%np#8!l($s|Zuae$B|
z9P*h62P>*3lL&`oM86Ra`S1dQfe^<4ll0?lZgNm(D(qu5VFxMb{h@>xD>I`)@prmV
z&2!c2*H_~3bX3^Jo5Cps*@}L@g8iBty<Pz9v%7*k09|R5Ypwf-sv{i#d-OJ$$);Ef
zlBKQ|d+D0cKMtX(Vfld88E-higWImOcQ0t9&6w?;#+!j&#Q2a`&*#;f?hS(7)`Tym
zAJNnGnc(w-2>Psj(=BB}PD3(eFcj*mR6|CF#MK6y!zr%Lyln@g1s1wvq0jWaiwxw2
zT;?J;u?^vMaUUi&?lX~Dk8&k%+2^?}_+R_xi@Hqycw*U{#*phw4ENbAAfdF}KbXj1
zO5Yi<yzObh(sxlPRNQut)ew=WT7l|m)WAv^#it3GQ=(53mX7G^`fNBVyk-vD*=Q9>
zmlxOVDtJ3zxgDq;DJ8Q*-{lFf=BK)gUTxj5kNIwU%aox+>9#2TR=qo7{-8-W+Olw%
z6A_7i%f$GJqL1Y*%*AWE*gBIc1UnA*-NAsi_7WlTP+{xLWZZGC^v4Qqt`;*fvDUxb
zVGeX%=(}{K6mu;q%=hw2PS`}JRTB=TCOqbKy7VcFqG*ukg&Z%Qmm&8+-zAq50#9T@
z$y*$t)P&~~m(lt1AnKJscHTqv8^QlLZl5vzPq{OS=QJ$tB<)XqN}DRe;GtScN=@kD
zD%2@=R2TCAj6h6!rItd`(qf%jtH#6<w2inHavj=60CicHB<Y9!cE8g`F}#`Pn)MgM
zGpdB;P1O7(49FJQqxy?8^fN}#Scy^1TH~>1%9)O%1p$||HhHDa<D#w*$l*jTJ{$BB
zH<2)tC_>JABsXD4l+)%<Uvf*eV;v(%V2(trYruK0;5tQrQO>H9oIjQHHnmLTY;o5x
zW~ChQB;rU-==&<_iXu~_=(Vm8&W(^D;rq1)B>F$&dD#pX8^Z98l^!^wgadyZXSb=>
z^%ir-PKOZCUC}jkF)U5G5D5}&qs|*-cepdb+F+YmOH_8u=s~)pv`+cVY%Pq<Xr#?W
zjfisd^1&Gpq9{mns@N6g+!L|qm0+qzA_8RV6@FaKMgBNS;0q#{SGq#P-4kt$JR^3~
zqcRYM$w&2KJ0sb97#X`Y;n$<#|7+1Bi8icYGht-FreHn=T?e~HR}T$<FBN@3WE^2X
zqwd%gJx58Ifm=YvLqymp%pm{~8b^i3>{c~syyLiTEb;E5r@Ji-oIAEnjSA(L{7s-v
z$gv}P)UNc_T^}bjP|T6&I-Mdl>AF#@|1Q{9+_d16B5v%qBS0Y~%8BG|W7jCTCxeG6
z;0<1FwYXQ@cGn;=!kEhLxb!zY!IZ#I8qeX!9{)U1j@_cK_1^9_ozutxPXfio8%i*N
zOLEp*((~8G>LOjkBCh<UwwY#;tH;GyiQZ!u8!>c~W22<z1ZuX4V15~lrx$92$v@pj
zf|oq;>lVfsh8Bb4bTeN6y;O4C9kF|~-w%mEBw6b@EAkn#2U^&B=%M8kVjrpn$E0_z
zx<xz_UnG8_(4SFy+<EKm;BYO+M<9yi=I^VX<s&8|33e$&XPVT{)pkAjmgw1GbL9Os
zMOcjWT;7LA73|~TX^Flg$A|cx>n;3|^}!qg3V&-t5rnDkC$e5<IhRgfk6D<cg4#<y
zl;A9Epf70g@&A~-mdO0%&Tg2I+?A{k$*&2QbK)qWXln@9TW!i15i8Z_?y#KO8SrNe
z@9Z-|{h>`dD87W#nL>pn?q4n<Ie0PnBQzN<8NVTES!X06X=w`g@p?pzs)R{-GjiI_
z`NRT67$k=-hX}S@Z6*;eq0(k>fw??_*yFPE;{b=ykW**QCuag{-4grcJp1rLoYq{>
zmAFZ}pkKyvsDUe;hqiN$P3KGvi8!bRV%R>+K8K5k5<S9|xJNLBBQ~g1uoTZJ`HN5Y
zh3`+7WZ>l>lJf~+i##S%*(C`1ubK?9<#r{NyT?U&G0B+6=G2w**;fUR5hkp^6htz#
z*~|_1Nc`nI=?EmxlX7Uw`OGVKc{6e<$oT}7M8GH6ajMx?f*^)adD1~KivOAv>Oc+j
zRRLt)lirx<wqolw(UpYfcpEqgSJh9-TZueb5X?(~9H!-b_Eqs?T{KG%R%4l4X2}IS
z6HD^FOs?M9UF1-b^O;ws@@C{zkn_puS|m3I>?(I$e|H4hDM}cx4%qX-st`;GTz0@V
z;4r#QUo-enWSY$?^r?<ZoKO)wbj|Q#nj^3dC#t?Gp%`{ac!nqI%rmCW%~y3eis8^o
z9S%e~4`XdT#>N11u(*={<V|0k^n)%HfIpp1A$?V#c}WrVY8_4$fA0fp<k*s5`*_N|
z!Qz@IrL<nKQSLBx%}kNgfZE;`b*@n&R7I<vHaG2IeHho=63%@vQhq2H%o0EzgLVWp
zN{<X@;PC>)F=fdaL^+>*RhHQoMWjtO{r|ebT*iK7C{KP`{eK7b1Oj#W!yqR9Ot=bD
zVj2_Q+*3On$bD5%8OUR}UAW14`@@gP*nMEAoxlkXvt>0-wr25^tJPGw4_q<7La4%M
z#>K=jyG&f5H3hy+r=XDxf`#RXLe6JiC7m}Tr-Gc%)XG#AZ?cFxivPn@pl<q62(1bC
z@bDnX>*@louL`kOC@(1?Y+3k%Nm=~lNvBu17|UT>&Szg0S*BSrfD%%rf48`2^#lxJ
z=3_ZJmJkCYgV*dMvNC)L|3QziK*W-#&O`5UbvOcB6CAOtbr#e=!ww!J=Fp$>nO7F`
zX5>_m^U1YPq)x^VN^Wql*|z96@l<wE@71kDWVk@!tu5iDV2cmd-4W!i47i(OSWb9K
zUct86I^Dm>7I9<HU)1)0S)hjo6S*{QWAf?$O3<u^>1o7x^j0k3zKHB81X4_8R++uF
zT}2#7919PJi|oNrJdiF8&V&`Zj;Bd%64-`k=GC$uY8HH+ZI2J;*stnlg6nQ@7u`8F
z%;LGmx83F*{H-?k3a7OvaSOn0A7_KvpnI^y1j%-Qxio`nT{zc{QA5<h@PTt&KJ_2x
z>hwzHSDANn^R~NHa%M20J+eK<JoJ%A{U-7Ke*URu_t9f+nVE<cWgV`_<XSVGTN);L
zX9O!;CgzgY8!TjFU9D==dT!H3xI3!NKD?FAt_iogwLGi8ZZ?B?iC!B#uv0&9jb4=R
zd6<Mtr^N-f#o%uMyodXgH0T+<UDgXV?Mdq~hU4!pVJR2KOH3V>6lF|vFY}iO*Q5;N
zr0dzxpLg;!wiDoLk!GwB??qRjy{@_sUJqng*Ra+a9QLoVFPl4tqp5I)^@pMG&BMqE
zRC@?H6~#O^7x^AzHi|4Bxmy^$N4bd@%EDc&zU~lLV`E@WguB?-F{D{)7KD61F?!|o
z(xLcJf1-L;6Ko@x!&2;67~N(PsYB0?zNt<&6cNl^Tp!OQkjXqd!!_bLslrM*v=hhK
z0#!{t-^&CTCg-#M79^=6Pcz80G;vw|`cW-4?Zy`Htj9{)los36v2ccem|mR*n-QJ`
z(eFwA6*WU7en@-^+DUu8MAjFJ9(>kQQR1nJevb)XH_@*dIBu!s_cqVPDD4`T1=q}g
zvB6BUnMWc;+_^mqjY$P`ODNw-(Zfs*^8F^W&44+~aK~kXgFnBnaJ`qfz+{p1X+rmQ
zoZxuRDgI7;qM8vCCFv4@H@On*8{O#d%p;)`DIIPW1V@Nv@zeWso03rzj{+Qc2%R%<
zxwOq>0Z9KzxAZCD{L7-p1l_dQ$uAMVL_Fp9v^ama9j4zGfi`gxGa!L2@%i((iIJ3<
zNMV#yZI-dPDk1_()P_i?<h+R|y+~fA=J}jHkM#0;R{JX7G*aPWE_a^Qb3i7uG8nkG
zPsugfJtoc;yGMogNKwr|Hs%l^r;~i>;k{TN8mCM$(?X$0(7zqbvun`0(~$0Y_H`qF
z*YNiMUae%3i6G}^z%52_GNGWas!s|0e=quG)L(Bfx6xz!^iZ=fkRd$7OYd2<>Kqnh
zXL+9}vOm)t3+L$i3<WL|-b}MYEx=Dro!8IIZ(lC@qEuVmai!<=4g$ix$-Eg=mZ<X0
zTnq1(b4{w*<CR07k_FDdBVN(%$rOAHv&pgE30x}6Prb*&%|gKAvi$khIejWj|KO#O
zB<u;~DG%m2=d^hwotuJZcSFIoI1xF8@|+Hs+^R7&QmG}@r_oG_w^qC5<J&EBD_F3}
zQT8o6Ud3P3ddo_C?9Xml|7@rLG=x4i8oRbfx4RmAf;ZS@u9)qNw4Xl<H2zhVN(JhD
z$5<S)x7ADL7VV2~g6G^a_y1m1h!->DA^WzHj7H~^w+Xi~5$H(-*zmXV#(%$)ks(WV
zv4LO4^=3_Y3+uimtT>y(I=7Mkyaf!~t+$o1ygkGVvJU%6k7CCbdb>N|ga_=}-CA|Q
z?F%1;IS5XYfw4Zx=UETYd~wfm2T7QYjeiNe$Q2UV-D48eE(0VOD?QmoSPXoo+IcyB
zG{IsUFMH%hJbuDUujB=h_q)6k?MaM&yXd!Sctd>4e&(EshRt&BmERytU6UTiaFQ$k
zx#}5Ljty>uEjHWTdH;g$vU*>!DZ=$!C#BbPSoQ-D!n5k0B!roIhkKv~y)n=JLL~X3
zSW@qN>3^SpJEdikEN~%)Vo&12NZh2vR6@p|U{Pav`@2aApDWaSwmKzPrim3rDmsn8
zC+aT?`WOF03<a9aK2YF4F1LFK&LO(^jO8x}^FJt4W5PNW=X`va_6ZkpNPk(~G#}fp
z28{HMDt|Cj*C{C^ATxCYFvmvuJk!jr`U^#$9}&(}qXM5XMV&AdZJ%=0wND$b4qIYR
zvG*Af&Zo^(;fxO{m+=`Dflf|)IzZ+w(ur`~vfRJ9kH>_5{HmMcX3D;pqp&zjXh@}l
zB~KT77fZJ2XUr%Z4xCdHvF@8g)T}Lbtnnzz+np#gN<1U>i*3D);X_4V9_Qu~qx1|x
zB}?(+S;qm#$N%g<&eQ+rp<n_5&~9?F91GdUCt-1NLa;C8$H#y5yt+zUfhn%mi0OK|
znhB<(O1uz9HJp-uq4=b5mP}jNV)t&hAeSfI9OubO{WxdJf|ogGTI<HE;|#j0P}V|c
z>=}E`yvWJ$cCO2P6h1s<^e(zA{7a*O4%_CqizYLQp*(v`0v(oyUgC2>Qh^Rp;Ju4E
zYs5r$D*dZ+F9elx6vn|_@8W{pSAt9OcYI3!)}eOApv>dv{}~@?UC97jUTgF&wv5XR
zU6H9mo)FQ@lXsP6>}Tidr^Yg6mUA>IL4^|SB6U2mM`eBr_%Nbij%NV@k*scemq-}y
zyW%P?H%6IF+JF4&RVS|C&e$aNj3wz_^Z_fa4Uz6E4L_dNf}#USC=I<TWPXtVl9R$w
zyf5Bl2AsvuxeqhR1@wmC462f%UZOfIw-nzqo6J8)WgwC(<=*WBR$<9-kbq+&?GKLW
zw@km|sw_M#62xrkvEPWL%MY&TMvl8B9aMXL&gZBvb0B1lflYdpf72q_iGWKQSYn6X
zyA0*lB@dR7q@2a}M6Sj%aZTrd@tWSon0tWKEO^kq?4GE1FYDWGBB6iZ4&Jt}Mq2VW
z2Ncl(X9&R80mK>mn*%_7PH&^mGVoBeoMI(-+pRSJu|kb9FIgO(uuDDUm)k!5U!zoT
z+}GPUeyZp<nYaBQ<L{^lT|bkL3O7VLkFQBMCwO8~xH`CK?jNbQsrMIg08YA}(MLf@
z^4kN>2oo?U+R)n+VJDMP*9q!#czn2t0}Fg=iTn9|_?s%X8)QAs{#c+r1s?e}m(B(K
z3I6#=bI`vz_{Fz15hMI1{pa7-OT(gRLD3X8QIa*)d}*ILr*?)f*tvFvo)8i>HXOp6
z>MAa)D#D8JzFH%hQQ~-3rM^T3H|9|i5I0yX4GsE@c1t8Oh5hjb<A3iDX4#7HW8CE8
z$<FN$N_3@;e$NX=yZPpAJ>Q&X7Z|s)E_lQGaz%e%^z`Q^>2rj6NKpE#rM&L02uIjj
zvpf8&ics+2?I8JljIcNKzNqNZur$I$+TI)%Z2F>-qH9djDjVO9xrJkecD$0NM{*1*
zoEq;cO$6X?R~bAp_7RXrx6*vx`;TDznYW#P?-c~1%e}&GBcoR$`E3jCm<i!-vzSNH
zLtMZ8Y`SFmNq2}S9k5Z}U-=A%$Yvi#x#Ld%_s)1Ho$-87v?-WM#J{&~^snfFiZEhr
zwffVk!AiYczu`VtYU=H1*KCgvqw;i6<9^tx?x?-`O}kFrztkMEPyW}XSX6FxCxU0q
zUj5{QOU<tEn8Ky)QnN0+jFYv2_H=O3T{g#6tA4Q5JlSGS<1DjEmFpMqF!+yqa27n$
zod{R)(dMS8KOG*n66`ZV>VP^$_ITWRsi*FMKq+=6t*kTa?KFNDVPW!Y77<HPf1kgo
zU(lfal6@ygpTKc#4$3cuJ&iCD%slY#>ZH*8(q(mm-Ap@mvKwWRsY-Z67^{*fC#6WH
z{ChX_&|J$gX-Pbpo(x9lpTSKXn*4fD8?6#L$P>@TCFb)diB<4d5!?vkf<)hpkV`)1
z(7)^WyeqISj}TV=P3Cvj1WmyqwbYEntEXH{;*_w-ydEc(=|^DsoquO}4~+(vk{7ki
zPW5)XTd2J4q<msI$+9NN+T$`Z;6Dx`m=s2YgSgL{!`iz^%dPTKZe8Lpj3bt)p+WyS
z`hOp*n)Gho79R}fgd5FnB3p6t$-h^f{3~W3%Ty-ZX`uEp?d)Y2iv>&JcG#jwJJN2G
zzNO1mr7ktc)Vg4x#kmUOcA3YieI7*Mnxk;#?3z#6n2g=J+%Dr5Noai`dhiYFPFat8
zPNw$|Uw}E(yN-L|1o7p;?qHMqjqSGCi@aQ<OLl~LMrN6u-Awb6U!Za>C!U&T=dhEL
z`X7s25ymOYRQz3_{9hD(`+;%cEKCD`yg<F}exoYL`Fz<`;rU-UUTL2RHgfRZq;o)W
zKIJ@cu`AOjv4w9os_0uqe{zZ|opcM?UkzAmO7)B5%CmE`zoM$Q*s|aaIWyuyqHvcY
z5eeG`?^ke6J&;?>iuk}R;<@CU)T#8sH6np98_Snhv4)Xn!cF>3_tXCp$+<{iN4X;3
zpc~zV7U&F?1G%ggQwuQz%wmxwc8caOCODCc1kFnOQYZtHI0T^Cac-m78S@aKaOL>P
zO1OHBm+<p=-BOP)8R6jHwyGOW&YvRIcAQ<fc5d=d+b^ub%5{diM5w-~sS1?O<DzZ;
z5amPtSs>EbPMc&y!tKsT=q-gsDEB#fx9%^UE^;OxmG(04*yCT^UPpOn&6#i}W&u&I
z^f2d9zU)$!ucYL(D+l>YIwSvXsX9i-R*aJunf@Ym&oLDYQJ)?P<zE+fHylyditf+O
z5hpj}Iz#x~syQaNp@BrSzKXU11>vX+2J!1s3Vu1spcFYmE-+YoUbk?YA~S&uT0vH1
zfW=UfR2q-~Vz|91Jb-#mi)7T)K+r#7njqD2GN|$1rZ8%ES95?@qL&2K8)}R9;EVc9
zEBZJQWVvuCjBIb|2+$rvwDk)0;YcoHb0v@~L9fM$VxYuDPGOAi*09dSFm@l#wR;AJ
zi3jn2>IBJmJCt!tQjIH)fp(e}7bVGW_%pII{`CBi%|IXrnNG(-#wbeGRWi7`G1;@G
z{;()rnd?RHQy*K1<}_c)nmd)$K|Y+j_fvi}a7&pWYeHG3ePMZ6%+G_S9<@^&CQFJ4
z;H1vUhJ;m}b^g5?&ck$VSmC5!GX_hPm_qxnC#s94jvI-GcljX8|8UW459K%S$hPVw
zYz`id@*C_y_uF6g|6VjlgP}x~8Bi^yM07ZDN&#=jmC|p2ng0ZA3f^;K7!*j}#@LTP
zd>y9q!azM-7mni{HphX?N~zQXdYqjlYs8hF+j(p1ZM4^GP+8|HxRetv3NuhM>-9fG
zY1_qO8LXrIW#7P>&T7D)Chq@g!bR!|{lC`!RfPU-Jv@5w&vHs&Fk;Ps*dDHTaWKr2
zeW(|(VA-#|-0(QpE>z<EX&wI!O%fNHr54}9>Lc<-Q$P<uc`l@+r2y%%oqdQx43icq
z5wGaqr8fF2gbvkf<p!1cWs%xWXKjZt`8S;hExbD`H2QjV%ph3|0|xn2dxP7Ioo0kv
z=w2k&-wljrL|6U80Uc#E8OeA<hEFu5^^M`f!Wcxxvi*)1BOFNmgM22-kiIn5F$@IR
zA8obK_<k{{3kOu%1?rD?npwO}mVYDZ`G+5kcH2Xrzb&2nrdU-)!7};=^I2!E!)kp@
zhzLa_RhwM|0%$Z67&JQ3+N$S<WNr^Lv!G+HcN|@&>THX-VjJ;}aa~IYqRG7OsBvNq
z66I|mT4O4o&Yf%|#lxW5^OnaLBb_&!xBazjH_s4$ab2)i^?NmF)Xka`5Db2$!P%}g
z&fXNHGC`8SK!qAfAt?x^$YyX$ovH6aHLxFz(0u4wj=j&Z>p#K2AjZ&}Y;qDo=to_{
zr<+V;Fr}F$lP8u~LP|7iVzyF<ly}bzd|joRkNnO{*wGWJ#r)?<Mph)Zd2C*Z10xcS
z>4zrcn?kH^1jXBgXsfiZs4T!2Yy$QU`m&q6!$K@Ueyn}qRn}(>oG%I!Va#MiI6D=D
zIPAE){NzMAL1{Yo=Z*T|3bdpTEat`Qip@y&k;SHV5v6YOh$FoOp++4IN*VTNSlm|y
z&7N5dh-5(4xQq<=HM5Jzb$c)}u}A1lb<M=FZq#q#T%^T~VfA~^$iFhNPv)fas%oDH
zf;?1ZKK<5i`xD;u;0m%Ci5;sZyQBCe!&iV3E5eR)cY1X<$Sw~D5vArRa@=75b1XR>
zq;|Ir$g9V(=pc8H7S;z1ZkTDMrRTz<L44GJHp~Yh=MJy;ZTipz%fn{9m?uAz@pSyT
z27H9xP)FUfjK#4WA;%uiu=gwo7P~*gg1ozoX25sQZ5^j}w+)sOmw0^Cz|GWh44b7x
zkGhcrqmm9C=gOkU#?*dEEkLl+5aU&xFWxwCz0_R<Iwq&%)b6%{_m@g52j!D&z5A^6
zS|u*kYr<`2WH^r?3-Z;9U&MO1BOK+*Sdy37T?S7}%p_ebc#B9-bA2J$QQx=w9DN?W
zXxkXP604Mopjnr?$7Q*Y&f4i-3`m5ai+!6Q0w-Q!fR06we@fo-o*`^3y-NtugLv{4
ziH;Pf=tB0%DcDAwm}kT7loMVE=EA4D!q&0qcAVPXHZVe29v%rqBOT$!r$UKDuctRF
zS@}JSQ>kIBROj=$;{|eO$w9xo2+3DuChQsJ7V9(Isz&4==-cEoeWs-}>e@{IaOu3A
zJama7MfQCm<`hFF&4aj$ZJ=-2&_#k<Y3I9d)c8If;jc@WpAx{?vhV8{41z~0*_YfT
z=FrpA!Z)xjZ`6Cj8No`mkQ=I{-jTM?oDoXa;V_jUv0*4sY%0~;I&b+V!iv=ERlIwV
z6POuc26%3b5$IvRPs&@LSd4Ux4`cQw{z+C^!K%?-(TCIuUZi9Z!%&J~W`w70l%J+3
z8qx0!W<Y2?5n;bk5@z-4u~1TFlkmKeyrc_`h0lv=!<hGqEU;h^A?Zk<GX#<=3V}+P
zkVtkShcKl0y}}UgK-=&QcraM(4rdSa%VwUOA~LK5;EE+XVaR2(Po}wZ!FxnQaH${?
zaT>FhQhon+HN?BzMir1SH+sHX_g?96V(N%&;{y|aL2u{-YD}!y>+pJ8p$@qRQI)Zd
z-)AR=$L(Je&$Ka|9XuxRZ|kGp79^=-M%d=He?4dEh04w#^3HonkMcZ2CX8y8sFUY{
z)4VTAPb(`~Lo!QpB`a|98}jjA`QDgD@JTT(Y}DeLLjFP;+w%7YX()rNsqv%{Pq-=F
zcT&WdGZqek*YY@Oxoyx(d^bm5ExL&PM3Ua<zWl&(^T1_{-y%Q~j_G~6ln7QYaME7H
zF@R*XXfnP!oEKa1?<}B#O%<!>v2d(3)AUte{Fa@h1f}ue620EMiKXilCn0u<xN+_X
zwxt~;^x<(bf1_+4R^fZBg$57WM)!jyx|RDgL466Q?9%pReofO2dbOVK-jK@#Zj;hQ
zekr>^OBOixdih&sUak$w!$!9aw_de0`eKkU_MBPo-wbw?-=ZZKvhEZj>yt&FxXPoO
z7FEIn#3gzX?|YIyn-?s%LepY+x{bU>*Jf~ca)>AJvdM2>O!~7>q5LGWcoz34za?zk
z7i<d_;^lX{*+KL_p?Zv};>JJ_liI!H(XGBfi~epQ*cPFm6<+?9dr@q8B0miA5JtAb
z=(TPVF2laOnus1F5UHOT<psFWk1k=juwJ^P(VezsKJ@J{q%SFZ(E5_wq@1Kif|y$h
z>Sw6})ZaUy{@tRl3=QIeB$70<gTW-!-_*z1*gfcZGmXowYTZu+@Tfh`?6M9o(nWYE
zmzo$~x%EV2EM3c&S{R>k6%&+HutntKNtv!1Y-PACtn?9=Qop%^kyLpRfwwgI`AA+^
zt`h`cS-8Vgd)olHV8~9Pt-s4#{++ai*^<<JT}$LxId%j`jw?8bN+;uPDYm#E7+Oyd
z`2Q4rR6MRr3*HM|xDD6i)p+aqWO2AIxT)&hL=FQ_hxKl^{dRG<*%a~gxvpdQT|ql&
znDb1}Ac`{yLGqxj_CDe`{y%6XO!_)~!yQ(Y;bnK(y{%peeqLNwkJ112JCUl6%1q|!
zs2;8s00vX;YI=gDXfbJZhh7L;%fbUj{{6cAb6xkBKXdgMT`f~dmmxuJe9s`qrcqE3
z5nC2c*Bfz`#sERs#C2M7L?n(jJBI?PzvvN$;jPiL#eM6FEz10$g{OO@1?;1x1>Bl>
zUyHSg<2u$y+39jAb2gA$sTVmftO;ApB(=*ecFV#w^4f-2adPF<K5rY`6HB^=@S^^;
z(`pS)PZqmcwb>2i>R>vKD(P*OlsVbkxMGbnyVoL%h*fNKCSk4KV$P{C?gFkGciRi<
zik@pO`0KIE{7G(`zM!5DE{H>)Zj;Ha*ApfBgR9(^w*{qP|B>N2nqL;)@J%l@!@QZo
z#o*gtZVECow`rf%Z8}#6EvEk}LLh8*A00@Lf;a6%y*il2K*Cy;js5E2L~zB%SyPx2
zBm**8Cv>k(PL~GJjr|APZECR_q6UU9;0FH^p*(+WMksaW<h~qa<h7TOPNfIE+W&@^
zn`Pm^aG*ZthUgP|Dv=_7I75$7D|w4mhJ(q5aE!R;WU(DXFVBXZMc_k$j6Bpdb(eY$
z8jlBc!6YT|Lw9qn{XAas7jsio%D9LxH{tp#9%7rGu1}?MAMQTGw}fK?A+{lG46pFi
zNjP!Ny+Mc<8FrF8i`_<)w>-|FkGZ4hULV87F~K3X7!iJAEq6R~@v}LJyOZhWWH8RH
z#W@?S=8|YkFekjA1Oj@K>|xz)mHl=DoE%TEgd?uf9fQzG44`W`S=)~{s@GU<mrD3M
zv~Yg7g+yf#D9E3vx=B7;nHPf@JlegXMqvB+{#Vg<=hQgYq3Ifj?FE1nW47*NQtvLQ
zv$~ZaTBlKEHQ}USh;A|a-E_QhN6PnaP6ys=2fbGBhT{~VW6*8-Z@vExHh$fc3asx(
zIMMty;eI6JI6lZ_*;nDRQo2_+1{+(#Sj62G!x&DayxGM;LzpMFgkH`Q01<V`_HjeX
zy4%~mKRvMxm20;O%#C29t0M-^YBg9(+751@MX_vlzfcqI48JNNT5AzKS@E)aJLqx?
zonvFQO?&WNtd8d~bw)RIBf86vdoYjTp610sgj)<o#L=Q?lR@sMl8@=;Rp?4B!`>M<
zngD03-4n~+p6rmt7t!Sv%&ccv#81`buwpAapNCrUC?Yq`9c51?oYGb?*{tnupWlON
z?JGsUQxQ&xRuVGS=jnB<B?cK;EnGA&o8du&JrR^65J!XEge_xZ<MxJC;R5%Q)pj~p
zcw_WwIrAc@$2a_Pq??so5C?~oyUVzHGgD%&veTXkzp>R-x!ahil(75Tf>)XK8r#>5
zW%+6zsoV@2)j;)@^X4jyoK(SQ!l5}uwy|=I3d~jl4r2&$*u9a{cji#=&$nC<+VbT=
zJQm%YrOj8v^{${!jrPZu8DHq*?e_5_=Cd2a8YS^PhwEDGz#`aH?xSo4B&f<Rani*6
zw%yjUF3E))?>_qN_j!;)O|dkRYA>77Zk0>_y2MFosh;l22?bX!-UFdWa-a79M7ayG
z-H<%!AsSDiMtYGRP6y|?k-E(N=S}QYim^*sYx`ZsJwcPYVjiDH{D$GWj+bP$yo$}_
z=_xIHVcs~u<I>}uFAEnY^%*WaT=X^Z@V`=x3O5q2Vh=BcQ%tzQi`<9{Pu9}AnN0X-
z#3&CsTMu#L-QRC_M{Ut(i$2qN1;|@Q@dY|A3}1NL(?_HOLEMF8%g`CkPU8*|zX3WW
zwpJ@*A$g@l+&#?}OwNjOVPBv`dq^n6!DAnxu;6&!9Fzw!bxioV<2juRMVI>wMZa0}
z@eJX6T!wEu!JTa8sztbXJP|xTRQ>L!PXt9Avlc8ho>v-CnGvWpN<cG_vHMmpicVe}
zObLHbXV-9`x(eH=a?TDfDHbeB7VfOBq!-60P&}v0g@LZ2eMT>RzUa4y>P$@(>*JdQ
zye@T}sv^<PT`1q7CV~%7%43jz_dUIZrJvkH@Uy`?X?ps;`>wht?u(-l@c8BF`znLf
zcSnT;rr&+T-Gl0{XDM9J$|bLSf60H+*5CA8TXLs-Be?Hbw&zzYNTZv0<wDY*rxIwe
z+<Rp08R`(Lr`Lw}$$zs#?x0Jx{9NaX^$FusU$sSS=F%`<?EnIthy&UY^91{M%yCXb
zF7dpt0S`X??rY*S{Zmzh5USNrN0z1wnc`$bV3O1htW`gKhPzM?09HTgIixtLI;~!Z
zCs*v#_dR{zS@raN+s%CwERUqQT*}D$6Q40vb_6(U=rN{nN7L`VY3>#-st&7V>W6!R
z!)*7f4PJo4vhb1DQHoo+``sA6NNk@WVVgVUiikUsl&KEdmsp$w55`aT9KzhK^}A2b
zRHs^8d=owQ=}4OU-S;wq1mXmm{L7wek{hP`w(6(1V}&M<^W^tQ>4)e(Z-^_k&%2vO
zvaUzJ7|ThjTv^gtQHH;?OmZ^dxpm*qA|k3M_Z@ILJ@pn?3>x<9sLovQBsB#LqJxxN
z$s`qJH2h8x{Z7$eN-c9Z2wCd?lSj?zl&3O3(#bX9boaWhH(z^vmit;w_?D~0o9Neu
zIyTg1q54``C@anBKK$!EyTBHGz330G=d_W0(?aqy`P*sjEB{UP6|Q!Armrw-{@M}q
zf<A?TbpHp(=-12}DH&U8qx7$Tjhh(G2_DG?i)1Jh2qF4z58;LGe%^_2j3!J=P584i
z^F7bVi9c!S`#sbW=ERW@E)2)9sF@x7?6=N2d3G+MQ_Z6xQocuf+zRvz%b7Z+n&+{A
zC%_?AoTav0y>4%s->V7#`F`<IAoqy^KwMXKJ)OBMh+P<*_mBH_xcSUW*Yq8@b6d$V
zc1{W%7Nu<UP}kKz-d4Na>EIggC`REL*Ppm^Tqi*FRw~K@X>^Z&yMtQWw}WkwR3ZP}
z#0IFEhbg1N8D<&pC;y|MRv+#NMunwr7N??{vGLz*U)2&ODqZMcZjqlm?`p%V=8~KU
z62iHCo9$D2i(01JYkG$h<g4|`V6(pM7s$*vN%8_6CxSfpSM5=4pVC{%v#foA{y!OP
zg@pO6@K@`aU}LzNQyu9c`M1f+zl-^okOQIouG7nOotBMGcG*pol9J~sw+u*`{<r#?
zq7smgv%&VnwomCT@=+l&Vtn_M`n7b%C+NP?x6tJ|QzBC$YERXKjl@qK#p<fb9$;H}
zQx(JVV!6qLg9+#YodviIfCvZzvFvTn{q`xn)gSW8C%mSwn5o<lc>RGp#PUEo<^JpH
z@kd^_)$)><lgDhZb-5sr#&fRrgtSlTEz-bwuDPbyaO_{h3Yl=AiN@Hf|K^`$*vJl|
z1CRw=l|%p##Uso1B(zWIEuy%#7Al_FtoO1F_(~;VRd1_#!38~p$KOZH6dy`Z?(+re
zZ&NU1^aUITJ})O9#DBpIXt3RnC$jHv^)^B25AksmrBAZWT+>FLRp#3<#D`eT;;=+t
zW(7FL-`l4EFXLxr0RZ(#N}DTCJM5mO_uH-Z`!(SeRfPpll^PrpCmgG?&F*<Cv+jP=
zVYYwozo!uD7-qJr`PkIW4S#?olKs9k^`^ZBIW=J&;`+RaoHVorW4R5I4J5~Y19iQ7
zi7QXw_nU0!+b#{6pJN=Z!9_6<`tW``46~U1D2S9Z4K|H&?&NTo+mE}^B#WM?Ekq6-
zUGHKRKW{$#Lpo~+YjdP{7UGQcoA*D!?p>fZ>aF&9vzG(l4q)=*&dLMqq>&Dd5}0Sd
ze*}u!dDOwZQT|FXwefv$+kO8H(AsZjV=wf>ZQOi}v=6ohQDu=_p;-KL#Fv=p3IM+$
z2449a#7--ES?*~W!d1WzM}(ibqS|5}ah<WicAQ5iR28BH^<VFN(PA}C9|~Gkx#N1w
zwW$U4o?Nvz;wU3+H<1_gjsxu51&H9_C+_UQ;T|(su3=dIMm;MjBjp|q$De4P*MpD!
z`aZQA7Z2ilTo&c$gE#@BXY7Wu0iM+*u3Y~YF?G#=lhpa%@**2Lw>tW#MG43ymu^!|
zkEgpKb_@DolPV9sKGVn<QHwesd^&<E)0>Iblm!9)HC@0T6_AZlS@7i&-Ar5yJUk(h
z88nEWw`TQ57pOo4vMW6iE-|G91BcBpEThhJ2KYw)bh1n4GN{uI=@fv?&mH@+XL6dw
z;=fK(Gf)Ge*Sf&K9u@#@#-HV_!w1I@s!M*XQu1r2S*=UL2P<`)H(ytU*9jbWDOeru
zv{m7FewXsp-*XtvEMPwuRd7W`#eXL%{BxW2U@gV!?PMO+MMWTWK^I89E3$$)D?R?y
z2wRSA)ayYx7mGJ7L&cAur{;y3iQtLr@=kmB-2)&a*<x53miwdO4EdNXDuP3aPFw3?
z34t--)~NR>(MQASc}A7jN|IKl@Aucnb^a*y$3w%hc*v9!d47%$WyZhleq0j{4Oa%6
zRT-}5h`W{Hkt-{+2J4;JSr;dD?dsz8sNNkhe{{kSvs67Q4b_B0nBXt!y#(2*?s%5t
zp3s+iMNwuvXASL3B=&dkcgfu+gGuMdr|^n8G+e_3b41Tz-O^wWgs0dD_WRLh^MaBU
zm_L7GL6rkKUZnxwmKSKqXGgs1NxmbTgTo(Bfa{f3m_EaMvc%9Yl{%ioh{&Lf)#u$t
zha=ZT955G0C`D2r9DLQ>c5k_Ao>}}+9gBbdK~9<9GJvJ~$E%J2;pFnWk2=^Oy?4yO
z@DRsf-;ajGivg(CYLD+9_5U<`nLw;pI|F=87W-4~KF%z0+gNoUF^tFEw%i?I(EY*2
z@F|#^KMU0GCw8|b0af0nete5Z$<GpHd9(Wd#%QgEz_v>l|3c9Qwj!9od0w??H4Qep
z?4M0%;MPy^#g^e2PSPc(Rtsd_9TI!6XPlI&)w6@F4H62vU>it*<j)CO&2yBO-}_Ae
z=Txzs6~4&7i(Kq_ksa=AmRS+l?4TWx_rUm)pAiZ+hzj)i43fQ&TJNgO!I;Pvwp3Z}
z9@%ls4#ulAoRF9a^`?^<s9<}n6)S?NFj<J3Y7$mA^Zu$tzbLLeS+LCklYLMZF+QC~
zKfT;JNhnc4A*p&87iGuY5kk7R--389My+%J<~JXm5yWsLG6n6O4$g)(G3&;`#?8pb
zSwh-xAikzJv>s+=6Q4<7gl%bv*ozmgN;_++Hv|yX9f|lu!$YA;_R8!=1Z7fY$KHEx
zbdGFq3l<h(V(A`@%%tz5p5MUhgGeIsj#v)F&(lAVD5OhCO6K@Q06B>0te<*a0QUv6
zV-oWch~7Ja&$VoI1UWb%?~I(@5IfeT_j|n%51^E(HY?2gQ3rm^B#Dt4;EHORc}+b~
zj<R@-r&_Y^tTyRShFle|KBf@^@io<i#+ihN=hs+aM(&zqNEXcRtbW!SZK}-8)i3Gi
z^zZQ0FWk=?7w;t!yTk*UP@8JJkxOvG&T`h;rk-(Gpm>c0uu-SMAZ%M8Rv!fk<LE~6
zU(*kKSBQGelXWy$VorH0|4y<ys~sgj%`}<wb`obz1A_;qB^+MoPKNOVCEr9o7<uY9
zL3K(6=G!&2aLEkB<n<*zLqGBR>zD*;LVB=5J@DO#p>OD^@?-@PPjWZ1p7q6aw?Nf-
zQ~t~9eZ{8e3q_w#*K?xtT4r%zms!ULI>i*-FgScZcu9}vKjHj-BCFSg!}JqBTgN5N
zB$eihz`ce*RGVBF;mV7h_bm~0q=l74JCk!oSynfMuc~UkaM^%S%rU)-v)Nt2P23RI
zsv*H`46Sj(%k@yT=}M`2t|ThanH*puw}Yee65MZ<`rv8lFG$(lIVo&2rqQ`{=WA*;
z&x)s;vM@FH81JdfOPLv+p~Vs7G_w?&gr!DZ;3e=b;t5=GYtR8-7i<3X=Nxz1U(9SY
zIbauTHW1XX`0K3Q&a_2m`JL5|lAVUj;Qe7a8^1)A?AK#qT#ZdBHJOcBaIDeo;U>FG
zD2T!wx3fk&Q5BtJcUC(xIgN2J)$MZA6oN2_;XX;73{839zg9BNry<nK!>Qq5|0Exk
z+JzGTVS4;jzpZl$|LtfQCg^Eqn%kkLxuv*(ZD!Ac7bTWnQR+IL;n&Oa;?tcI-FK7-
zYk5&;C&S+njk!Wsh9~rZ*!?{!pxR{TB%bg$cTVHo(Jlp5{poOo8fg#nid0^tcdY79
zhre`KUP|CIzO&)cna1cWzq9&T)(P(~=u`T(nJ+iFsPt;I;VJzrFP%YhV&_P9q5?X}
z?hHkY@gnIKYq#hZXz|LVvx5J2hBdu7Uwv%8!df8snPx6*&**dNSu1mr^p0F>)TrfA
zW+ho`2t-mXhj#}%@0`9f&RL}=vi8U}!+M1<=CZGd#BE9tr9jo<&Z)XPBby_cY38X|
z-Asb_JM<>IOfG@)=78=<9{{CIuXCqtNmy#|c*7u)@0rmT$6Pa6EwAH6aj6*<Ug2h>
z4f`vZr_pceteIgt1D#%=MvUC{hIdRc&Z5QOE%_bsu5i(wM}`~jHg$^4Oq(7WtaBGw
ze3r5tY~@G;6AH9@$GOkQL=^>GDnMz^qswv5LN%JT@~;%zCLe}j7*C<cx>8-62qhFP
zR6m`Qzf7kDl>KmTGnpf?QX}lWjNjQ}J2O}gbJLdG&7o{nBZzCZqkNcs575T!MTGMx
z)+kNpupVtk>e0H{-By#h=)bJ`%V>~0p1tAQ*pIZ!o+(#WOq0FMZ4QQSAks2shZBm~
zB*QgNI!G?-eI%Jzw`#^6*bM{8p}|!5-{z)wPldDZ8DHCU|10PR41DkmK1lz($gzY_
z?I;~2Im+$r&gVK>y1tEtsHp23yb^t4svCyjj>0$TaQ+>|JMr;Bu|0<%H`-EDgxP<m
zMP_6afH017Ig46h7rOc8C$jMsMIL>w^GCrG!{_V_^Y|>X7P2XtPoR!T=75VVlh9Br
z^5+()7^#@2N5Fob#hZa{8+C6pL=Uo$?~OxbNvyK5D$1B+9zQ3Gz)J;@<rPUSljLr@
z!X6H08o~Df%CyG57(68?ufRWiL_*|Zg6(;&*`~V)U4R(aE|tvERaP1u;#S-F=KlF+
z5l!YMj}judIgy;#Jx_<Y^)>~ZP7**!E-pwiC*YNY?Gf6fYs$jap)6$vhgm5FP^W^`
z97RYc&(aG$;v(phw!){Zm$wca1{J6SjemE9gtO^m*u34K{Yd<9{%#%>79aEeL*|<$
zW_5H`#+hYa(1VD!2b8<BJ}N@^DiDcyv_lEXO7#K+XR^REBq#;E-o_%ds9^8CYZ2m%
zXE3+v|K*1J%0atE?M3!J@z@GK5^6#j2}gqwR-T3Chgy%J;|LM7HwvP9*948n<SXpO
zU_HZVrg^B=i0DTnIZBkFF~mJIiBt2T@$=AD+#mQ+D-S@E!gI|#D+|ROP8Jwi_e`a+
z77~>r-S;A%xBSeIIuK==l+5)g*0+Oon2M%?O7M`d05$Jg)VQa+Y3p#ST8ly$&78Hu
zZennM@_F7M+#*`U8m=%_n2#M$BfKZ#T-eRdLly(~J`V){aSc}h<GUtt4;6j+CuKNz
z5-H=biJ>p7UX1h1<F3jMX43L3|IBTI&D4au%`tt;6`KbA6Jj|4^s?FQZ#%h2%&BI*
zT^_vQq=I#-lhRP%T9EpCCViZ(uCQP~TwPMdk;Z>9lEL|gshmJy)8R;bH^ymnd*F4d
zJtXw9JTB1N?^-@tQ6!3EwO#Mhzvtt&I+`Q@{31P#idp1DB_<I2QVM6iy^2)NFu?Ir
z7L?g76+ro}2`C%A<G5XmmIUcvjUcre%MQ*W*ilF6>uvH^a>X|{XtxwZ`<_YGUC<zG
z4GMJ7yOt^Drh3O9ZwS|^Na;mt`3BC^9<4_y9CsDwp-OuaJuw_pa`Azi8XKP}`gFU(
z>xn|!c~QEMu;m=|%Y-*cFAdx9%RD%o!;8Q?smMbntUw-CXUrTiU*p^=H}44H)X8}#
zEyT4%xXj@VL8|_^mMCYBj_QVlt$mGzm`Mo<gyA$D6R|r@1hHw~3777EKd?BE-W0@z
zkRQ#_&+8NwEDj{|h?1<S!SiW4xGCvdba3h^sKzvOEKXB{Auc6OJNg<0-RkSUI4-gj
zM3(A^<tb7@l9TF<U45-LI1Nc_xq3UEL6M;Yv-&E@O%c=QG*woQ9LFa^?g&pNg^cmR
zIYHkV;c<^7n(8>SQHH9DNsLrgl$Yv{8UDbpSbuDao$kKmUoi2sYq<8GykCOOo%$B>
z(6d0e3*4#S;;=RW<18f$Agc}z!HOfuok9FV8p6BHPTcy6S#oZ6nf|I|F@mv|FIaa^
z;71)*uAHOXEE0I}6Q!o81f8M1fDR3B*G<N=c7K>WDoc|7yiC|Ktrzf!yG=TOCFifJ
zbpu|A(qh7_BA;)$b;OHFWqIrd_X2i^U^b5sxhNsxP)RS~Ku=|gjJT}fDl#Q6kI+%v
zPTqC-W%OsFk@<VOlf(WLMyVg$Wy{5Dgx<hyiWL!BYo5bUE(<p;H|-)pYt7mqjhe_e
z?yK%PYF_W8^<L(~M()m2_$1F7`z%&}fA?8MxUi$aWhG(5<S(ok;&+2D1Wg=}y&V3h
zLq3#N^m#Cpe)Wkp7>FLW=hO&wTpamxWPcEA(j;w<f0vf84hHxg!m-qZ8-oV>aZ2YV
zfW`iTSnwQc5RM@{Ce>^zk7N705;MJt>bYPNCdl%JPyh~wpU+5Slba7E{JIR(;tr(A
zw%8`SPc_+{a9{>?tR=mczfU*WBP5+OP4*2w3AM&yNxIMy(xM{Gw$fGbl?@F|s|(Tu
z%ATIuKzxhGW?P_qFsu!RG0eo3Y5@xHQhqJSsG!Ln3g)@>U@L!{>8O25zN5d*s^2{K
z%e?>K2<IA(&ZLP}+>x&*^!s|Z&O@$K>m5)Jfcf!)m}4L08$PGz64SLNyyHIf0#T2u
z+(COJ9K_SaHL!D=y#r6~xE<z>TcIRZ(wb~?^?utFLBc^i)vxDL%~#P#B}oM{-H~uM
z$tzSNo$yj-u>wp%jf2Vs!jq&NP$O#@N#31wMM3I%LgLwP(&!OJ$T)k!U2w<E1pXEW
z6F6!T)0H^0lEmX?hK(}dJN|$QP}k$50D*3^13q-zjMD3|h-m_y7J{x#u=3@*_(KhZ
zpgyF|x#?Ein@_h5-2JU`Z<%k%pMxR!rvk|Z`R5BF|1QOybD>ImT%8wD6HRp_yx{Sj
zz-3~I7Vfs#tNgo`EBy&}gj%cb=nHNFBV1mV%{N&E$C4q%W-$0~+8uhP{WF1th8g~$
zLq4t1cLg6~HQ!$~;U{Oio57;s@kMy(mkzB~Pi)pJS@?_F=HlR0J;~hCgUm7xMA4f_
zfavkeLSu0{(lIprVKy%ypgl2k*y22c>&2v(E7S#isCxrTmOr^Uv8g3?Zw0XG@nJ)S
z#e~&4q&{>`tx(JCmT(?EW{)GD^PK!Ab~(l2sUR!68Eq?>FmZlCbl>GbLBTJ<fyNGV
zjtO^|8x`)<^PFuB{&@oC?^En0(Lh~*0nM6!qhsO0qR;uUaK*?7xQbVV<?4{CP}d2{
zcQY77lsGY#u3#Bcr;EcWgd#s;W?6B-I5Y4rcvu`9B#_TLDgAZ$HK|~?_QcrWK*rA;
z7wFn?EXNKppVn|H{c9~oHU~L*Eq0FnJ@A@cupfJTbPOo^)Bk>$nf!&I${co6Ftn2S
zr3F>=TWxqoX>-5O=0@{pS<vRzuy(t~@8jGLwz)0*0_J5h1WrDu^7}2-#>G^ddo?Kf
zlcGP)sJoKQYO8(MwZbBtI}}hL?{Y*kZ|3w&)N4<S4z_qR&zxN8H=hS$7YZWQcjqHC
z;5r@8NRTHp^H+AncAz4v>$FTe<lMBWbjao60A`n&vTz^Kciz7;cm|uQW8Ok2NgN%e
zu;u$jfsy1G?x;QHO@lcEN@WT3A^&i%i}hj~(hyGM9eAqwrDi;H<#>Ylex=dYyUD?L
zAL%85k`|VllWr2hKB8Rcc)iPXU{t$0s8VHSE$il%bgReG_K4h=W`jg5NL`tAkut8R
zU$xtH8LRE{><uzlS5APvF}g}mOkcyXW@-;Sns_(4knf0C6zghUY)*9N)n7};oeTtz
zdHBsdf)kM=K^Zb}p1s3L-e}b%&mrlN)xlnuQD6yMt)ZTb1oYvqiVf_R_NCcaYD)AJ
zRfbEQT}+H+VXKo{;sit(U81Y-o^!}b9>n6cu8aJ}z$@~q9Z^|kb~xYU3jFxIe<d2c
zM2jIif_#S8WKoCgKr_C?>Nd*iVngVc|8y)oOYo7UY{zE153W;(%sTbKzw-W83+6%)
z<~&_&hgCzXT4_a2vcv~(0_O33DVM9cFv7$L;M-ko3GFeQ!8}AC3tRnvCHf>=$hAhC
z*TS%lGsTZBml9p1hIOU{VlDB*E~Q1JN0_Ozb4L4)>SDb}ScY`9@*MOzwOxN=xY~i6
z%Vzxvg?1|Xc>xi|w9khKT;X)FvAd-O(a?h7a%@&oN?2F}T1k4Ogh&Ko+^2OB;oehs
z?6S+uGkOTBu09@k<`|ED<?yM@yvUJHJ%eq9`7HQz_|!%G@4W`YJmVl!;!|S~rt|7b
zFvI>hI*mIPzG<VRnX((_se2b`>P<y8owfHCTm$ZAV^YVOu8d)R!VF}Pi(fX$J-~{u
z%zj6bpki;AspviJ#EMxIdxJf%9$JeWrKXa);E%k=LPSph&e}LzhRTk>M|WhW+QnYE
zTlxv@Hjl~m|9UNGa#NVu>Ipzq78W5^OLcY{>|ftybnliXg4qwfWZt&(gE_id%{J4+
zm59w=b4Q&PTa8do(^3GL8DRfXm$C0XwUi+|A~~svC$*Ym`4I_El07=*R0EQ5_Qt)`
z0h|`xR0r``ByS%Mgjb{Am}E=(Y%MwIU*)X3lhn8EV~gB@a35yR;x*%H44nKeXNw#a
zj{%4JsA_rI<62R2E}4VsSsb|>2tSsfwMZVs(lbeRwRwMpqhvq^Cm{LBK$KPoQIqAk
zI4HJ4PI)p1OV(9Frlk|}*93wBcE%2J6U`@T!p{`5dKt=UYr3~ZEu0OS*rDgIoLeoa
zd@g?BJUf9*z6)}VBe$qOr0h-}Z%W^Aoz7SEyH!bgTq~<z>5>RmenpV-D}fs->(UX0
zP?b3YREzBu3?bv22BtwtD<LJiYsgP2swnD?Z&u>FG3gOm4^Xl6hNSxriIxMi3*q7`
zla}Y>c~Ab9BRKL`Ozxsz?Q-&?hSBFiHP{Qg#3m6_gM)4-LRP}l8Go1qibvH|bu!L7
z8=Myb<Z*WXO1Xa)gckXIW7bFhGH8%j{V0t7l`$uEWR5q6egP2Qi=0E`Zz2{rU!^cV
z_d9<{kdqFq)JJU<qp738%91-1BzM4`DTG*W>mAyA2?y~*oNze(t6ZmlXYw6AcOGjX
z0Z#sw>*QBT&mj~W3K7|JT8TAeG|;25l=(YR)lp6+5eScr`Eo{^{2M9i@-P$qzw2Cf
z-m$XcR806bUj{>TADQt9%YIOx&3CDF5NByCR#)*bOng}I2r$36=T{{8bMn`Q29CNY
znNvlLMk!V9f{FDsHA~MFbKX1~<s<(tW}@|@`hSXh>P2=N9>RVPD-xVDR^d=A{we8V
zZeojgjQ2=hNalHg++oHzapzEF<rf|B<Gdvp(PP{LBf_}hx#6~8n0w998oGlG-WdE$
zgGF|FXNV#Lpju@S1{&`{!p1mw;0cpo)QumIe8}`DWh?^5IN=c?YHIA<@PHbIH~4MA
z7((*m`pLIdWjo9S%YV&_B)#0lt_6dM`jisr<BlFFHs74iGn;STh~mbhcqF@uHw)RB
z@;DINs9xa`tA$vU)`Vl+z$jXfjedhhaeg$q&IispV_E%+h1{o2#}_E^iEL_R%(00d
zHy!4J#MS&r^r*!ALDBCEo|SgHiX^8(MZI^#*5ai(=2L~O!?)D$HQ2QbyG=X@l`>w8
zuBn0g{}9S1>kGE%b48!6!Vj6$RYlBs>F6T_O&DU^RS-*IR&mHi6|xej)H6ACX6$GJ
zk)zDE;bA-eV)jqxPQ<0&1T#qg&RPz&pD{N%eI?u&syZt08(WRf8Q)o@a5P=%ldWcr
zsw2!+o&NN<S^1+~q&i$#WTk^FE9%0?vOBKSYdHsq&|mHY5OFlHkv()~QsG+gG$ge|
z1$J}GpZ>Kp*ys*$*1J@;C}{1Co>AvK^UeiJgB$Q=xx8b>p>p9yWGhD__+GLN`fF=6
zdc(8)$v-%$>+~KaCzTs9|IElP#kR<26|R|)kY?^6y+qZ8qtwOVjEjB0FcOmfZJ!J3
z)t#XpHz01KVw{(&hb#0+V)&)yA<8Y)KI`W?VFpSps;MRvrtA%NhMp-;9@O92<=6H}
z_C_6NuGa^(oY}7J3|o$N((L$TD;+q<NjH}0e&PUfqvP=;?MEzGM`*5{?XnB=n<+ls
zK&!rmM~xDloifjR+}Xw%uH?zzc`^fH(O<agyE6EAzAsE3ZT1FD=4){e)`a_Yn-#3Z
z|MvHyAHph(is0bN1h|xuB#_$>QsCszPGBHrYG=gs%-}?N)4Uy|hntCDJkANK3`uV9
z(y|?;Pm_fX_Y{RWefNeV0YW2ok4r}QF!xX--QTOz{C~E(g<V0p-bMhc5u9u`Dp@zI
zGy-3WUJ&5*0{Ff4tO&)xjwAlU)b#ua%~C4dF$XJx2~LDL8c=fYl`uX#*GCAd=?vk!
zK1i8V(qhwM$C}tIC^dJj!N_2&iA{nqMk~zVyD~6&tXUsU(Q|`HUgD9tHe4GX=6_$4
z3HeD0+xpQ8EpCUlsky;QBQlZ#DJ2k*&qqkcbw)$aj7QGt@bu}`c7*UQJJo)BiN7hC
zuA=#Ijoxej29&tzDa_WpHwyino-A^nd}u3<FL&`?v(l?PQ65c3)-*EfiX4|}K+xjo
zxt(zq__O^gjDOFMI~1D8ZN^+HJ82fw+hlFP{9CG{-4r{X!nob_A;wUOBtVu-f;8-8
zEh%Z|f^EzeaPXgHmsajdg5y?<$XCf<h?%87CUbF<TNGaM0Y;~K=gjeU`yyzYI$fvk
z1kVM>b^lwYnE(eR%mcqhh)_6|kvD>n?REN7H2oJHG!4p8!DD87JnIV=rO0&?EfP8?
z#co<kjS8Yo=PLh;7I+lY9@TD8M^8mqy=tn}S3h~&uGAM<=R|31eXLVidkU7Xnh8En
zen&ar@jp92qkELnMH?MFjsH?Nd$k^+k&)66zVEo*X*Y0<F;o9)9dTYJ2K~l|A6&$&
zBIB^5{4?r(Ai+UrdnCF?A*L!z^cEI1KeZ{CMSSw3_;_vOh=!vhv(iiI2UodOtoS98
z)`om=tAcOul?C179pKds0YC(!&c4n%b(WP;<VDhd(G0=SNGc;x!9KOh-Shw%UtlUZ
zYl6w<g`nOp49=@J-8sEfm8so&IW~(TJ>%R-73E(H-sH@pOzpvzrC_~`x}?Q*rXiSO
z1`%rP(J~+Lj*G!0Ptu1dpA4=~6s(e=B*iA_)7}wR>USaXe3|21KGG=&<~TP_R(R;Y
zLWR%@WrX{X2AcFBH&j1oX8VX3V>}n5wAH3y9Wh^p;}g}RYt2%3*lyMjE^#MKrI{hK
z2m6SG3zK>26ay@GQ8rj^DvTwE%~AP5ZeBQBPa$vxytLt4>NdOlRFowKPXZQ!Eao&I
zBfk(MSh*|*{e&4p3=I?qZTMt4t>02Zj7W!oM4S<T#dd@~t>=gWpIMlIl!y#+mtygh
zrR^ZMFcvxy*kSaT{7vN)!k2|x!qPK@_dA25-(&WqSMy2wS(T)MAYL38aht;hdTuyi
zh?|d_i1rEad2@Kp3QUDs=xPJx_$DD$K1Co|Ga}p@Uh`Lc@ajWpm?7M?wFBwAE!Oh8
z-3dY>Pd8Fmr5$j>O5^^rpR<WyDe-vt^bh%KeqR1`UTtrZz)Ddt-iu+~O(jIgAux})
zK9rRL^YJU%w=ic?7;J6^f^&-J+)5;A5x+TB>RVW&;RNGp8l{%;8wPLdYp62dlabWG
zrRn_OW-64bn8Nwt(~SK^IvFa?^))KE6D)OgJVSphEzt{fi#g2_dviG0OmsrzO*_R(
zh%$K-)Cu^91h!EWCVQT~C0r=feh-w$8vx94k8)_tN`NTAVp-JhG}>~UtK)e?lnDM&
zxR5@iPrqFB#l5yw-(((_K~feD!7b<z_o<ueDE8os?W6K^<t7nfPvB**O?@irx$%Vh
zP96`Qaz!{2%dTW;khcQ*GP^Wfi2^wEA+8{j%kh~sKX`PvXUl0b7N4aD-ENkwEoMNq
zPN_e90~dyjlwxflCOE6D4-vsISm-Wsmb(f88IV7N>1-MfQ!n8^a6lY+g$t%AX_0$4
zf5E&>A+6%Tdm5g(F5rBbS+d5@K6%pV8lny5tu1c`v*~L4-<rUEm-}u+s&DF?+K;o@
zDXK-CBXDsM3xYggm)+?IBySUWGl-A5+CJ7y_!?<=z)9|gaEY;+H$}IV1f6Il*s1(}
zYO!8z+jxNVf<XtNvMyq=nNjGgt8s>v6u9iNz~KwVgLzTNo6++f%8a~@S383DfM@g%
zi{v<ir9_mr$UUQf9Gz#p)g5&2WjAudG!;peE|NegE4hVQNci-Ia4`<*mlGT`cHPP@
zA{Va8jR{jQaxse&yu4kKH>2nKil!uVz<%Nf3n>ffw*k`(S6j>#5=QA#P?b&u?Ze$c
z`(E}L!Z_6(CE@_WDDj%URqAK!C=IWFlF)aCj_+WRs%!c%zUgEU-aZL*2mV{rfD9dp
zVD`b)rbSN=#_Jt!4gPeenMxe8M!~w4t6yE{#OAaUxJmRR9Kh=_i>~Eriv4g&xR%&W
z+-b7x-xQ=j@kuTDTlHFVkU6ph^9@3_wPC*@F<#qLYQAK=ZVK{(F<Exn6ee4j&;V2H
zLET^__%ZP&Sgd?_nA>W{xdywRMc56!h7Gu263?3$dS0@dNa;e6has6DsC|fJjxcvQ
zAz6r>K(yrb#Qeky<66_~4ibn%WS5(~UD!565C?oDP@jK94wRtiXrH1885Mdi<D_PJ
z*of0fdCj&0?8mFf0i_5GRIx<Z6y%5ckSC4DsC}rj@J=eoAJ9)WE9sou(oa*}Y1^jO
z_)Z*+kL&*_a@yt%Di}H+^1w%I7U-rR8?es}L{?f2;X!?fh2#{w#{C&&Zo*DzKD(V#
zT^>yFgFbh)U&PbLsMMw)yG*t2Xlrn)PxURH)9c+pc0`f>DT_My!}~=sif&;!eJt))
zBs>BYtrG)I4%@-?#gVx=CT}Z|fPUkceI?kBVlNA;G(DU;HDzRO4uv*>I+z0byEF)-
z9q3cNhiOR_5vZoH3)^Jc)N<xBF>9OZ8hLk<nxQy#u2P$bL((25+RJV2Q$%qfDyT;S
zDFh8@OZimyjtHcWa?<G;yp(ZHJStpluXCkwAe57_Mi>9a{`FhW1Vy?i_;vv(6x~m@
z$rMW^^HnopI)Aquv&bE4Hg&#jDs3YtRaXMZ_NTM3-@^;HJ#?*0U|Y37HadS``(%MO
zyM`Ip6X&$hvQd?RUQ^UQ`=WH}ve3811>C!311p;Ac7l2(JP<Alm*B}uLY!<OCR3_m
zrsj?zVkAbrdn7P+sMfXEFb>#CyNi+PL9ULi?+g6*qvLqrY_zF<Kw?^P6uDJ5qR0g7
zOaRDmK0QnRr6)KdwAX}@7zhq82cy`*r8vTQg9N~p{4+$yk-V4}*gd`54j~%nPe#Cl
zhVaokb5YAx_+gfu*S(}43a;COJaAuYrVth<Lo%hr_~4>0>IgDs&ELLj+_(&?cdeWy
zB_kw-1DmIGPHWN`-+$LF!s@xEMg2$`k|FVo`dL33Y0sxegI-c)tNc&zx;=zF-Bbnl
zY^yQHN>K?mNrOpV%-dl~wqI+_PY)*STD83yT;_#{tn1dAk7OjUkOyKe*7DbbrMOIs
z;D!XNTq6_jr#A#^cu(BshJ<a7gGm<79|^7ppGlzBxb`qzX%#o>4a^pkO(hQiiOp=6
zayBu~?!>**c~Ze>puVOK;6tTF@6-eJIt&Qr1=q|N#eK71@njZ`3VmcxR)I5mx}7Dr
z-p>VHVg&Oq&DQBB=5aAPM9;Gyh={Dy-;l`MvL%4oAMpUGoEra(sw)(8Sn*=;ict0n
z-Y?ec%fu4?rc}x`gk*dqI~lx*zS5P7Sr-+;J7r;xmTHH5DzhsMu}`F-VMHLQcPr?R
zFI5rv<Cy-bYJzJw#PZc-M<PK-Np3Wwg0s4a1>Q%ZBF_b1+D&Hz-W){yYqAw+_XHG*
z$M<EC{e01H#~oPDa$JT>y?t~omi!`pRrKi)UCaH;VH~9l#7EUuecWx=Y4VC#-TQv7
zcb8nAvPUR+8aF2CQZQvf*Tmp1i!XCMonOzix73Xe<RFS!<s<UF%tfbAFLw>kUK3YV
zM^ovjY7j;^&zskR18y=e>mVaTp<&V&K|L2HK(ow8(g1Y8A|=K(BK5CuT)GRVkI%WX
z@O01^Hip}AjyY2d@348u2T|$BM{#DBPD)B7_GAD^9l0=-ZXSMX;<5DZvB0)E!ZM;k
za2GntSZ0;Fo9c*O7@jlVzs~c3_$m=qn^~aJ<puY*iR0cotl}Pu;Yvr}v`Lqz*|pt$
z-_Q9-PcBfxA_0*F02h?+zTf(W^l-2et^HnM3~UHw6wJ256p^6qZh***XA6Q{lnGPm
zG9iR3lixdB;ndfUm}H#nG_pKy3?s%2)dQl~jL1`mV8WXO2*w<J?=a@8MGpy2B2_a2
zWhoq~P^dojtd_GmnMIfR<wT9G<_=fnXSch7@0v|nN{B1<?22$n{LZTJ%85ry@0F4G
z#i9o@#ch|Dp`}I`{G4l1OEFJAii^~n!3{1d)-d@^H)p~lSxn_=UPo0_x-L}U*;)MF
zVJBOxNWf(5?($Q*OweD9lssF^%v>3;K2P*m{d<QA_*>k;V2oJM7&277G?fuIXcyL!
zZFXq9fT~t9P>HpG%}N_P(KeS}E)n&X0F2r7h)8ADvMjvqEmqo>g`rd5I}ByI9B{+)
zN|q7nm7~ms^*o;+APoKtL0XtW3IkR;z+evX@;Fue!(XlmE~rgL9;<)7CTLZ1RW*==
z{*wCsHur<~*90SZSh+NqiXUj%wffvvmC8G->%Bp9`>I&*l^LmLz5dd1CHXa~+FYiy
z(b4GZm)Ve)6P(k(A7}YfW?Gd8Esnu%<L$IX&$j{q%71&;G3ErbKdwfjKeRag?lTFx
zcj8aC3db8!S5#Wz)F1wGzjB^Cz;ZVGyKR)+ict`~^!0wLFbD@d9O>TeKE&uz&^d!6
zjlDQ?c<RYN{N+EyflIYHWaYF0Y|h{~Su(!<^;GnFf}z}Pym&Vtcn!mw^agoE!Id|-
zB%ko6_i#9@R)xdy86D%0eD<374As%lnxn_+7tPGTk2Co=K==m{pP{-~ZB1uw^%<bI
z;_i1-S5!di;D}>~JSrdo0ck9l@3w4ltk9|6if{Gv;2YiQ;{%>Y8~u*yF!dJ_<-1um
zyZzV@FT+c}UTj~`3+z1n7<fNSJO}C!<hn}LlGMsEoPd_G@h&mLd1_tZKDY|IQ2&UB
zdlt!jKF;EF0IPNw$mLQ}KKXlBu-dE2G2T1NTAZ`~+eAb;<d*rzPJ&fVX0cu-`fTLg
zMokQVX?=*^$1{*GR)mv-E#6mWyF`!~)=S8wd+*m4`xk<lz4q(9)nV6yx41qI``y4J
zL2>Y8ML5<LwaK$15yy@)2g;1h>$F6MlD|DGOWgMgJ7)9Fs#)&|!xDGE4GzCJBK+8L
zO`s=cAj#gz6U7pD+I_LsNivA>A~-=P`P;LIp;o2kVmy;qgcbG+m$}^CCB~{TN~w(D
zxX1AkGw`IAppyLUS(K!w&g1+hJmo65-y5&%)fD|_-nX$}>$A>stC*1ir+7q^pp*RV
zS+qFnzYzSW-#@~wvS5L^u4V);!M6r{E0o!@x{h~NWuQBsFxb_ouvYJOiKG6^LPPb*
z6!^0kA_?#Utc4>z+k0x`|37JFgb!dyQepig0%#hded20Js1Wtqr;xep!+`xPf<?#f
zwht`#EV!b-;zdrTpG&qrh?B=?NrgXmeNq&Z=$8j7!rvIjbJxv^$JVAc<Y{j_X5Tb9
z8DLd*w?_dRC&6kxm+3e4Sza*4?%LuRNzyNKADg&s!(CM}8k4_0J1V(@5q!!}_FF>X
zlUSx_r}Rc=#VeSJJl|l#S!|b>|Ls#HdLh@hW4wnG!6?q$V82zO&&t+y_}yj>*YDDB
zO}LIj=?THQaIN?Jl$!=BSVScKll<-3eo8Iz{CY(?D#I6Xp-hnDvN}O3`P;L|vAS<|
zE#?)JqVOhGg^_-2H6>xc77UHf*hc@tlvVX*mjfDU&Fx%lq~O4tU3Y?S^0#O4=IHjU
zTB~N7euTmhyfMr*<ANi0i#ZwiRS!yJrq0ekP8@c>=$X+A=#}_w1MwM82KQI1<7S#$
zsb5nQ)j8{<_%YQ-5EFQwb^mT2E+kp7Z_M4sFV?Wl?mMsRk*x2(Gl+;z-jzW-aMq`j
z#fJeF=}A8(e|xq+F|ZQ(JH=5oi~7+<oE)4n)54W_H~3BoFN*NhMR+W)RN@t77VIs;
zL0rS}!7-V@aS)tfnf&cpY~ziYtozThb&n5Iu$mAWo+mARkkT6?L0Wx-@PRcPrB*6Y
z!KLnyo1=!RRdV7NcXk?LgB=$PRYQeUm=h!{O8)jNt9a@s=ryYn^M*PZBx|pKc^%B8
zS6A>r>^HJ^%?V_rTK;9F;K}s@?7gVR>w$K#JsqsH-<axSMqbpX=!NK$8Tw`rLHGpm
zaw)rfWcp@sDgsK<I<M{bioTjr8?WtH9M#wtU8}wd3bQfzJIu@b!KD7}F@2alL~im%
zH%d3@C+PvMtYQSZQO!Z;D}f2Gd7Fw(n7|Xp@p>=^5%N|IkCgMUU6P-j6U>o+2Ehrr
z<wP{PLEx=hrpZjw`^*z3^bWP(Cyv45P?D#ZQ}&58wO=Uud=|T3bX~0@P3p9+^f$5<
z_4do*2TH;^RS|6Cu=xOiTM!QEtW_$0pTabIiU^`H)N48e;^8iE=8uXVt|Hjtt)Rg~
z4Ssl_J#K~tgIQn*16JUdyV#6$XY~zR&F~)_K9OqS6B0zWJ{%s3kPmUcINi<HMHsvt
zcc+35tGTIe*o{=3Q$?|j3nK`49q+t5dv-KX+k^O@0yB}W6m{ajC{CZ3<|-(%SMD6e
z?#n879Eq&<KO2le`+p-DTIZD9afk%=Z<R5hP6w@nT|ukY<O(Z*go-Rg2il7;nHa@f
z+7xlUkfS`#sZ0Q<TG$n;dR87-zlb8r5QUUs5}UM(Izt+g3=r*-8t=YTe5>eBGWZ$k
zfOASl>1owy)&+yj40FNC_Z613>w+ClxO@d`*NHq=Sf%9qhCRULmV8eQM(K<E?=Ome
zzvy?fG+LoLCHQl?#(G!9HJQ{lALD20f(b+%?tEzUnhbI;DLl*Q$aCt3D#f;K7)JsJ
zSX5N&Qcj+Wys&0;YcALofS`_B$<C?kSy^N=@T%z2Ruk!eIUpNsFQxU7IDCvDUSnZ7
KPiN$T^8W%R1s(?g

literal 0
HcmV?d00001

diff --git a/paddle/trainer/tests/sample_trainer_config_compare_sparse.conf b/paddle/trainer/tests/sample_trainer_config_compare_sparse.conf
new file mode 100644
index 0000000000..92f32a18c0
--- /dev/null
+++ b/paddle/trainer/tests/sample_trainer_config_compare_sparse.conf
@@ -0,0 +1,154 @@
+#edit-mode: -*- python -*-
+# Copyright (c) 2016 PaddlePaddle Authors. All Rights Reserved
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+#Todo(luotao02) This config is only used for unitest. It is out of date now, and will be updated later.
+
+# Note: when making change to this file, please make sure
+# sample_trainer_config_rnn.conf is changed accordingly so that the uniitest
+# for comparing these two nets can pass (test_CompareTwoNets)
+
+default_initial_std(0.1)
+default_device(0)
+
+word_dim = 999
+l1 = 0
+l2 = 0
+
+model_type("nn")
+
+sparse_update = get_config_arg("sparse_update", bool, False)
+
+TrainData(ProtoData(        
+            type = "proto_sequence",
+            files = ('trainer/tests/train_sparse.list'), 
+            ))
+
+Settings(
+    algorithm='sgd',
+    batch_size=100,
+    learning_rate=0.0001,
+    learning_rate_decay_a=4e-08,
+    learning_rate_decay_b=0.0,
+    learning_rate_schedule='poly',
+)
+
+
+wordvec_dim = 32
+layer2_dim = 16
+layer3_dim = 16
+hidden_dim = 32
+
+slot_names = ["qb", "qw", "tb", "tw"]
+
+def ltr_network(network_name,
+                word_dim=word_dim,
+                wordvec_dim=wordvec_dim,
+                layer2_dim=layer2_dim,
+                layer3_dim=layer3_dim,
+                hidden_dim=hidden_dim,
+                slot_names=slot_names,
+                l1=l1,
+                l2=l2):
+
+    slotnum = len(slot_names)
+    for i in xrange(slotnum):
+        Inputs(slot_names[i] + network_name)
+    for i in xrange(slotnum):
+        Layer(
+            name = slot_names[i] + network_name,
+            type = "data",
+            size = word_dim,
+            device = -1,
+        )
+        Layer(
+            name = slot_names[i] + "_embedding_" + network_name,
+            type = "mixed",
+            size = wordvec_dim,
+            bias = False,
+            device = -1,
+            inputs = TableProjection(slot_names[i] + network_name,
+                                     parameter_name = "embedding.w0",
+                                     decay_rate_l1=l1,
+                                     sparse_remote_update = True,
+                                     sparse_update = sparse_update,
+                                     ),
+        )
+        Layer(
+            name = slot_names[i] + "_rnn1_" + network_name,
+            type = "recurrent",
+            active_type = "tanh",
+            bias = Bias(initial_std = 0,
+                        parameter_name = "rnn1.bias"),
+            inputs = Input(slot_names[i] + "_embedding_" + network_name,
+                           parameter_name = "rnn1.w0")
+        )
+        Layer(
+            name = slot_names[i] + "_rnnlast_" + network_name,
+            type = "seqlastins",
+            inputs = [
+                slot_names[i] + "_rnn1_" + network_name,
+            ],
+        )
+
+    Layer(
+        name = "layer2_" + network_name,
+        type = "fc",
+        active_type = "tanh",
+        size = layer2_dim,
+        bias = Bias(parameter_name = "layer2.bias"),
+        inputs = [Input(slot_name + "_rnnlast_" + network_name, 
+                        parameter_name = "_layer2_" + slot_name + ".w", 
+                        decay_rate = l2, 
+                        initial_smart = True) for slot_name in slot_names]
+    )
+    Layer(
+        name = "layer3_" + network_name,
+        type = "fc",
+        active_type = "tanh",
+        size = layer3_dim,
+        bias = Bias(parameter_name = "layer3.bias"),
+        inputs = [
+            Input("layer2_" + network_name, 
+                  parameter_name = "_layer3.w", 
+                  decay_rate = l2, 
+                  initial_smart = True),
+        ]
+    )
+    Layer(
+        name = "output_" + network_name,
+        type = "fc",
+        size = 1,
+        bias = False,
+        inputs = [
+                  Input("layer3_" + network_name,
+                       parameter_name = "_layerO.w"),
+                 ],
+        )
+
+
+ltr_network("left")
+ltr_network("right")
+Inputs("label")
+Layer(
+    name = "label",
+    type = "data",
+    size = 1,
+    )
+Outputs("cost", "qb_rnnlast_left")
+Layer(
+    name = "cost",
+    type = "rank-cost",
+    inputs = ["output_left", "output_right", "label"],
+    )
diff --git a/paddle/trainer/tests/test_CompareSparse.cpp b/paddle/trainer/tests/test_CompareSparse.cpp
index a7000eb77e..813275518e 100644
--- a/paddle/trainer/tests/test_CompareSparse.cpp
+++ b/paddle/trainer/tests/test_CompareSparse.cpp
@@ -23,7 +23,7 @@ using namespace paddle;  // NOLINT
 using namespace std;     // NOLINT
 
 static const string& configFile1 =
-    "trainer/tests/sample_trainer_config_qb_rnn.conf";
+    "trainer/tests/sample_trainer_config_compare_sparse.conf";
 
 DECLARE_bool(use_gpu);
 DECLARE_string(config);
diff --git a/paddle/trainer/tests/train_sparse.list b/paddle/trainer/tests/train_sparse.list
new file mode 100644
index 0000000000..6ea020e220
--- /dev/null
+++ b/paddle/trainer/tests/train_sparse.list
@@ -0,0 +1 @@
+trainer/tests/compare_sparse_data

From 5ae7a5f1119d953f5d2d11861b2432650899ee4a Mon Sep 17 00:00:00 2001
From: Yi Wang <yi.wang.2005@gmail.com>
Date: Fri, 4 Aug 2017 17:24:15 -0700
Subject: [PATCH 33/36] cpplint attribute.h

---
 paddle/framework/attribute.h | 22 +++++++++++++++++++---
 1 file changed, 19 insertions(+), 3 deletions(-)

diff --git a/paddle/framework/attribute.h b/paddle/framework/attribute.h
index 72a654bda5..3a5820e9c6 100644
--- a/paddle/framework/attribute.h
+++ b/paddle/framework/attribute.h
@@ -1,3 +1,17 @@
+/* Copyright (c) 2016 PaddlePaddle Authors. All Rights Reserve.
+
+Licensed under the Apache License, Version 2.0 (the "License");
+you may not use this file except in compliance with the License.
+You may obtain a copy of the License at
+
+    http://www.apache.org/licenses/LICENSE-2.0
+
+Unless required by applicable law or agreed to in writing, software
+distributed under the License is distributed on an "AS IS" BASIS,
+WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+See the License for the specific language governing permissions and
+limitations under the License. */
+
 #pragma once
 
 #include <boost/variant.hpp>
@@ -29,7 +43,7 @@ Attribute GetAttrValue(const AttrDesc& attr_desc);
 template <typename T>
 class LargerThanChecker {
  public:
-  LargerThanChecker(T lower_bound) : lower_bound_(lower_bound) {}
+  explicit LargerThanChecker(T lower_bound) : lower_bound_(lower_bound) {}
   void operator()(T& value) const {
     PADDLE_ENFORCE(value > lower_bound_, "larger_than check fail");
   }
@@ -44,7 +58,8 @@ class LargerThanChecker {
 template <typename T>
 class DefaultValueSetter {
  public:
-  DefaultValueSetter(T default_value) : default_value_(default_value) {}
+  explicit DefaultValueSetter(T default_value)
+      : default_value_(default_value) {}
   void operator()(T& value) const { value = default_value_; }
 
  private:
@@ -87,7 +102,8 @@ class TypedAttrChecker {
   typedef std::function<void(T&)> ValueChecker;
 
  public:
-  TypedAttrChecker(const std::string& attr_name) : attr_name_(attr_name) {}
+  explicit TypedAttrChecker(const std::string& attr_name)
+      : attr_name_(attr_name) {}
 
   TypedAttrChecker& InEnum(const std::unordered_set<T>& range) {
     value_checkers_.push_back(EnumInContainer<T>(range));

From 301a21d8fefac1bd8d6efd462b12667e6c65dd3c Mon Sep 17 00:00:00 2001
From: Yi Wang <yi.wang.2005@gmail.com>
Date: Fri, 4 Aug 2017 17:35:11 -0700
Subject: [PATCH 34/36] cpplint recurrent_op*

---
 paddle/operators/recurrent_op.cc      | 14 ++++----
 paddle/operators/recurrent_op.h       | 51 ++++++++++++++++-----------
 paddle/operators/recurrent_op_test.cc |  6 +++-
 3 files changed, 43 insertions(+), 28 deletions(-)

diff --git a/paddle/operators/recurrent_op.cc b/paddle/operators/recurrent_op.cc
index aeb95569b7..2fdaaaf05c 100644
--- a/paddle/operators/recurrent_op.cc
+++ b/paddle/operators/recurrent_op.cc
@@ -38,10 +38,10 @@ void SegmentInputs(const std::vector<Scope*>& step_scopes,
                    "input link [%s] is not in scope.",
                    inlinks[i].external);
     Tensor* input = input_var->GetMutable<Tensor>();
-    DDim dims = input->dims();
+    framework::DDim dims = input->dims();
     PADDLE_ENFORCE(static_cast<size_t>(dims[0]) == seq_len,
                    "all the inlinks must have same length");
-    DDim step_dims = slice_ddim(dims, 1, dims.size());
+    framework::DDim step_dims = slice_ddim(dims, 1, dims.size());
     for (size_t j = 0; j < seq_len; j++) {
       Tensor* step_input =
           step_scopes[j]->NewVar(inlinks[i].internal)->GetMutable<Tensor>();
@@ -64,13 +64,13 @@ void ConcatOutputs(const std::vector<Scope*>& step_scopes,
                    outlinks[i].external);
     Tensor* output = output_var->GetMutable<Tensor>();
     if (infer_shape_mode) {
-      DDim step_dims = step_scopes[0]
-                           ->FindVar(outlinks[i].internal)
-                           ->GetMutable<Tensor>()
-                           ->dims();
+      framework::DDim step_dims = step_scopes[0]
+                                      ->FindVar(outlinks[i].internal)
+                                      ->GetMutable<Tensor>()
+                                      ->dims();
       std::vector<int> dims_vec = vectorize(step_dims);
       dims_vec.insert(dims_vec.begin(), seq_len);
-      output->Resize(make_ddim(dims_vec));
+      output->Resize(framework::make_ddim(dims_vec));
     } else {
       output->mutable_data<float>(platform::CPUPlace());
       for (size_t j = 0; j < seq_len; j++) {
diff --git a/paddle/operators/recurrent_op.h b/paddle/operators/recurrent_op.h
index f859dc333d..c5931773d1 100644
--- a/paddle/operators/recurrent_op.h
+++ b/paddle/operators/recurrent_op.h
@@ -68,7 +68,7 @@ struct ArgumentName {
 /**
  * Prepare inputs for each step net.
  */
-void SegmentInputs(const std::vector<Scope*>& step_scopes,
+void SegmentInputs(const std::vector<framework::Scope*>& step_scopes,
                    const std::vector<Link>& inlinks,
                    const size_t seq_len,
                    bool infer_shape_mode);
@@ -76,12 +76,12 @@ void SegmentInputs(const std::vector<Scope*>& step_scopes,
 /**
  * Process outputs of step nets and merge to variables.
  */
-void ConcatOutputs(const std::vector<Scope*>& step_scopes,
+void ConcatOutputs(const std::vector<framework::Scope*>& step_scopes,
                    const std::vector<Link>& outlinks,
                    const size_t seq_len,
                    bool infer_shape_mode);
 
-void LinkMemories(const std::vector<Scope*>& step_scopes,
+void LinkMemories(const std::vector<framework::Scope*>& step_scopes,
                   const std::vector<MemoryAttr>& memories,
                   const size_t step_id,
                   const int offset,
@@ -101,14 +101,15 @@ void InitArgument(const ArgumentName& name, Argument* arg);
 
 class RecurrentAlgorithm {
 public:
-  void Run(const Scope& scope, const platform::DeviceContext& dev_ctx) const;
+  void Run(const framework::Scope& scope,
+           const platform::DeviceContext& dev_ctx) const;
 
   void Init(std::unique_ptr<rnn::Argument> arg) { arg_ = std::move(arg); }
 
   /**
    * InferShape must be called before Run.
    */
-  void InferShape(const Scope& scope) const;
+  void InferShape(const framework::Scope& scope) const;
 
 protected:
   /*
@@ -117,13 +118,15 @@ protected:
    * NOTE the scopes are reused in both the forward and backward, so just
    * create once and expand its size if more steps need.
    */
-  void CreateScopes(const Scope& scope) const;
+  void CreateScopes(const framework::Scope& scope) const;
 
-  const std::vector<Scope*>& GetStepScopes(const Scope& scope) const {
-    return *scope.FindVar(arg_->step_scopes)->GetMutable<std::vector<Scope*>>();
+  const std::vector<framework::Scope*>& GetStepScopes(
+      const framework::Scope& scope) const {
+    return *scope.FindVar(arg_->step_scopes)
+                ->GetMutable<std::vector<framework::Scope*>>();
   }
 
-  void InitMemories(Scope* step_scopes, bool infer_shape_mode) const;
+  void InitMemories(framework::Scope* step_scopes, bool infer_shape_mode) const;
 
 private:
   std::unique_ptr<rnn::Argument> arg_;
@@ -144,18 +147,22 @@ class RecurrentGradientAlgorithm {
 public:
   void Init(std::unique_ptr<rnn::Argument> arg) { arg_ = std::move(arg); }
 
-  void Run(const Scope& scope, const platform::DeviceContext& dev_ctx) const;
+  void Run(const framework::Scope& scope,
+           const platform::DeviceContext& dev_ctx) const;
 
-  void LinkBootMemoryGradients(Scope* step_scopes, bool infer_shape_mode) const;
+  void LinkBootMemoryGradients(framework::Scope* step_scopes,
+                               bool infer_shape_mode) const;
 
   /**
    * InferShape must be called before Run.
    */
-  void InferShape(const Scope& scope) const;
+  void InferShape(const framework::Scope& scope) const;
 
 protected:
-  inline const std::vector<Scope*>& GetStepScopes(const Scope& scope) const {
-    return *scope.FindVar(arg_->step_scopes)->GetMutable<std::vector<Scope*>>();
+  inline const std::vector<framework::Scope*>& GetStepScopes(
+      const framework::Scope& scope) const {
+    return *scope.FindVar(arg_->step_scopes)
+                ->GetMutable<std::vector<framework::Scope*>>();
   }
 
 private:
@@ -163,16 +170,18 @@ private:
   mutable size_t seq_len_;
 };
 
-class RecurrentOp final : public OperatorBase {
+class RecurrentOp final : public framework::OperatorBase {
 public:
   void Init() override;
 
   /**
    * InferShape must be called before Run.
    */
-  void InferShape(const Scope& scope) const override { alg_.InferShape(scope); }
+  void InferShape(const framework::Scope& scope) const override {
+    alg_.InferShape(scope);
+  }
 
-  void Run(const Scope& scope,
+  void Run(const framework::Scope& scope,
            const platform::DeviceContext& dev_ctx) const override {
     alg_.Run(scope, dev_ctx);
   }
@@ -183,16 +192,18 @@ private:
   RecurrentAlgorithm alg_;
 };
 
-class RecurrentGradientOp final : public OperatorBase {
+class RecurrentGradientOp final : public framework::OperatorBase {
 public:
   void Init() override;
 
   /**
    * InferShape must be called before Run.
    */
-  void InferShape(const Scope& scope) const override { alg_.InferShape(scope); }
+  void InferShape(const framework::Scope& scope) const override {
+    alg_.InferShape(scope);
+  }
 
-  void Run(const Scope& scope,
+  void Run(const framework::Scope& scope,
            const platform::DeviceContext& dev_ctx) const override {
     alg_.Run(scope, dev_ctx);
   }
diff --git a/paddle/operators/recurrent_op_test.cc b/paddle/operators/recurrent_op_test.cc
index 08a6d9fe56..f450167c83 100644
--- a/paddle/operators/recurrent_op_test.cc
+++ b/paddle/operators/recurrent_op_test.cc
@@ -16,6 +16,7 @@
 #include <glog/logging.h>
 #include <gtest/gtest.h>
 
+#include "paddle/framework/ddim.h"
 #include "paddle/framework/op_registry.h"
 #include "paddle/framework/operator.h"
 #include "paddle/framework/tensor.h"
@@ -24,6 +25,9 @@
 namespace paddle {
 namespace operators {
 
+using framework::make_ddim;
+using framework::DDim;
+
 class RecurrentOpTest : public ::testing::Test {
 protected:
   virtual void SetUp() override {
@@ -72,7 +76,7 @@ protected:
   }
 
   void CreateRNNOp() {
-    OpDesc op_desc;
+    framework::OpDesc op_desc;
 
     op_desc.set_type("recurrent_op");
     // inlinks 0

From 9620df4464947b8f0e78a169a0afb1243c86493a Mon Sep 17 00:00:00 2001
From: Yi Wang <yi.wang.2005@gmail.com>
Date: Fri, 4 Aug 2017 17:55:32 -0700
Subject: [PATCH 35/36] Reformat paddle/operators/* strictly following Google
 Style Guide

---
 paddle/operators/.clang-format         |   5 +
 paddle/operators/add_op.cc             |   6 +-
 paddle/operators/add_op.h              |   2 +-
 paddle/operators/cross_entropy_op.cc   |   7 +-
 paddle/operators/cross_entropy_op.h    |   2 +-
 paddle/operators/fc_op.cc              |  14 ++-
 paddle/operators/fill_zeros_like_op.cc |   7 +-
 paddle/operators/fill_zeros_like_op.h  |   2 +-
 paddle/operators/mean_op.cc            |   6 +-
 paddle/operators/mean_op.h             |   4 +-
 paddle/operators/mul_op.cc             |   6 +-
 paddle/operators/mul_op.h              |   2 +-
 paddle/operators/net_op.h              |   4 +-
 paddle/operators/net_op_test.cc        |   4 +-
 paddle/operators/recurrent_op.cc       | 131 ++++++++++---------------
 paddle/operators/recurrent_op.h        |  32 +++---
 paddle/operators/recurrent_op_test.cc  |  22 ++---
 paddle/operators/rowwise_add_op.cc     |   4 +-
 paddle/operators/rowwise_add_op.h      |   2 +-
 paddle/operators/sgd_op.cc             |   4 +-
 paddle/operators/sgd_op.h              |   2 +-
 paddle/operators/sigmoid_op.cc         |   6 +-
 paddle/operators/sigmoid_op.h          |   2 +-
 paddle/operators/softmax_op.cc         |   6 +-
 paddle/operators/softmax_op.h          |   4 +-
 paddle/operators/type_alias.h          |  13 +--
 26 files changed, 129 insertions(+), 170 deletions(-)
 create mode 100644 paddle/operators/.clang-format

diff --git a/paddle/operators/.clang-format b/paddle/operators/.clang-format
new file mode 100644
index 0000000000..47b8a85206
--- /dev/null
+++ b/paddle/operators/.clang-format
@@ -0,0 +1,5 @@
+---
+Language:        Cpp
+BasedOnStyle:  Google
+Standard:  Cpp11
+...
diff --git a/paddle/operators/add_op.cc b/paddle/operators/add_op.cc
index 85269a5f74..7fbdd84a39 100644
--- a/paddle/operators/add_op.cc
+++ b/paddle/operators/add_op.cc
@@ -18,7 +18,7 @@ namespace paddle {
 namespace operators {
 
 class AddOp : public OperatorWithKernel {
-protected:
+ protected:
   void InferShape(const InferShapeContext &ctx) const override {
     PADDLE_ENFORCE(ctx.InputSize() == 2, "Input size of AddOp must be two");
     PADDLE_ENFORCE(ctx.OutputSize() == 1, "Output size of AddOp must be one");
@@ -33,7 +33,7 @@ protected:
 };
 
 class AddOpMaker : public OpProtoAndCheckerMaker {
-public:
+ public:
   AddOpMaker(OpProto *proto, OpAttrChecker *op_checker)
       : OpProtoAndCheckerMaker(proto, op_checker) {
     AddInput("X", "The first input of add op");
@@ -48,7 +48,7 @@ The equation is: Out = X + Y
 };
 
 class AddOpGrad : public OperatorWithKernel {
-protected:
+ protected:
   void InferShape(const InferShapeContext &ctx) const override {}
 };
 
diff --git a/paddle/operators/add_op.h b/paddle/operators/add_op.h
index 54d2231425..9db19a6138 100644
--- a/paddle/operators/add_op.h
+++ b/paddle/operators/add_op.h
@@ -20,7 +20,7 @@ namespace operators {
 
 template <typename Place, typename T>
 class AddKernel : public OpKernel {
-public:
+ public:
   void Compute(const ExecutionContext& context) const override {
     auto input0 = context.Input<Tensor>(0);
     auto input1 = context.Input<Tensor>(1);
diff --git a/paddle/operators/cross_entropy_op.cc b/paddle/operators/cross_entropy_op.cc
index 4f5b935fde..4cf4e8e2be 100644
--- a/paddle/operators/cross_entropy_op.cc
+++ b/paddle/operators/cross_entropy_op.cc
@@ -18,7 +18,7 @@ namespace paddle {
 namespace operators {
 
 class OnehotCrossEntropyOp : public OperatorWithKernel {
-protected:
+ protected:
   void InferShape(const InferShapeContext &ctx) const override {
     PADDLE_ENFORCE(ctx.InputSize() == 2,
                    "Input size of OnehotCrossEntropyOp must be two");
@@ -37,7 +37,7 @@ protected:
 };
 
 class OnehotCrossEntropyOpMaker : public OpProtoAndCheckerMaker {
-public:
+ public:
   OnehotCrossEntropyOpMaker(OpProto *proto, OpAttrChecker *op_checker)
       : OpProtoAndCheckerMaker(proto, op_checker) {
     AddInput("X", "The first input of OnehotCrossEntropyOp");
@@ -54,8 +54,7 @@ OnehotCrossEntropy Operator.
 }  // namespace operators
 }  // namespace paddle
 
-REGISTER_OP(onehot_cross_entropy,
-            ops::OnehotCrossEntropyOp,
+REGISTER_OP(onehot_cross_entropy, ops::OnehotCrossEntropyOp,
             ops::OnehotCrossEntropyOpMaker);
 REGISTER_OP_CPU_KERNEL(onehot_cross_entropy,
                        ops::OnehotCrossEntropyOpKernel<ops::CPUPlace, float>);
diff --git a/paddle/operators/cross_entropy_op.h b/paddle/operators/cross_entropy_op.h
index c3a3728149..7f7fb8d269 100644
--- a/paddle/operators/cross_entropy_op.h
+++ b/paddle/operators/cross_entropy_op.h
@@ -20,7 +20,7 @@ namespace operators {
 
 template <typename Place, typename T>
 class OnehotCrossEntropyOpKernel : public OpKernel {
-public:
+ public:
   constexpr T LOG_THRESHOLD() const { return static_cast<T>(1e-20); }
 
   void Compute(const ExecutionContext& ctx) const override {
diff --git a/paddle/operators/fc_op.cc b/paddle/operators/fc_op.cc
index bd2c70c038..b5cf236bac 100644
--- a/paddle/operators/fc_op.cc
+++ b/paddle/operators/fc_op.cc
@@ -18,31 +18,29 @@ namespace paddle {
 namespace operators {
 
 class FullyConnectedOp : public NetOp {
-public:
+ public:
   void Init() override {
     AddOp(OpRegistry::CreateOp("mul",
                                {
                                    Input("X"), Input("W"),
                                },
-                               {Output("before_act")},
-                               {}));
+                               {Output("before_act")}, {}));
     auto b = Input("b");
     if (b != framework::kEmptyVarName) {
       AddOp(OpRegistry::CreateOp("rowwise_add",
                                  {Output("before_act"), Input("b")},
-                                 {Output("before_act")},
-                                 {}));
+                                 {Output("before_act")}, {}));
     }
 
     auto activation = GetAttr<std::string>("activation");
-    AddOp(OpRegistry::CreateOp(
-        activation, {Output("before_act")}, {Output("Y")}, {}));
+    AddOp(OpRegistry::CreateOp(activation, {Output("before_act")},
+                               {Output("Y")}, {}));
     CompleteAddOp(false);
   }
 };
 
 class FullyConnectedOpMaker : public OpProtoAndCheckerMaker {
-public:
+ public:
   FullyConnectedOpMaker(OpProto *proto, OpAttrChecker *op_checker)
       : OpProtoAndCheckerMaker(proto, op_checker) {
     AddInput("X", "the input of fc operator");
diff --git a/paddle/operators/fill_zeros_like_op.cc b/paddle/operators/fill_zeros_like_op.cc
index 79a0e3d7e9..3d37d64c5a 100644
--- a/paddle/operators/fill_zeros_like_op.cc
+++ b/paddle/operators/fill_zeros_like_op.cc
@@ -20,7 +20,7 @@ namespace paddle {
 namespace operators {
 
 class FillZerosLikeOp : public framework::OperatorWithKernel {
-protected:
+ protected:
   void InferShape(const framework::InferShapeContext &ctx) const override {
     PADDLE_ENFORCE(ctx.InputSize() == 1UL,
                    "Input size of FillZerosLikeOp must be one.");
@@ -36,7 +36,7 @@ protected:
 };
 
 class FillZerosLikeOpMaker : public framework::OpProtoAndCheckerMaker {
-public:
+ public:
   FillZerosLikeOpMaker(framework::OpProto *proto,
                        framework::OpAttrChecker *op_checker)
       : framework::OpProtoAndCheckerMaker(proto, op_checker) {
@@ -52,8 +52,7 @@ The output will have the same size with input.
 }  // namespace operators
 }  // namespace paddle
 
-REGISTER_OP(fill_zeros_like,
-            paddle::operators::FillZerosLikeOp,
+REGISTER_OP(fill_zeros_like, paddle::operators::FillZerosLikeOp,
             paddle::operators::FillZerosLikeOpMaker);
 REGISTER_OP_CPU_KERNEL(
     fill_zeros_like,
diff --git a/paddle/operators/fill_zeros_like_op.h b/paddle/operators/fill_zeros_like_op.h
index 05272964ab..4bff1fbfc1 100644
--- a/paddle/operators/fill_zeros_like_op.h
+++ b/paddle/operators/fill_zeros_like_op.h
@@ -22,7 +22,7 @@ namespace operators {
 
 template <typename Place, typename T>
 class FillZerosLikeKernel : public framework::OpKernel {
-public:
+ public:
   void Compute(const framework::ExecutionContext& context) const override {
     auto* output = context.Output<framework::Tensor>(0);
     output->mutable_data<T>(context.GetPlace());
diff --git a/paddle/operators/mean_op.cc b/paddle/operators/mean_op.cc
index aeef0c0eaf..8a4981c7be 100644
--- a/paddle/operators/mean_op.cc
+++ b/paddle/operators/mean_op.cc
@@ -18,7 +18,7 @@ namespace paddle {
 namespace operators {
 
 class MeanOp : public OperatorWithKernel {
-protected:
+ protected:
   void InferShape(const InferShapeContext &ctx) const override {
     PADDLE_ENFORCE(ctx.InputSize() == 1, "Input size of AddOp must be one");
     PADDLE_ENFORCE(ctx.OutputSize() == 1, "Output size of AddOp must be one");
@@ -29,7 +29,7 @@ protected:
 };
 
 class MeanOpMaker : public OpProtoAndCheckerMaker {
-public:
+ public:
   MeanOpMaker(OpProto *proto, OpAttrChecker *op_checker)
       : OpProtoAndCheckerMaker(proto, op_checker) {
     AddInput("X", "The input of mean op");
@@ -39,7 +39,7 @@ public:
 };
 
 class MeanGradOp : public OperatorWithKernel {
-protected:
+ protected:
   void InferShape(const InferShapeContext &ctx) const override {
     ctx.Output<Tensor>("X" + framework::kGradVarSuffix)
         ->Resize(ctx.Input<Tensor>("X")->dims());
diff --git a/paddle/operators/mean_op.h b/paddle/operators/mean_op.h
index 267e6d903e..40a1e2d099 100644
--- a/paddle/operators/mean_op.h
+++ b/paddle/operators/mean_op.h
@@ -20,7 +20,7 @@ namespace operators {
 
 template <typename Place, typename T>
 class MeanKernel : public OpKernel {
-public:
+ public:
   void Compute(const ExecutionContext& context) const override {
     auto input = context.Input<Tensor>(0);
     auto output = context.Output<Tensor>(0);
@@ -37,7 +37,7 @@ public:
 
 template <typename Place, typename T>
 class MeanGradKernel : public OpKernel {
-public:
+ public:
   void Compute(const ExecutionContext& context) const override {
     auto OG = context.Input<Tensor>("Out" + framework::kGradVarSuffix);
     PADDLE_ENFORCE(framework::product(OG->dims()) == 1,
diff --git a/paddle/operators/mul_op.cc b/paddle/operators/mul_op.cc
index d127f3a302..f41e95e9db 100644
--- a/paddle/operators/mul_op.cc
+++ b/paddle/operators/mul_op.cc
@@ -18,7 +18,7 @@ namespace paddle {
 namespace operators {
 
 class MulOp : public OperatorWithKernel {
-protected:
+ protected:
   void InferShape(const InferShapeContext &ctx) const override {
     PADDLE_ENFORCE(ctx.InputSize() == 2, "The mul op must take two inputs");
     auto dim0 = ctx.Input<Tensor>(0)->dims();
@@ -34,7 +34,7 @@ protected:
 };
 
 class MulOpMaker : public OpProtoAndCheckerMaker {
-public:
+ public:
   MulOpMaker(OpProto *proto, OpAttrChecker *op_checker)
       : OpProtoAndCheckerMaker(proto, op_checker) {
     AddInput("X", "The first input of mul op");
@@ -49,7 +49,7 @@ The equation is: Out = X * Y
 };
 
 class MulOpGrad : public OperatorWithKernel {
-protected:
+ protected:
   void InferShape(const InferShapeContext &ctx) const override {}
   std::string DebugString() const override {
     LOG(INFO) << "MulGrad";
diff --git a/paddle/operators/mul_op.h b/paddle/operators/mul_op.h
index c7b78ad390..7ecd6e8ac0 100644
--- a/paddle/operators/mul_op.h
+++ b/paddle/operators/mul_op.h
@@ -21,7 +21,7 @@ namespace operators {
 
 template <typename Place, typename T>
 class MulKernel : public OpKernel {
-public:
+ public:
   void Compute(const ExecutionContext& context) const override {
     Eigen::array<Eigen::IndexPair<Eigen::DenseIndex>, 1> dim_pair = {
         {Eigen::IndexPair<Eigen::DenseIndex>(1, 0)}};
diff --git a/paddle/operators/net_op.h b/paddle/operators/net_op.h
index 13611e1ee8..6e7af7f02a 100644
--- a/paddle/operators/net_op.h
+++ b/paddle/operators/net_op.h
@@ -40,7 +40,7 @@ namespace operators {
  * it defines.
  */
 class NetOp : public framework::OperatorBase {
-public:
+ public:
   /**
    * Infer all the operators' input and output variables' shapes, will be called
    * before every mini-batch
@@ -90,7 +90,7 @@ public:
 
   std::vector<std::shared_ptr<OperatorBase>> ops_;
 
-private:
+ private:
   bool add_op_done_{false};
 
   template <typename T, typename KeyType>
diff --git a/paddle/operators/net_op_test.cc b/paddle/operators/net_op_test.cc
index 18c5c60eb4..c0a345464a 100644
--- a/paddle/operators/net_op_test.cc
+++ b/paddle/operators/net_op_test.cc
@@ -12,7 +12,7 @@ static int infer_shape_cnt = 0;
 static int run_cnt = 0;
 
 class TestOp : public OperatorBase {
-public:
+ public:
   void InferShape(const framework::Scope& scope) const override {
     ++infer_shape_cnt;
   }
@@ -23,7 +23,7 @@ public:
 };
 
 class EmptyOp : public OperatorBase {
-public:
+ public:
   void InferShape(const Scope& scope) const override {}
   void Run(const Scope& scope,
            const platform::DeviceContext& dev_ctx) const override {}
diff --git a/paddle/operators/recurrent_op.cc b/paddle/operators/recurrent_op.cc
index 2fdaaaf05c..9270a0eaa4 100644
--- a/paddle/operators/recurrent_op.cc
+++ b/paddle/operators/recurrent_op.cc
@@ -28,14 +28,12 @@ namespace operators {
 namespace rnn {
 
 void SegmentInputs(const std::vector<Scope*>& step_scopes,
-                   const std::vector<Link>& inlinks,
-                   const size_t seq_len,
+                   const std::vector<Link>& inlinks, const size_t seq_len,
                    bool infer_shape_mode) {
   PADDLE_ENFORCE(!inlinks.empty(), "no in links are provided.");
   for (size_t i = 0; i < inlinks.size(); ++i) {
     auto input_var = step_scopes[0]->FindVar(inlinks[i].external);
-    PADDLE_ENFORCE(input_var != nullptr,
-                   "input link [%s] is not in scope.",
+    PADDLE_ENFORCE(input_var != nullptr, "input link [%s] is not in scope.",
                    inlinks[i].external);
     Tensor* input = input_var->GetMutable<Tensor>();
     framework::DDim dims = input->dims();
@@ -54,13 +52,11 @@ void SegmentInputs(const std::vector<Scope*>& step_scopes,
 }
 
 void ConcatOutputs(const std::vector<Scope*>& step_scopes,
-                   const std::vector<Link>& outlinks,
-                   const size_t seq_len,
+                   const std::vector<Link>& outlinks, const size_t seq_len,
                    bool infer_shape_mode) {
   for (size_t i = 0; i < outlinks.size(); i++) {
     auto output_var = step_scopes[0]->FindVar(outlinks[i].external);
-    PADDLE_ENFORCE(output_var != nullptr,
-                   "output link [%s] is not in scope.",
+    PADDLE_ENFORCE(output_var != nullptr, "output link [%s] is not in scope.",
                    outlinks[i].external);
     Tensor* output = output_var->GetMutable<Tensor>();
     if (infer_shape_mode) {
@@ -87,22 +83,16 @@ void ConcatOutputs(const std::vector<Scope*>& step_scopes,
 
 void LinkMemories(const std::vector<Scope*>& scopes,
                   const std::vector<rnn::MemoryAttr>& memories,
-                  const size_t step_id,
-                  const int offset,
+                  const size_t step_id, const int offset,
                   bool infer_shape_mode) {
   PADDLE_ENFORCE(step_id < scopes.size(),
-                 "step [%d] is out of range of step scopes' size [%d]",
-                 step_id,
+                 "step [%d] is out of range of step scopes' size [%d]", step_id,
                  scopes.size());
   PADDLE_ENFORCE(static_cast<int>(step_id) + offset >= 0,
-                 "offset [%d] must be large than -[%d]",
-                 offset,
-                 step_id);
+                 "offset [%d] must be large than -[%d]", offset, step_id);
   PADDLE_ENFORCE(step_id + offset < scopes.size(),
                  "offset [%d] is out of range, it must be less than (%d - %d)",
-                 offset,
-                 scopes.size(),
-                 step_id);
+                 offset, scopes.size(), step_id);
   auto scope = scopes[step_id];
   auto linked_scope = scopes[step_id + offset];
   for (auto& attr : memories) {
@@ -116,8 +106,7 @@ void LinkMemories(const std::vector<Scope*>& scopes,
   }
 }
 
-void InitArgument(const ArgumentName& name,
-                  Argument* arg,
+void InitArgument(const ArgumentName& name, Argument* arg,
                   const OperatorBase& op) {
   arg->step_net = op.Input(name.step_net);
   arg->step_scopes = op.Output(name.step_scopes);
@@ -126,8 +115,7 @@ void InitArgument(const ArgumentName& name,
   auto inlink_alias = op.GetAttr<std::vector<std::string>>(name.inlink_alias);
   PADDLE_ENFORCE(inlinks.size() == inlink_alias.size(),
                  "the size of inlinks and inlink_alias don't match:%d,%d",
-                 inlinks.size(),
-                 inlink_alias.size());
+                 inlinks.size(), inlink_alias.size());
   for (size_t i = 0; i < inlinks.size(); ++i) {
     rnn::Link link;
     link.external = inlinks[i];
@@ -139,8 +127,7 @@ void InitArgument(const ArgumentName& name,
   auto outlink_alias = op.GetAttr<std::vector<std::string>>(name.outlink_alias);
   PADDLE_ENFORCE(outlinks.size() == outlink_alias.size(),
                  "the size of outlinks and outlink_alias don't match:%d,%d",
-                 outlinks.size(),
-                 outlink_alias.size());
+                 outlinks.size(), outlink_alias.size());
   for (size_t i = 0; i < outlinks.size(); ++i) {
     rnn::Link link;
     link.external = outlinks[i];
@@ -156,12 +143,10 @@ void InitArgument(const ArgumentName& name,
 
   PADDLE_ENFORCE(memories.size() == boot_memories.size(),
                  "the size of memories, boot_memories don't match:%d,%d",
-                 memories.size(),
-                 boot_memories.size());
+                 memories.size(), boot_memories.size());
   PADDLE_ENFORCE(pre_memories.size() == boot_memories.size(),
                  "the size of pre_memories, boot_memories don't match:%d,%d",
-                 pre_memories.size(),
-                 boot_memories.size());
+                 pre_memories.size(), boot_memories.size());
   PADDLE_ENFORCE(memories.size() > 0, "more than 1 memories should be set");
 
   for (size_t i = 0; i < memories.size(); ++i) {
@@ -181,39 +166,39 @@ void RecurrentAlgorithm::InferShape(const Scope& scope) const {
                  ->dims()[0];
   CreateScopes(scope);
   auto step_scopes = GetStepScopes(scope);
-  rnn::SegmentInputs(
-      step_scopes, arg_->inlinks, seq_len_, true /*infer_shape_mode*/);
+  rnn::SegmentInputs(step_scopes, arg_->inlinks, seq_len_,
+                     true /*infer_shape_mode*/);
   InitMemories(step_scopes[0], true /*infer_shape_mode*/);
   Variable* net = scope.FindVar(arg_->step_net);
   PADDLE_ENFORCE(net != nullptr, "failed to get step net");
   for (size_t i = 0; i < seq_len_; i++) {
     if (i > 0) {
-      rnn::LinkMemories(
-          step_scopes, arg_->memories, i, -1, true /*infer_shape_mode*/);
+      rnn::LinkMemories(step_scopes, arg_->memories, i, -1,
+                        true /*infer_shape_mode*/);
     }
     net->GetMutable<NetOp>()->InferShape(*step_scopes[i]);
   }
-  rnn::ConcatOutputs(
-      step_scopes, arg_->outlinks, seq_len_, true /*infer_shape_mode*/);
+  rnn::ConcatOutputs(step_scopes, arg_->outlinks, seq_len_,
+                     true /*infer_shape_mode*/);
 }
 
 void RecurrentAlgorithm::Run(const Scope& scope,
                              const platform::DeviceContext& dev_ctx) const {
   auto step_scopes = GetStepScopes(scope);
-  rnn::SegmentInputs(
-      step_scopes, arg_->inlinks, seq_len_, false /*infer_shape_mode*/);
+  rnn::SegmentInputs(step_scopes, arg_->inlinks, seq_len_,
+                     false /*infer_shape_mode*/);
   InitMemories(step_scopes[0], false /*infer_shape_mode*/);
   Variable* net = scope.FindVar(arg_->step_net);
 
   for (size_t step_id = 0; step_id < seq_len_; step_id++) {
     if (step_id > 0) {
-      rnn::LinkMemories(
-          step_scopes, arg_->memories, step_id, -1, false /*infer_shape_mode*/);
+      rnn::LinkMemories(step_scopes, arg_->memories, step_id, -1,
+                        false /*infer_shape_mode*/);
     }
     net->GetMutable<NetOp>()->Run(*step_scopes[step_id], dev_ctx);
   }
-  rnn::ConcatOutputs(
-      step_scopes, arg_->outlinks, seq_len_, false /*infer_shape_mode*/);
+  rnn::ConcatOutputs(step_scopes, arg_->outlinks, seq_len_,
+                     false /*infer_shape_mode*/);
 }
 
 void RecurrentAlgorithm::CreateScopes(const Scope& scope) const {
@@ -245,8 +230,7 @@ void RecurrentAlgorithm::InitMemories(Scope* step_scope,
   for (auto& attr : arg_->memories) {
     Tensor* pre_mem = step_scope->NewVar(attr.pre_var)->GetMutable<Tensor>();
     PADDLE_ENFORCE(step_scope->FindVar(attr.boot_var) != nullptr,
-                   "memory [%s]'s boot variable [%s] not exists",
-                   attr.var,
+                   "memory [%s]'s boot variable [%s] not exists", attr.var,
                    attr.boot_var);
     Tensor* boot_mem = step_scope->FindVar(attr.boot_var)->GetMutable<Tensor>();
     if (infer_shape_mode) {
@@ -257,25 +241,15 @@ void RecurrentAlgorithm::InitMemories(Scope* step_scope,
   }
 }
 
-const rnn::ArgumentName RecurrentOp::kArgName{"step_net",
-                                              "step_scopes",
-                                              "inlinks",
-                                              "outlinks",
-                                              "inlink_alias",
-                                              "outlink_alias",
-                                              "memories",
-                                              "pre_memories",
-                                              "boot_memories"};
-
-const rnn::ArgumentName RecurrentGradientOp::kArgName{"step_net",
-                                                      "step_scopes",
-                                                      "outlink@grad",
-                                                      "inlink@grad",
-                                                      "inlink_alias",
-                                                      "outlink_alias",
-                                                      "memories",
-                                                      "pre_memories",
-                                                      "boot_memories@grad"};
+const rnn::ArgumentName RecurrentOp::kArgName{
+    "step_net", "step_scopes",  "inlinks",
+    "outlinks", "inlink_alias", "outlink_alias",
+    "memories", "pre_memories", "boot_memories"};
+
+const rnn::ArgumentName RecurrentGradientOp::kArgName{
+    "step_net",    "step_scopes",  "outlink@grad",
+    "inlink@grad", "inlink_alias", "outlink_alias",
+    "memories",    "pre_memories", "boot_memories@grad"};
 
 void RecurrentOp::Init() {
   OperatorBase::Init();
@@ -285,7 +259,7 @@ void RecurrentOp::Init() {
 }
 
 class RecurrentAlgorithmProtoAndCheckerMaker : public OpProtoAndCheckerMaker {
-public:
+ public:
   RecurrentAlgorithmProtoAndCheckerMaker(OpProto* proto,
                                          OpAttrChecker* op_checker)
       : OpProtoAndCheckerMaker(proto, op_checker) {
@@ -316,31 +290,29 @@ public:
 void RecurrentGradientAlgorithm::Run(
     const Scope& scope, const platform::DeviceContext& dev_ctx) const {
   auto step_scopes = GetStepScopes(scope);
-  rnn::SegmentInputs(
-      step_scopes, arg_->inlinks, seq_len_, false /*infer_shape_mode*/);
+  rnn::SegmentInputs(step_scopes, arg_->inlinks, seq_len_,
+                     false /*infer_shape_mode*/);
   Variable* net = scope.FindVar(arg_->step_net);
   PADDLE_ENFORCE(net != nullptr, "failed to get step net");
   for (int step_id = seq_len_ - 1; step_id >= 0; --step_id) {
     if (static_cast<size_t>(step_id) != seq_len_ - 1) {
-      rnn::LinkMemories(
-          step_scopes, arg_->memories, step_id, 1, false /*infer_shape_mode*/);
+      rnn::LinkMemories(step_scopes, arg_->memories, step_id, 1,
+                        false /*infer_shape_mode*/);
     }
     net->GetMutable<NetOp>()->Run(*step_scopes[step_id], dev_ctx);
   }
   LinkBootMemoryGradients(step_scopes[0], false);
-  rnn::ConcatOutputs(
-      step_scopes, arg_->outlinks, seq_len_, false /*infer_shape_mode*/);
+  rnn::ConcatOutputs(step_scopes, arg_->outlinks, seq_len_,
+                     false /*infer_shape_mode*/);
 }
 
 void RecurrentGradientAlgorithm::LinkBootMemoryGradients(
     Scope* step_scope, bool infer_shape_mode) const {
   for (auto& attr : arg_->memories) {
     PADDLE_ENFORCE(step_scope->FindVar(attr.var) != nullptr,
-                   "memory variable [%s] does not exists",
-                   attr.var);
+                   "memory variable [%s] does not exists", attr.var);
     PADDLE_ENFORCE(step_scope->FindVar(attr.boot_var) != nullptr,
-                   "boot variable [%s] does not exists",
-                   attr.boot_var);
+                   "boot variable [%s] does not exists", attr.boot_var);
     Tensor* mem_grad = step_scope->NewVar(attr.var)->GetMutable<Tensor>();
     Tensor* boot_mem_grad =
         step_scope->NewVar(attr.boot_var)->GetMutable<Tensor>();
@@ -357,19 +329,19 @@ void RecurrentGradientAlgorithm::InferShape(const Scope& scope) const {
                  ->GetMutable<Tensor>()
                  ->dims()[0];
   auto step_scopes = GetStepScopes(scope);
-  rnn::SegmentInputs(
-      step_scopes, arg_->inlinks, seq_len_, true /*infer_shape_mode*/);
+  rnn::SegmentInputs(step_scopes, arg_->inlinks, seq_len_,
+                     true /*infer_shape_mode*/);
   Variable* net = scope.FindVar(arg_->step_net);
   PADDLE_ENFORCE(net != nullptr, "failed to get step net");
   for (int step_id = seq_len_ - 1; step_id >= 0; --step_id) {
     if (static_cast<size_t>(step_id) != seq_len_ - 1) {
-      rnn::LinkMemories(
-          step_scopes, arg_->memories, step_id, 1, true /*infer_shape_mode*/);
+      rnn::LinkMemories(step_scopes, arg_->memories, step_id, 1,
+                        true /*infer_shape_mode*/);
     }
     net->GetMutable<NetOp>()->InferShape(*step_scopes[step_id]);
   }
-  rnn::ConcatOutputs(
-      step_scopes, arg_->outlinks, seq_len_, true /*infer_shape_mode*/);
+  rnn::ConcatOutputs(step_scopes, arg_->outlinks, seq_len_,
+                     true /*infer_shape_mode*/);
   LinkBootMemoryGradients(step_scopes[0], true /*infer_shape_mode*/);
 }
 
@@ -383,6 +355,5 @@ void RecurrentGradientOp::Init() {
 }  // namespace operators
 }  // namespace paddle
 
-REGISTER_OP(recurrent_op,
-            paddle::operators::RecurrentOp,
+REGISTER_OP(recurrent_op, paddle::operators::RecurrentOp,
             paddle::operators::RecurrentAlgorithmProtoAndCheckerMaker);
diff --git a/paddle/operators/recurrent_op.h b/paddle/operators/recurrent_op.h
index c5931773d1..510ba41667 100644
--- a/paddle/operators/recurrent_op.h
+++ b/paddle/operators/recurrent_op.h
@@ -69,23 +69,19 @@ struct ArgumentName {
  * Prepare inputs for each step net.
  */
 void SegmentInputs(const std::vector<framework::Scope*>& step_scopes,
-                   const std::vector<Link>& inlinks,
-                   const size_t seq_len,
+                   const std::vector<Link>& inlinks, const size_t seq_len,
                    bool infer_shape_mode);
 
 /**
  * Process outputs of step nets and merge to variables.
  */
 void ConcatOutputs(const std::vector<framework::Scope*>& step_scopes,
-                   const std::vector<Link>& outlinks,
-                   const size_t seq_len,
+                   const std::vector<Link>& outlinks, const size_t seq_len,
                    bool infer_shape_mode);
 
 void LinkMemories(const std::vector<framework::Scope*>& step_scopes,
-                  const std::vector<MemoryAttr>& memories,
-                  const size_t step_id,
-                  const int offset,
-                  bool infer_shape_mode);
+                  const std::vector<MemoryAttr>& memories, const size_t step_id,
+                  const int offset, bool infer_shape_mode);
 
 void InitArgument(const ArgumentName& name, Argument* arg);
 
@@ -100,7 +96,7 @@ void InitArgument(const ArgumentName& name, Argument* arg);
 //    Refer to: https://arxiv.org/pdf/1502.02367.pdf
 
 class RecurrentAlgorithm {
-public:
+ public:
   void Run(const framework::Scope& scope,
            const platform::DeviceContext& dev_ctx) const;
 
@@ -111,7 +107,7 @@ public:
    */
   void InferShape(const framework::Scope& scope) const;
 
-protected:
+ protected:
   /*
    * The step scopes will be stored in the father scope as a variable.
    *
@@ -128,7 +124,7 @@ protected:
 
   void InitMemories(framework::Scope* step_scopes, bool infer_shape_mode) const;
 
-private:
+ private:
   std::unique_ptr<rnn::Argument> arg_;
   mutable size_t seq_len_;
 };
@@ -144,7 +140,7 @@ class RecurrentGradientAlgorithm {
    * lot, and the latter is a wrapper acts like an dapter for it to make RNN an
    * operator.
    */
-public:
+ public:
   void Init(std::unique_ptr<rnn::Argument> arg) { arg_ = std::move(arg); }
 
   void Run(const framework::Scope& scope,
@@ -158,20 +154,20 @@ public:
    */
   void InferShape(const framework::Scope& scope) const;
 
-protected:
+ protected:
   inline const std::vector<framework::Scope*>& GetStepScopes(
       const framework::Scope& scope) const {
     return *scope.FindVar(arg_->step_scopes)
                 ->GetMutable<std::vector<framework::Scope*>>();
   }
 
-private:
+ private:
   std::unique_ptr<rnn::Argument> arg_;
   mutable size_t seq_len_;
 };
 
 class RecurrentOp final : public framework::OperatorBase {
-public:
+ public:
   void Init() override;
 
   /**
@@ -188,12 +184,12 @@ public:
 
   static const rnn::ArgumentName kArgName;
 
-private:
+ private:
   RecurrentAlgorithm alg_;
 };
 
 class RecurrentGradientOp final : public framework::OperatorBase {
-public:
+ public:
   void Init() override;
 
   /**
@@ -210,7 +206,7 @@ public:
 
   static const rnn::ArgumentName kArgName;
 
-private:
+ private:
   RecurrentGradientAlgorithm alg_;
 };
 
diff --git a/paddle/operators/recurrent_op_test.cc b/paddle/operators/recurrent_op_test.cc
index f450167c83..409ebd2506 100644
--- a/paddle/operators/recurrent_op_test.cc
+++ b/paddle/operators/recurrent_op_test.cc
@@ -29,7 +29,7 @@ using framework::make_ddim;
 using framework::DDim;
 
 class RecurrentOpTest : public ::testing::Test {
-protected:
+ protected:
   virtual void SetUp() override {
     CreateGlobalVariables();
     CreateStepNet();
@@ -174,7 +174,7 @@ TEST_F(RecurrentOpTest, Run) {
 }
 
 class RecurrentGradientAlgorithmTest : public ::testing::Test {
-protected:
+ protected:
   virtual void SetUp() override {
     CreateGlobalVariables();
     CreateStepScopes();
@@ -277,13 +277,11 @@ protected:
     LOG(INFO) << "create variable step_net";
     Variable* var = scope_.NewVar("step_net");
     auto net = var->GetMutable<NetOp>();
-    net->AddOp(OpRegistry::CreateOp("mul",
-                                    {"rnn/h_pre", "rnn/w", "rnn/s_grad"},
-                                    {"rnn/h_pre_grad", "rnn/w_grad"},
-                                    {}));
+    net->AddOp(OpRegistry::CreateOp("mul", {"rnn/h_pre", "rnn/w", "rnn/s_grad"},
+                                    {"rnn/h_pre_grad", "rnn/w_grad"}, {}));
 
-    net->AddOp(OpRegistry::CreateOp(
-        "add_two", {"rnn/h_grad"}, {"rnn/x_grad", "rnn/s_grad"}, {}));
+    net->AddOp(OpRegistry::CreateOp("add_two", {"rnn/h_grad"},
+                                    {"rnn/x_grad", "rnn/s_grad"}, {}));
     net->CompleteAddOp();
   }
 
@@ -297,9 +295,7 @@ protected:
     inlink.internal = "rnn/x";
     auto step_scopes =
         scope_.FindVar("step_scopes")->GetMutable<std::vector<Scope*>>();
-    rnn::SegmentInputs(*step_scopes,
-                       std::vector<rnn::Link>{inlink},
-                       10,
+    rnn::SegmentInputs(*step_scopes, std::vector<rnn::Link>{inlink}, 10,
                        true /*infer_shape_mode*/);
   }
 
@@ -314,8 +310,8 @@ protected:
     auto step_scopes =
         scope_.FindVar("step_scopes")->GetMutable<std::vector<Scope*>>();
     for (int i = 1; i < 10; ++i) {
-      rnn::LinkMemories(
-          *step_scopes, memories, i, -1, true /*infer_shape_mode*/);
+      rnn::LinkMemories(*step_scopes, memories, i, -1,
+                        true /*infer_shape_mode*/);
     }
   }
 
diff --git a/paddle/operators/rowwise_add_op.cc b/paddle/operators/rowwise_add_op.cc
index 2ad2b66c8f..8d1a36f2b3 100644
--- a/paddle/operators/rowwise_add_op.cc
+++ b/paddle/operators/rowwise_add_op.cc
@@ -17,7 +17,7 @@ namespace paddle {
 namespace operators {
 
 class RowWiseAddOp : public OperatorWithKernel {
-protected:
+ protected:
   void InferShape(const InferShapeContext &ctx) const override {
     PADDLE_ENFORCE(ctx.InputSize() == 2UL,
                    "Two inputs is needed by rowwise add");
@@ -33,7 +33,7 @@ protected:
 };
 
 class RowWiseAddOpMaker : public OpProtoAndCheckerMaker {
-public:
+ public:
   RowWiseAddOpMaker(OpProto *proto, OpAttrChecker *op_checker)
       : OpProtoAndCheckerMaker(proto, op_checker) {
     AddInput("X", "The left input of row-wise add op, must be matrix");
diff --git a/paddle/operators/rowwise_add_op.h b/paddle/operators/rowwise_add_op.h
index bd4d112895..b52524c47c 100644
--- a/paddle/operators/rowwise_add_op.h
+++ b/paddle/operators/rowwise_add_op.h
@@ -20,7 +20,7 @@ namespace operators {
 
 template <typename Place, typename T>
 class RowWiseAddKernel : public OpKernel {
-public:
+ public:
   void Compute(const ExecutionContext& context) const override {
     auto out = context.Output<Tensor>(0);
     out->mutable_data<T>(context.GetPlace());
diff --git a/paddle/operators/sgd_op.cc b/paddle/operators/sgd_op.cc
index 9a84dc8af3..6307583f4e 100644
--- a/paddle/operators/sgd_op.cc
+++ b/paddle/operators/sgd_op.cc
@@ -18,7 +18,7 @@ namespace paddle {
 namespace operators {
 
 class SGDOp : public OperatorWithKernel {
-protected:
+ protected:
   void InferShape(const InferShapeContext &ctx) const override {
     PADDLE_ENFORCE(ctx.InputSize() == 2, "Input size of SGDOp must be two");
     PADDLE_ENFORCE(ctx.OutputSize() == 1, "Output size of SGDOp must be one");
@@ -32,7 +32,7 @@ protected:
 };
 
 class SGDOpMaker : public OpProtoAndCheckerMaker {
-public:
+ public:
   SGDOpMaker(OpProto *proto, OpAttrChecker *op_checker)
       : OpProtoAndCheckerMaker(proto, op_checker) {
     AddInput("param", "input parameter");
diff --git a/paddle/operators/sgd_op.h b/paddle/operators/sgd_op.h
index 0c3a240f9a..bf5b195933 100644
--- a/paddle/operators/sgd_op.h
+++ b/paddle/operators/sgd_op.h
@@ -20,7 +20,7 @@ namespace operators {
 
 template <typename Place, typename T>
 class SGDOpKernel : public OpKernel {
-public:
+ public:
   void Compute(const ExecutionContext& ctx) const override {
     auto param = ctx.Input<Tensor>("param");
     auto grad = ctx.Input<Tensor>("grad");
diff --git a/paddle/operators/sigmoid_op.cc b/paddle/operators/sigmoid_op.cc
index a81ab262cc..9d201eb93a 100644
--- a/paddle/operators/sigmoid_op.cc
+++ b/paddle/operators/sigmoid_op.cc
@@ -17,7 +17,7 @@ namespace paddle {
 namespace operators {
 
 class SigmoidOp : public OperatorWithKernel {
-protected:
+ protected:
   void InferShape(const InferShapeContext &ctx) const override {
     PADDLE_ENFORCE(ctx.InputSize() == 1, "Sigmoid Op only have one input");
     PADDLE_ENFORCE(ctx.OutputSize() == 1, "Sigmoid Op only have one output");
@@ -26,7 +26,7 @@ protected:
 };
 
 class SigmoidOpMaker : public OpProtoAndCheckerMaker {
-public:
+ public:
   SigmoidOpMaker(OpProto *proto, OpAttrChecker *op_checker)
       : OpProtoAndCheckerMaker(proto, op_checker) {
     AddInput("X", "sigmoid input");
@@ -36,7 +36,7 @@ public:
 };
 
 class SigmoidOpGrad : public OperatorWithKernel {
-protected:
+ protected:
   void InferShape(const InferShapeContext &ctx) const override {}
   std::string DebugString() const override {
     LOG(INFO) << "SigmoidGrad";
diff --git a/paddle/operators/sigmoid_op.h b/paddle/operators/sigmoid_op.h
index 1412e43984..eb473920a5 100644
--- a/paddle/operators/sigmoid_op.h
+++ b/paddle/operators/sigmoid_op.h
@@ -21,7 +21,7 @@ namespace operators {
 
 template <typename Place, typename T>
 class SigmoidKernel : public OpKernel {
-public:
+ public:
   void Compute(const ExecutionContext& context) const override {
     auto input = context.Input<Tensor>(0);
     auto output = context.Output<Tensor>(0);
diff --git a/paddle/operators/softmax_op.cc b/paddle/operators/softmax_op.cc
index e8bb7032f8..a070458f5e 100644
--- a/paddle/operators/softmax_op.cc
+++ b/paddle/operators/softmax_op.cc
@@ -18,7 +18,7 @@ namespace paddle {
 namespace operators {
 
 class SoftmaxOp : public OperatorWithKernel {
-protected:
+ protected:
   void InferShape(const InferShapeContext &ctx) const override {
     PADDLE_ENFORCE(ctx.InputSize() == 1UL,
                    "Only one input is need for softmax");
@@ -31,7 +31,7 @@ protected:
 };
 
 class SoftmaxOpMaker : public OpProtoAndCheckerMaker {
-public:
+ public:
   SoftmaxOpMaker(OpProto *proto, OpAttrChecker *op_checker)
       : OpProtoAndCheckerMaker(proto, op_checker) {
     AddInput("X", "input of softmax");
@@ -41,7 +41,7 @@ public:
 };
 
 class SoftmaxOpGrad : public OperatorWithKernel {
-protected:
+ protected:
   void InferShape(const InferShapeContext &ctx) const override {
     PADDLE_ENFORCE(ctx.InputSize() == 3UL,
                    "Input of SoftmaxOpGrad should be 3, X, Y, YG");
diff --git a/paddle/operators/softmax_op.h b/paddle/operators/softmax_op.h
index d9f3b2006e..b2dbcf57ed 100644
--- a/paddle/operators/softmax_op.h
+++ b/paddle/operators/softmax_op.h
@@ -24,7 +24,7 @@ namespace operators {
 
 template <typename Place, typename T>
 class SoftmaxKernel : public OpKernel {
-public:
+ public:
   void Compute(const ExecutionContext& context) const override {
     auto input = context.Input<Tensor>("X");
     auto output = context.Output<Tensor>("Y");
@@ -63,7 +63,7 @@ public:
 
 template <typename Place, typename T>
 class SoftmaxGradKernel : public OpKernel {
-public:
+ public:
   void Compute(const ExecutionContext& context) const override {
     std::shared_ptr<Tensor> scale_ = std::make_shared<Tensor>();
 
diff --git a/paddle/operators/type_alias.h b/paddle/operators/type_alias.h
index 931740e150..eac12d35dd 100644
--- a/paddle/operators/type_alias.h
+++ b/paddle/operators/type_alias.h
@@ -26,21 +26,16 @@ using OperatorBase = framework::OperatorBase;
 using InferShapeContext = framework::InferShapeContext;
 using ExecutionContext = framework::ExecutionContext;
 using Variable = framework::Variable;
-template <typename T,
-          int MajorType = Eigen::RowMajor,
+template <typename T, int MajorType = Eigen::RowMajor,
           typename IndexType = Eigen::DenseIndex>
 using EigenScalar = framework::EigenScalar<T, MajorType, IndexType>;
-template <typename T,
-          int MajorType = Eigen::RowMajor,
+template <typename T, int MajorType = Eigen::RowMajor,
           typename IndexType = Eigen::DenseIndex>
 using EigenVector = framework::EigenVector<T, MajorType, IndexType>;
-template <typename T,
-          int MajorType = Eigen::RowMajor,
+template <typename T, int MajorType = Eigen::RowMajor,
           typename IndexType = Eigen::DenseIndex>
 using EigenMatrix = framework::EigenMatrix<T, MajorType, IndexType>;
-template <typename T,
-          size_t D,
-          int MajorType = Eigen::RowMajor,
+template <typename T, size_t D, int MajorType = Eigen::RowMajor,
           typename IndexType = Eigen::DenseIndex>
 using EigenTensor = framework::EigenTensor<T, D, MajorType, IndexType>;
 using Tensor = framework::Tensor;

From b4ebb3c85cecbb4445cd67bf92928aa0b6a86736 Mon Sep 17 00:00:00 2001
From: Yu Yang <yuyang18@baidu.com>
Date: Sat, 5 Aug 2017 11:22:04 +0800
Subject: [PATCH 36/36] Change attr_type_pb2 to attribute_pb2

Make ci pass
---
 .../framework/create_op_creation_methods.py   | 30 ++++++++--------
 .../tests/test_op_creation_methods.py         | 34 +++++++++----------
 .../v2/framework/tests/test_protobuf.py       |  6 ++--
 3 files changed, 34 insertions(+), 36 deletions(-)

diff --git a/python/paddle/v2/framework/create_op_creation_methods.py b/python/paddle/v2/framework/create_op_creation_methods.py
index b034efffb6..6fd33b366b 100644
--- a/python/paddle/v2/framework/create_op_creation_methods.py
+++ b/python/paddle/v2/framework/create_op_creation_methods.py
@@ -1,7 +1,7 @@
 import paddle.v2.framework.core as core
 import paddle.v2.framework.proto.op_proto_pb2 as op_proto_pb2
 import paddle.v2.framework.proto.op_desc_pb2 as op_desc_pb2
-import paddle.v2.framework.proto.attr_type_pb2 as attr_type_pb2
+import paddle.v2.framework.proto.attribute_pb2 as attribute_pb2
 import cStringIO
 
 
@@ -57,7 +57,7 @@ class OpDescCreationMethod(object):
             op_desc.attrs.extend([out_format])
         if len(tmp_index) != 0:
             tmp_index_attr = op_desc.attrs.add()
-            tmp_index_attr.type = attr_type_pb2.INTS
+            tmp_index_attr.type = attribute_pb2.INTS
             tmp_index_attr.name = "temporary_index"
             tmp_index_attr.ints.extend(tmp_index)
 
@@ -73,17 +73,17 @@ class OpDescCreationMethod(object):
                 new_attr = op_desc.attrs.add()
                 new_attr.name = attr.name
                 new_attr.type = attr.type
-                if attr.type == attr_type_pb2.INT:
+                if attr.type == attribute_pb2.INT:
                     new_attr.i = user_defined_attr
-                elif attr.type == attr_type_pb2.FLOAT:
+                elif attr.type == attribute_pb2.FLOAT:
                     new_attr.f = user_defined_attr
-                elif attr.type == attr_type_pb2.STRING:
+                elif attr.type == attribute_pb2.STRING:
                     new_attr.s = user_defined_attr
-                elif attr.type == attr_type_pb2.INTS:
+                elif attr.type == attribute_pb2.INTS:
                     new_attr.ints.extend(user_defined_attr)
-                elif attr.type == attr_type_pb2.FLOATS:
+                elif attr.type == attribute_pb2.FLOATS:
                     new_attr.floats.extend(user_defined_attr)
-                elif attr.type == attr_type_pb2.STRINGS:
+                elif attr.type == attribute_pb2.STRINGS:
                     new_attr.strings.extend(user_defined_attr)
                 else:
                     raise NotImplementedError("Not support attribute type " +
@@ -109,7 +109,7 @@ class OpDescCreationMethod(object):
         retv = []
         if multiple:
             var_format = op_desc_pb2.AttrDesc()
-            var_format.type = attr_type_pb2.INTS
+            var_format.type = attribute_pb2.INTS
             var_format.name = "%s_format" % in_out
             var_format.ints.append(0)
 
@@ -185,17 +185,17 @@ def get_docstring_from_op_proto(op_proto):
 
     for attr in op_proto.attrs:
         attr_type = None
-        if attr.type == attr_type_pb2.INT:
+        if attr.type == attribute_pb2.INT:
             attr_type = "int"
-        elif attr.type == attr_type_pb2.FLOAT:
+        elif attr.type == attribute_pb2.FLOAT:
             attr_type = "float"
-        elif attr.type == attr_type_pb2.STRING:
+        elif attr.type == attribute_pb2.STRING:
             attr_type = "basestr"
-        elif attr.type == attr_type_pb2.INTS:
+        elif attr.type == attribute_pb2.INTS:
             attr_type = "list of int"
-        elif attr.type == attr_type_pb2.FLOATS:
+        elif attr.type == attribute_pb2.FLOATS:
             attr_type = "list of float"
-        elif attr.type == attr_type_pb2.STRINGS:
+        elif attr.type == attribute_pb2.STRINGS:
             attr_type = "list of basestr"
 
         if attr_type is None:
diff --git a/python/paddle/v2/framework/tests/test_op_creation_methods.py b/python/paddle/v2/framework/tests/test_op_creation_methods.py
index 41db7c0d53..1d2ce6d071 100644
--- a/python/paddle/v2/framework/tests/test_op_creation_methods.py
+++ b/python/paddle/v2/framework/tests/test_op_creation_methods.py
@@ -3,7 +3,7 @@ import paddle.v2.framework.create_op_creation_methods as creation
 import paddle.v2.framework.core as core
 import paddle.v2.framework.proto.op_proto_pb2 as op_proto_pb2
 import paddle.v2.framework.proto.op_desc_pb2 as op_desc_pb2
-import paddle.v2.framework.proto.attr_type_pb2 as attr_type_pb2
+import paddle.v2.framework.proto.attribute_pb2 as attribute_pb2
 
 
 class TestGetAllProtos(unittest.TestCase):
@@ -76,7 +76,7 @@ class TestOpDescCreationMethod(unittest.TestCase):
         expected1.type = 'fc'
         attr = expected1.attrs.add()
         attr.name = 'input_format'
-        attr.type = attr_type_pb2.INTS
+        attr.type = attribute_pb2.INTS
         attr.ints.extend([0, 1, 2, 3])
         self.assertEqual(expected1, generated1)
 
@@ -88,7 +88,7 @@ class TestOpDescCreationMethod(unittest.TestCase):
         expected2.type = 'fc'
         attr = expected2.attrs.add()
         attr.name = 'input_format'
-        attr.type = attr_type_pb2.INTS
+        attr.type = attribute_pb2.INTS
         attr.ints.extend([0, 3, 6, 7])
         self.assertEqual(expected2, generated2)
 
@@ -105,12 +105,12 @@ class TestOpDescCreationMethod(unittest.TestCase):
             attr.comment = ""
             attr.type = type
 
-        __add_attr__("int_attr", attr_type_pb2.INT)
-        __add_attr__("float_attr", attr_type_pb2.FLOAT)
-        __add_attr__("string_attr", attr_type_pb2.STRING)
-        __add_attr__("ints_attr", attr_type_pb2.INTS)
-        __add_attr__("floats_attr", attr_type_pb2.FLOATS)
-        __add_attr__("strings_attr", attr_type_pb2.STRINGS)
+        __add_attr__("int_attr", attribute_pb2.INT)
+        __add_attr__("float_attr", attribute_pb2.FLOAT)
+        __add_attr__("string_attr", attribute_pb2.STRING)
+        __add_attr__("ints_attr", attribute_pb2.INTS)
+        __add_attr__("floats_attr", attribute_pb2.FLOATS)
+        __add_attr__("strings_attr", attribute_pb2.STRINGS)
 
         op.comment = ""
         self.assertTrue(op.IsInitialized())
@@ -131,32 +131,32 @@ class TestOpDescCreationMethod(unittest.TestCase):
         expected.inputs.extend(['a'])
         attr = expected.attrs.add()
         attr.name = "int_attr"
-        attr.type = attr_type_pb2.INT
+        attr.type = attribute_pb2.INT
         attr.i = 10
 
         attr = expected.attrs.add()
         attr.name = "float_attr"
-        attr.type = attr_type_pb2.FLOAT
+        attr.type = attribute_pb2.FLOAT
         attr.f = 3.2
 
         attr = expected.attrs.add()
         attr.name = "string_attr"
-        attr.type = attr_type_pb2.STRING
+        attr.type = attribute_pb2.STRING
         attr.s = "test_str"
 
         attr = expected.attrs.add()
         attr.name = "ints_attr"
-        attr.type = attr_type_pb2.INTS
+        attr.type = attribute_pb2.INTS
         attr.ints.extend([0, 1, 2, 3, 4])
 
         attr = expected.attrs.add()
         attr.name = 'floats_attr'
-        attr.type = attr_type_pb2.FLOATS
+        attr.type = attribute_pb2.FLOATS
         attr.floats.extend([0.2, 3.2, 4.5])
 
         attr = expected.attrs.add()
         attr.name = 'strings_attr'
-        attr.type = attr_type_pb2.STRINGS
+        attr.type = attribute_pb2.STRINGS
         attr.strings.extend(['a', 'b', 'c'])
 
         self.assertEqual(expected, generated)
@@ -185,7 +185,7 @@ class TestOpDescCreationMethod(unittest.TestCase):
         desc.type = "test"
         attr = desc.attrs.add()
         attr.name = "temporary_index"
-        attr.type = attr_type_pb2.INTS
+        attr.type = attribute_pb2.INTS
         attr.ints.append(2)
         self.assertEqual(generated, desc)
 
@@ -219,7 +219,7 @@ This op is used for unit test, not a real op.
 
         test_str = op.attrs.add()
         test_str.name = "str_attr"
-        test_str.type = attr_type_pb2.STRING
+        test_str.type = attribute_pb2.STRING
         test_str.comment = "A string attribute for test op"
 
         actual = creation.get_docstring_from_op_proto(op)
diff --git a/python/paddle/v2/framework/tests/test_protobuf.py b/python/paddle/v2/framework/tests/test_protobuf.py
index b8702477e6..69e98e2f25 100644
--- a/python/paddle/v2/framework/tests/test_protobuf.py
+++ b/python/paddle/v2/framework/tests/test_protobuf.py
@@ -1,12 +1,10 @@
-import paddle.v2.framework.proto.op_proto_pb2
-import paddle.v2.framework.proto.attr_type_pb2
+import paddle.v2.framework.proto.op_proto_pb2 as op_proto_lib
+import paddle.v2.framework.proto.attribute_pb2 as attr_type_lib
 import unittest
 
 
 class TestFrameworkProto(unittest.TestCase):
     def test_all(self):
-        op_proto_lib = paddle.v2.framework.proto.op_proto_pb2
-        attr_type_lib = paddle.v2.framework.proto.attr_type_pb2
         op_proto = op_proto_lib.OpProto()
         ipt0 = op_proto.inputs.add()
         ipt0.name = "a"