add sync

8 years ago · 345737d0fe
parent 187e23a79c
commit 345737d0fe
1 changed files with 1 additions and 0 deletions
--- a/paddle/fluid/platform/cuda_device_function.h
+++ b/paddle/fluid/platform/cuda_device_function.h
@ -63,6 +63,7 @@ __device__ T reduceSum(T val, int tid, int len) {
    val += platform::CudaShuffleDownSync(mask, val, offset);

  if (tid < warpSize) shm[tid] = 0;
+  __syncthreads();

  if (tid % warpSize == 0) {
    shm[tid / warpSize] = val;