|
|
@ -1,4 +1,4 @@
|
|
|
|
PaddlePaddle 中的性能分析
|
|
|
|
PaddlePaddle 性能分析与调优
|
|
|
|
=====================================
|
|
|
|
=====================================
|
|
|
|
|
|
|
|
|
|
|
|
此教程将向您分步介绍如何使用内置的定时工具、 **nvprof** 或 **nvvp** 来运行性能分析和调优。
|
|
|
|
此教程将向您分步介绍如何使用内置的定时工具、 **nvprof** 或 **nvvp** 来运行性能分析和调优。
|
|
|
@ -201,7 +201,7 @@ nvvp 工具
|
|
|
|
:scale: 33%
|
|
|
|
:scale: 33%
|
|
|
|
|
|
|
|
|
|
|
|
从内核函数的角度, **nvvp** 可以精确说明一个长耗时操作的具体原因。
|
|
|
|
从内核函数的角度, **nvvp** 可以精确说明一个长耗时操作的具体原因。
|
|
|
|
同时,如下图所示, **nvvp** 的内核block使用情况、register使用情况和共享内存使用情况能让我们对GPU的整体使用有更好的理解。
|
|
|
|
同时,如下图所示, **nvvp** 的内核block使用情况、寄存器使用情况和共享内存使用情况能让我们对GPU的整体使用有更好的理解。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
.. image:: nvvp2.png
|
|
|
|
.. image:: nvvp2.png
|
|
|
@ -209,7 +209,7 @@ nvvp 工具
|
|
|
|
:scale: 33%
|
|
|
|
:scale: 33%
|
|
|
|
|
|
|
|
|
|
|
|
而从应用的角度, **nvvp** 可以帮您提供一些定位性能瓶颈的建议。
|
|
|
|
而从应用的角度, **nvvp** 可以帮您提供一些定位性能瓶颈的建议。
|
|
|
|
例如,下图中就展示了一些关于data movement和compute utilization的建议,为您做性能调优提供了方向。
|
|
|
|
例如,下图中就展示了一些关于内存数据迁徙和计算资源利用率的建议,为您做性能调优提供了方向。
|
|
|
|
|
|
|
|
|
|
|
|
.. image:: nvvp3.png
|
|
|
|
.. image:: nvvp3.png
|
|
|
|
:align: center
|
|
|
|
:align: center
|
|
|
|