File tree Expand file tree Collapse file tree 2 files changed +4
-4
lines changed
Expand file tree Collapse file tree 2 files changed +4
-4
lines changed Original file line number Diff line number Diff line change 1- PaddlePaddle 中的性能分析
1+ PaddlePaddle 性能分析与调优
22=====================================
33
44此教程将向您分步介绍如何使用内置的定时工具、 **nvprof ** 或 **nvvp ** 来运行性能分析和调优。
@@ -201,15 +201,15 @@ nvvp 工具
201201 :scale: 33%
202202
203203从内核函数的角度, ** nvvp** 可以精确说明一个长耗时操作的具体原因。
204- 同时,如下图所示, ** nvvp** 的内核block使用情况、register使用情况和共享内存使用情况能让我们对GPU的整体使用有更好的理解 。
204+ 同时,如下图所示, ** nvvp** 的内核block使用情况、寄存器使用情况和共享内存使用情况能让我们对GPU的整体使用有更好的理解 。
205205
206206
207207.. image:: nvvp2.png
208208 :align: center
209209 :scale: 33%
210210
211211而从应用的角度, ** nvvp** 可以帮您提供一些定位性能瓶颈的建议。
212- 例如,下图中就展示了一些关于data movement和compute utilization的建议 ,为您做性能调优提供了方向。
212+ 例如,下图中就展示了一些关于内存数据迁徙和计算资源利用率的建议 ,为您做性能调优提供了方向。
213213
214214.. image:: nvvp3.png
215215 :align: center
Original file line number Diff line number Diff line change @@ -53,7 +53,7 @@ above profilers.
5353
5454.. literalinclude :: ../../../paddle/math/tests/test_GpuProfiler.cpp
5555 :language: c++
56- :lines: 111-124
56+ :lines: 137-151
5757 :linenos:
5858
5959The above code snippet includes two methods, you can use any of them to profile the regions of interest.
You can’t perform that action at this time.
0 commit comments