1 想法
不为别的,下次再有为什么优化不行,也能有理有据,生动直观。减轻对于sanity值的消耗。
2 实践
Ubuntu的Nvidia官方镜像安装,可以自搜,本站有。nsys版本号如下:
NVIDIA Nsight Systems version 2023.1.1.127-32365746v0
2.1 CLI命令
这里只介绍几个可能常用的,因为主要还是用GUI,以防个人电脑出现各种问题(主要是连接不了内网,然后SSH用不了,你知道的,这对一个颠沛流离的人来说,是一件常有的事情)。
nsys profile:开始一个新的性能分析会话。这是最常用的命令,主要用于收集应用程序的性能数据。
- -o <output>:指定输出文件名。
- -t <trace>:指定要跟踪的活动(例如,cuda,opengl,osrt 等)。
- –duration <seconds>:设置采集数据的持续时间。
nsys launch:与 nsys profile 类似,但可以直接指定应用程序命令和参数
- <application>:指定要启动的应用程序。
- <arguments>:为应用程序提供的命令
评论前必须登录!
注册