云计算百科
云计算领域专业知识百科平台

CUDA编程练习(八) Nsight System使用与服务器连接

1 想法

不为别的,下次再有为什么优化不行,也能有理有据,生动直观。减轻对于sanity值的消耗。

2 实践

Ubuntu的Nvidia官方镜像安装,可以自搜,本站有。nsys版本号如下:

NVIDIA Nsight Systems version 2023.1.1.127-32365746v0

2.1 CLI命令

这里只介绍几个可能常用的,因为主要还是用GUI,以防个人电脑出现各种问题(主要是连接不了内网,然后SSH用不了,你知道的,这对一个颠沛流离的人来说,是一件常有的事情)。

nsys profile:开始一个新的性能分析会话。这是最常用的命令,主要用于收集应用程序的性能数据。

  • -o <output>:指定输出文件名。
  • -t <trace>:指定要跟踪的活动(例如,cuda,opengl,osrt 等)。
  • –duration <seconds>:设置采集数据的持续时间。

nsys launch:与 nsys profile 类似,但可以直接指定应用程序命令和参数

  • <application>:指定要启动的应用程序。
  • <arguments>:为应用程序提供的命令
赞(0)
未经允许不得转载:网硕互联帮助中心 » CUDA编程练习(八) Nsight System使用与服务器连接
分享到: 更多 (0)

评论 抢沙发

评论前必须登录!