网站地图官方微信:
网站首页 太德乡 商丘市 蕉城镇 公安镇 柏垭乡 小章镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 微软裁了 6000 人,其中软件工程师受影响最大,这会给整个软件行业的人才流动带来怎样的连锁反应? |

    快笑疯了 还记得之前微软要relocate国内的azure和...

    查看详情>>
  • | 为什么《长安的荔枝》中的李善德明明是受圣人敕封,却一点权利都没有? |

  • | ddns,仅ipv6访问,***s 高位端口号,需要ICP备案么?会被运营商封锁么? |

  • | 华为和硅基流动发布CloudMatrix384超节点部署DeepSeek的报告,对行业有何影响? |

  • | 各位历史发烧友,介绍一下你知道的冷门史实或逆天史实? |

  • | MiniMax Week第三天推出通用 Agent,体验如何?对行业会带来哪些影响? |

  • | MacOS真的比Windows流畅吗? |

  • | 如何评价女明星梅根福克斯的身材? |

  • | 如何评价前端框架 Solid? |

  • | 北京日报点名批评“苏超”过度娱乐化的动机是什么? |

  • | 和女生合租,都会发生什么事情? |

  • 快笑疯了 还记得之前微软要relocate国内的azure和...

    2025-06-21
  • 我前年专门去了特拉西墨涅湖古战场,汉尼拔曾经在湖边的山谷埋伏...

    2025-06-21
  • 我觉得Swift最强的是无缝集成C,制作完XCFramewo...

    2025-06-21
  • 我开发了一个语言 herlang: justj***ac/h...

    2025-06-21

关注我们

添加微信好友,关注最新动态