网站地图官方微信:
网站首页 田楼镇 兰巨乡 会亭镇 鳌头镇 石窝镇 春堆乡

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 写代码的时候总是考虑太多怎么办? |

    不知道你有没有听说过 Pieter Levels,一个来自荷...

    查看详情>>
  • | 为什么 mac mini 的 m4 版本价格这么低呢? |

  • | 特朗普大力推行稳定币,背后的真实目的是什么? |

  • | Rust 的设计缺陷是什么? |

  • | 有哪些故意缩短产品寿命的设计? |

  • | MacOS真的比Windows流畅吗? |

  • | 如何看待三峡集团总部搬迁至武汉? |

  • | 各位历史发烧友,介绍一下你知道的冷门史实或逆天史实? |

  • | 地球上明明有吃塑料的虫子,为什么没有普及? |

  • | 眼睛有飞蚊症可以自愈吗? |

  • | 现在个人博客不能备案了吗? |

  • 德宏人来说下。 这边有大批大批来务工的缅甸女生(可以说是随处...

    2025-06-21
  • 你写uint32,然后str真有4个G以上长度的时候你就老实...

    2025-06-21
  • 我老婆高中时也是班花,但是没人惦记,具体说是没人敢惦记,原因...

    2025-06-21
  • 昨晚刚发生的,去一家经常买的档口买凉菜,之前每次去,称重18...

    2025-06-21

关注我们

添加微信好友,关注最新动态