NVIDIA在AI市场大杀四方,不仅是靠GPU性能强大,还有CUDA软件生态,这可以说是他们的AI护城河。
AMD在AI生态上也在抓紧完善,6月份宣布了全新的ROCm 7,今天它正式发布了,这是AMD向CUDA开炮的关键一战,而且还是开源的,目前已经登陆Github。
详细升级内容可以参考ROCm官网:rocm.docs.amd.com。
在此前的发布会上,AMD还提供了ROCm7的实测结果,在Llama 3.1 70B模型上性能提升 3.2倍,Qwen2-72B上性能提升3.4倍,而DeepSeek R1性能提升3.8倍。
在训练任务上,Llama 2 70B、Llama 3.1 8B、Qwen 1.5 7B模型上平均性能提升3倍。
AMD之前还提到,今年内ROCm7还会不断提升生态支持,加入对锐龙平台笔记本/工作站的支持,完整支持Linux系统,还会正式加入对Windows系统的支持,可以说之前备受开发者吐槽的问题正在逐步解决。