(北京4日综合电)中国AI新创公司“深度求索”(DeepSeek)开发的大语言模型绕过美国人工智能巨头辉达(Nvidia)的CUDA框架,据报导,DeepSeek正为未来适配中国国产GPU晶片做准备。
香港星岛日报网引述中媒报导,辉达的“统一运算架构”(Compute Unified Device Architecture,CUDA)能大幅降低研发大模型的难度,获全球开发商使用,让辉达在人工智能(AI)发展上拥有垄断地位。
报导并引述美国科技网站指出,DeepSeek使用辉达的H800晶片进行训练时,使用了辉达的底层硬体指令PTX(Parallel Thread Execution)语言,而不是高级编程语言CUDA。

北京航空航太大学副教授黄雷表示,绕过CUDA意味着DeepSeek可以直接根据GPU的驱动函数做一些新的开发,进而实现更加细微性的操作。
报导说,DeepSeek拥有一些擅长写PTX语言的内部开发者,若之后使用中国国产GPU,DeepSeek在硬体适配方面将更得心应手,DeepSeek只要了解这些硬体驱动提供的一些基本函数介面,即可仿照辉达GPU硬体的程式设计介面写相关代码,进而让自家大模型更加容易适配中国国产硬体。
文:综合报导
图:互联网