外媒:英伟达正在研发一款顶级机密AI推理芯片,或将于下月亮相
CBINEWS
责任编辑:邹大斌
电脑商情在线
时间:2026-03-02 11:06
英伟达 AI 推理 芯片 GPU
《华尔街日报》上周五报道,英伟达公司正在研发一款专用的推理处理器。这款芯片将被OpenAI集团及其他人工智能公司用于开发更快、更高效的AI模型。
这款全新的推理平台预计将于本月晚些时候在圣何塞举行的英伟达年度GTC开发者大会上正式发布。该平台将整合英伟达去年12月从芯片初创公司Groq收购的技术。
“推理”是指将训练好的AI模型投入生产环境运行的过程,目前已成为AI行业的关键焦点。英伟达的竞争对手,如谷歌和AWS均已开发出可与英伟达GPU抗衡的专用推理芯片。此外,英伟达还面临着来自Cerebras Systems Inc.和SambaNova Systems Inc.等专用推理芯片初创公司的竞争。
《华尔街日报》指出,OpenAI已提前获得了英伟达新款推理芯片的访问权限,并将成为其首批用户之一。这对这家芯片巨头而言是一个重大的胜利。尽管OpenAI一直在寻找英伟达GPU的高效替代方案以实现计算栈的多样化,但上周该公司从这家全球顶级芯片制造商处获得了300亿美元的资金支持,这一交易重申了其对英伟达的承诺。
英伟达是全球占主导地位的GPU制造商。GPU是一种专用处理器,能够同时执行数十亿项任务。然而,尽管英伟达坚持认为其GPU既适用于模型训练也适用于推理,但它们已不再被视为运行AI应用最高效的选择。许多公司发现,英伟达的芯片能耗过高,导致成本极其昂贵。这对于需要巨大算力的AI智能体应用尤为不利,因为这些智能体代表人类用户自主执行任务。
正因如此,OpenAI上个月与Cerebras签署了一份价值数十亿美元的合同,以获取其餐盘大小的专用推理芯片。Cerebras声称,在推理任务方面,其硅芯片的速度远超英伟达的GPU。
据报道,英伟达的这款推理芯片将整合由Groq开发的技术。去年12月,英伟达斥资200亿美元以非独家方式授权了Groq的技术。作为该交易的一部分,英伟达还聘请了Groq的创始人兼首席执行官Jonathan Ross及其总裁Sunny Madra。这笔交易当时被称为硅谷历史上规模最大的“收购式招聘”之一。
Groq的推理芯片被称为“语言处理单元”(LPUs),其基于一种全新的架构,能够以极低的能耗执行推理任务。不过,英伟达尚未透露其计划如何使用这家初创公司的技术。
据报道,OpenAI希望利用英伟达的新款推理芯片为其Codex编程工具提供动力。Codex是Anthropic Claude Code的竞争对手。编码应用已成为生成式AI最强大且最盈利的用例之一,而在这个领域,OpenAI目前仅位居第二,因为Claude Code被广泛认为是市场领导者。
此外,英伟达也在大力推广其中央处理器(CPU),将其作为运行推理工作负载的另一种替代方案。传统上,大多数公司将英伟达的GPU与CPU搭配使用,利用两种芯片协同工作以弥补彼此的效率不足。
但英伟达表示,某些智能体AI工作负载实际上可以仅在其最先进的Grace CPU上更高效地运行。上个月,Meta Platforms Inc.成为首家承诺进行大规模纯CPU部署的公司,以支持其广告投放智能体的生产运行。
