阿里云:以全栈领先技术为AI应用提速
CBINEWS
责任编辑:邹大斌
电脑商情在线
时间:2025-04-21 11:54
阿里云 AI 大模型 DeepSeek
AI大潮来袭,给各个云服务商带来新的机会。我们可以明显感受到,随着2021年年末ChatGPT大获成功,各个云服务迅速加大了对AI的投入,并且一年比一年多。今年2月,阿里巴巴集团 CEO 吴泳铭宣布未来三年将投入超过 3800 亿元用于建设云和人工智能硬件基础设施,总额超过去十年总和,创下中国民营企业在该领域最大规模投资纪录。
阿里云如此大力度的投入AI,这背后有AI对阿里云销售的拉动。阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在4月9日阿里云于北京召开的AI势能大会上表示,过去一年,阿里云平台大语言模型API调用量增长近100倍,接入大语言模型的用户数量增长了100倍。
当然,更有阿里云对于市场趋势的洞察。正如刘伟光在大会主题演讲中所说:“社会在方方面面正在被AI渗透,被AI影响,未来AI会和很多产业进行非常有机融合,爆发出更多崭新商业模式和生产路径。”
刘伟光表示,为了更好地满足用户对AI的需求,加速大模型价值的释放,阿里云将坚定投入,打造全栈领先的技术,持续开源开放,为AI应用提速。具体而言,将从基础大模型、AI基础设施、AI工具三个层面来全面优化和升级,为AI应用提速。
丰富的大模型家族满足各种需求
阿里云是云服务商中为数不多有自研基础大模型的厂商,从2022年4月起,阿里云就推出了自己的通义千问基础大模型。如今,阿里云的模型总量已经超过200款,拥有全球最大大模型家族。
刘伟光介绍,阿里云的大模型有两个重点方向:其一是推理,追求更强的推理能力;另一个是全模态,即打破单一文生图、文生视频的局限,实现全模态共同融合,为解决复杂问题提供支撑。
目前,在推理方面,阿里云不久前刚刚开源了Qwen 32B,它在小参数上实现了大参数模型的能力。
在多模态领域,今年1月阿里通义千问开源全新的视觉理解模型Qwen2.5-VL,该视觉语言模型在13项权威评测中获最高奖项;开源的视觉生成基座模型万相2.1(Wan)在权威评测VBenchmark中位居榜首。3月发布的千问2.5—Omni 7B是首个端到端的全模态大模型,能同时处理文本、图像、音频、视频等多种输入。
全栈AI基础设施提升训推效率
毫无疑问,以大模型为代表的新一代AI对基础设施提出了新的需求,例如:更高的算力密度、更大的网络带宽、更高效的资源调度等。随着AI推理训练应用的持续增长,阿里云对基础设施全栈适配AI进行了全面的优化和升级,从而使AI推理和训练效率大幅提升。
比如,针对模型冷启动和规模化扩容对存储侧、网络侧带来的巨大压力,阿里云推出了全新模型权重服务,将大模型从0—100节点冷启动速度提升21倍,将50—100节点扩容速度提升12倍。
MOE架构本身对资源的利用率较高,但调度和应用适配相对复杂,阿里云推出分布式推理调度引擎,提高了集群的资源利用率,降低了推理延迟,使首Token延迟下降92%,同时Token生成时间降低15%。
为了提高训推性能,阿里云今年还实现了流量感知的PD分离(预填充和解码的分离),打造高性能的KV存储,通过技术优化使端到端的服务吞吐提升接近91%,在千万级活跃用户场景下,KV Cache命中率可提升10倍。“基于这些底层技术为大语言模型训练推理优化之后,我们最终能够为企业级客户提供更好的API服务,更稳定高效的API服务,满足多元化服务等级目标。”刘伟光在演讲时表示。
高效的AI开发工具提升开发效率
在AI应用的全生命周期中,开发工具必不可少。阿里云百炼平台正在为AI应用不断进行优化和完善,如今已提供全链路应用构建工具,具体包括:
· 记忆类:提供高效智能上下文管理,解决碎片化问题,提供个性化长期记忆,提升模型的推理效率;
· RAG:支持文本、表格、图片等跨模态的融合搜索,提升搜索精准度;
· 模型路由:在复杂工作流程中,模型路由工具可根据客户任务自动进行调度;
· 工作流编排:通过拖拽实现多种智能体之间的混合编排,提供企业级SLA保障;
· 工具调用:帮助企业用5—10分钟构建智能体,注入企业数据和业务逻辑,并提供丰富插件,助力快速构建技术应用。同时提供全链路观测能力,让企业在一个生命周期内看到所有AI Agent和AI应用的运转情况与使用效果。
MCP协议自被Anthropic开源以来,已被公认为大模型连接软件应用的标准协议。短短数月间,兼容MCP协议的软件应用呈现指数型增长,极大地拓宽了大模型的应用边界。在大会上,刘伟光宣布,阿里云百炼已上线业界首个全生命周期MCP服务,无需用户管理资源、开发部署、工程运维等工作,5分钟即可快速搭建一个连接MCP服务的Agent(智能体)。第一批包括高德、无影、Fetch、Notion等50多款阿里巴巴集团及第三方的MCP服务已在阿里云百炼平台上线,覆盖生活信息、浏览器、信息处理、内容生成等领域,可满足不同场景的Agent应用开发需求。
此外,为推动AI Agent应用的爆发,为市场提供更高质量的AI Agent及更优质便捷的开发工具与环境平台,阿里云推出AI Agent Store,开启AI生态的“繁星阁”,助力企业迈入人机协同时代,帮助客户更高效地开发Agent。
“阿里云内部提出的全栈AI,不仅涵盖大模型,也不仅限于云下基础架构层,还包括底层的异构算力、模型服务平台、百炼平台及其上面所有面向客户的服务,以支持大规模训练任务,并满足实时推理应用的需求。我们不断加大投入,让AI和云更好融合,为客户提供更加高效的AI基础设施。”刘伟光在演讲时说。