Mistral推出全套Apache许可证模型
CBINEWS
责任编辑:邹大斌
电脑商情在线
时间:2025-12-03 14:53
Mistral AI LLM 开源
Mistral AI发布了以“Mistral 3”为品牌的一整套开源模型,旨在覆盖从手机、无人机到多GPU数据中心服务器的全场景应用。
尽管这家法国公司并未公开其训练数据,但选择在Apache 2.0许可证下开源这些模型仍具有重要意义。
Mistral表示:“开源我们的模型是为了赋能开发者社区,真正将AI交到人们手中,让他们掌握自己的AI未来。”
该系列中的旗舰模型是Mistral Large 3,它经过多语言训练,使非英语用户也能高效使用。“大多数AI实验室主要聚焦于母语(通常为英语),但Mistral Large 3接受了大量多语言数据训练,让数十亿使用不同母语的人也能受益于先进的AI技术,”该公司称。
虽然其他AI平台也宣称具备多语言能力,但多数仍以英语为优化重点(通常仅“可能”以提示所用语言作答),例如OpenAI的模型便是如此。
Mistral AI强调其混合专家(Mixture of Experts, MoE)架构具备可扩展性(每个任务仅激活最相关的专家)、高效性(处理任务由专用子模型分担)和适应性,而Mistral 3则是其迄今为止最灵活的产品。
Mistral 3包含足够小巧的模型,可在无人机、移动设备或笔记本电脑上运行。据该公司介绍,整个系列共包含九个模型,分为三种参数规模(140亿、80亿和30亿)以及三种变体:预训练基础版(Base)、聊天优化版(Instruct)和擅长复杂逻辑推理的推理版(Reasoning)。
客户可根据自身优先级选择最合适的模型基础。“在许多情况下,”公司指出,“较小的模型不仅足够,甚至更优——它们速度更快,并能在大型模型无法运行的环境中稳定工作。”
在单块GPU上运行可显著降低硬件成本,并使离线或边缘部署更加实用。此外,针对特定场景的小型模型还有其他优势。Mistral AI早前的研究就强调了“为特定用例选择合适模型”的重要性——这一经验对所有AI厂商都具有借鉴意义,尤其是在企业纷纷加速拥抱AI技术的当下。
Mistral AI成立于2023年,在这个由美国和中国公司主导的市场中迅速崛起,成为欧洲的重要竞争者。2024年,微软与这家初创公司达成合作,将Mistral Large引入Azure平台;截至2025年9月,公司已完成17亿欧元的C轮融资,估值达117亿欧元。其产品组合现已涵盖多种AI服务,包括自研聊天机器人Le Chat。
Mistral目前仍为私营企业,但与许多AI厂商类似,其营收被认为远低于持续涌入的投资额。
除了发布新模型外,该公司本周还与汇丰银行(HSBC)签署协议,将在这家全球银行业巨头的系统中全面部署AI服务。
智库专家
费树岷
苏州人工智能研究院
院长
张腾
深圳市爱瑞古德科技有限公司
CEO
刘知函
盈科律师事务所北京知识产权
研究中心主任
吕森林
中教大数据技术研究院
院长
lion 刘总
仟憬网络游戏
总监
