360智脑推出Light-IF系列模型

作者:

CBINEWS

责任编辑:

张琳

来源:

电脑商情在线

时间:

2025-08-12 11:19

关键字:

360 智脑 AI

360智脑团队正式推出全新Light-IF系列模型。该创新框架旨在显著提升大型语言模型(LLM)在复杂指令遵循任务中的性能表现。当前人工智能技术持续进步,尽管LLM已在数学、编程等领域展现出强大的推理能力,但在处理复杂指令方面仍存在局限性。为此,团队提出了基于预览-自检式推理与信息熵控制双核心的Light-IF框架。

Light-IF框架通过五个关键环节优化模型:难度感知指令生成、Zero-RL强化学习、推理模式提取与过滤、熵保持监督冷启动、熵自适应正则强化学习。该框架致力于解决当前推理模型中的“懒惰推理”问题——即模型在思考阶段仅简单复述指令而未主动验证约束条件,导致执行结果准确性不足。

实验结果显示,Light-IF系列模型在SuperCLUE、IFEval、CFBench及IFBench四个中英文指令遵循基准测试中均实现显著提升。其中32B版本的Light-IF-32B在SuperCLUE评测中获得0.575分,较次优模型提升13.9个百分点。值得注意的是,参数规模仅1.7B的Light-IF-1.7B在SuperCLUE和IFEval上的表现超越了Qwen3-235B-A22B等更大规模模型。

360智脑团队宣布,Light-IF系列模型不仅为开源社区提供完整可复现的技术路径及配套代码,全系列模型也将陆续在Hugging Face平台开放。训练采用的冷启动数据集将同步于GitHub开源。此外,360与SuperCLUE联合研发的中文精确指令遵循评测基准SuperCLUE-CPIFOpen同样将于GitHub开放,助力研究者评估模型的中文精确指令遵循能力。

新模型的发布标志着360智脑在提升人工智能模型复杂指令遵循能力领域取得实质性突破,为人工智能技术的演进与应用开拓了新的可能性空间。

ToB最前沿

ToB最前沿抖音号

CBI科技在线

地址:北京市朝阳区北三环东路三元桥曙光西里甲1号第三置业A座1508室 商务内容合作QQ:2291221 电话:13391790444或(010)62178877
版权所有:电脑商情信息服务集团 北京赢邦策略咨询有限责任公司
声明:本媒体部分图片、文章来源于网络,版权归原作者所有,我司致力于保护作者版权,如有侵权,请与我司联系删除
京ICP备:2022009079号-3
京公网安备:11010502051901号
ICP证:京B2-20230255