阶跃星辰 Step 3.5 Flash:110亿激活参数实现前沿级智能

快讯 每日财经网

近日消息,阶跃星辰开源 Agent 基座模型 Step 3.5 Flash 上线仅两天成功登顶 OpenRouter 平台 Trending 榜单。该榜单排名来自全球知名大模型聚合平台 OpenRouter 数据,数据基于全球开发者与用户的实际模型调用量,直观反映出模型在真实应用场景中的受欢迎程度与市场接受度。

1770353670663758.png

阶跃星辰 Step 3.5 Flash 荣登 OpenRouter Trending 榜首,不仅验证了该模型作为技术黑马在高吞吐与复杂推理场景下的强劲实力,更彰显了其作为兼具极致性能与稳定性的实战首选地位作为面向实时 Agent 工作流场景的模型,Step 3.5 Flash 在推理效率上表现突出,最高推理速度可达每秒 350 个 token。该模型款稀疏混合专家(MoE)架构,在保持较为精巧的1960总参数量的同时,每个 token 在处理过程中仅需激活约 110 亿个参数,在保障模型性能的同时实现运行效率的优化,从而弥合前沿级智能体智能与计算效率之间的鸿沟。

在官方发布的Step 3.5 Flash Tech Report里显示,该模型聚焦于构建智能体的精准推理能⼒以及快速可靠的执行效率。Step 3.5 Flash 通过交错的 3:1 滑动窗口/全注意力机制(Sliding Window/Full Attention)和多 Token 预测(MTP-3)进行优化,以最小化多轮智能体交互的延迟和成本。为实现前沿级智能,Step 3.5 Flash 还采用了可扩展的强化学习(RL)框架,推动模型在数学、代码和⼯具使用等领域持续自我提升。

Step 3.5 Flash 在智能体、编码和数学任务中展现出卓越性能:在 IMO-AnswerBench 上达到 85.4% 的准确率,在 LiveCodeBench-v6(2024.08‒2025.05)上达到 86.4%,在 τ2-Bench 上达到 88.2%,在 BrowseComp(含上下文管理)上达到 69.0%,在 Terminal-Bench 2.0 上达到 51.0%——其性能与 GPT-5.2 xHigh、Gemini 3.0 Pro 等前沿模型相当。通过重新定义效率边界,Step 3.5 Flash 为在真实工业环境中部署复杂智能体提供了高密度基础。Step3.5Flash 仅1960亿总参数、110亿激活参数,就能做到与前沿“巨模”在推理能力、智能体能力上性能相当。

1770353679139216.png

上图:Step 3.5 Flash 仅需 110 亿激活参数(1960 亿 MoE 总参数)即可实现前沿级智能,性能比肩主流闭源和开源模型。

版权与免责声明本站部分内容源于公开渠道或网络推荐,目的在于分享信息、促进交流,并不代表本站赞同其观点或对其真实性负责,请读者仅作参考,并请自行核实相关内容。如涉及版权问题,请权利人及时通过本页底部联系方式书面通知我们,并提供相关权属证明,我们将在核实后第一时间予以删除或作出相应处理。

头条文章

精选文章

三门平安产险:为一线民警送去中秋慰问
在送去节日祝福的同时,三门平安产险还送上了中秋慰问品,感谢人民警察守护百姓安全,不分昼夜坚守岗位的辛勤付出。
快讯 每日财经网
中国企业平均寿命为何不超过3年?朗培商道:盈利无法持续增长
7年间,朗培商道聚焦于企业利润和营收增长,帮助全国千万企业突破利润瓶颈。商业的变革日新月异,朗培商道也在持续地创新,迎合市场的变化和需求。在我国,中小企业的平均寿命甚至只有2.5年。
快讯 每日财经网
金毅服务主要有哪些金融服务呢?如何有效获取客源?
值得一提的是,金毅服务与平安银行合作的信贷服务中,新一代快贷的优势明显,且福利多多。
快讯 每日财经网
巾帼抗“疫” 天河在行动——天河妇促会联合广州壬安升富投资有限公司捐赠抗疫物资
疫情无情人有情,巾帼抗“疫”在行动。为积极响应天河区妇联、天河妇促会抗疫活动号召,6月17日上午,天河妇促会联合广州壬安升富投资有限公司举行抗疫物资捐赠活动。
快讯 每日财经网
火爆全国首家连锁复古舞厅康艺俱乐部(虎门舞厅)盛大开业
流金沙启动康艺俱乐部正式开业旨在打造最具影响舞蹈交流中心雄关漫道真如铁。康艺俱乐部开业当天,来自五湖四海的千余名业内舞蹈爱好者到场送花篮、剪彩送祝贺。
快讯 中国网