
Step 3.5 Flash
该模型具备快速推理能力,能够在实际应用中提供可靠的性能,实现高效的工具使用和任务执行。
Step 3.5 Flash 是高效的开源基础模型,提供前沿推理和智能体能力,支持本地部署,适用于代码和工作任务,支持256K上下文窗口。


更多关于 Step 3.5 Flash 的信息
Step 3.5 Flash
Step 3.5 Flash 是一款旨在提供前沿推理和智能体能力的开源基础模型。 凭借其高效的特性,它能够在各种应用场景中提供卓越的性能。 此外,它还支持本地部署,确保数据隐私和高性能。
- •快速深度推理:采用3路多令牌预测 (MTP-3),实现100-300 tok/s的生成吞吐量,实现快速响应的复杂推理链。
- •强大的编码与Agent:专为Agent任务而构建,集成可扩展的RL框架,在SWE-bench Verified上达到74.4%,在Terminal-Bench 2.0上达到51.0%,稳定处理复杂任务。
- •高效长上下文:通过3:1滑动窗口注意力(SWA)比率,支持256K上下文窗口,确保在处理大型数据集或长代码库时性能一致,降低计算开销。
- •本地安全部署:针对本地环境优化,可在高端消费级硬件上安全运行,确保数据隐私,例如Mac Studio M4 Max和NVIDIA DGX Spark。
- •工具增强推理:通过在Chain-of-Thought推理中集成Python代码执行,在AIME 2025、HMMT 2025 Nov.、IMOAnswerBench和ARC-AGI-1等基准测试中实现显著的性能提升。
- •多Agent协同:原生支持多Agent架构,通过自主规划和动态路由处理复杂任务,实现云端搜索、总结,并触发设备端应用,实现云端设备协同。
- •专业数据分析:在Claude Code等高级Agent框架中,能够独立处理数据摄取、清洗、特征构建和结果解释等流程,在专业数据分析基准测试中表现出色。
- •深度研究能力:通过ReAct架构,实现深度研究工作流程,在ResearchRubrics基准测试中获得65.27分,与OpenAI和Gemini Deep Research竞争。
- •主动意图澄清:在74个模糊的真实世界请求中,主动识别缺失信息,并通过有针对性的提问来明确用户意图。
- •提供咨询服务:在涵盖生活、学习和工作环境的500个双语提示中,展现出扎实的领域知识和专业的风格,并保持高标准的指令遵循。
在当今时代,拥有一个能够快速思考并可靠行动的工具至关重要。 Step 3.5 Flash 凭借其卓越的推理能力、高效的工具使用和强大的Agent能力,能够帮助您提升工作效率。 无论您是开发者、研究人员还是数据分析师,Step 3.5 Flash 都能为您提供可靠的支持,助您在复杂任务中取得成功。










