
Mercury 2
通过并行生成技术,在保持高质量的同时,实现更快的文本生成速度,满足实时应用的需求。
Inception Mercury 2 是一款基于扩散模型的 LLM,提供极速推理能力,适用于代码编辑、Agentic 循环、实时语音交互等场景,在速度和质量上实现突破。

更多关于 Mercury 2 的信息
Mercury 2
Mercury 2 是一款基于扩散模型的快速推理语言模型,旨在实现即时响应的生产级 AI。它通过并行生成和迭代优化,加速了生成速度,适用于需要快速响应的应用场景。
- •极速推理:基于扩散模型,生成速度超过传统模型5倍以上,在 NVIDIA Blackwell GPU 上达到 1,009 tokens/秒。
- •低延迟优化:针对用户体验进行优化,在高并发环境下保持低延迟,P95 延迟表现出色,提供稳定吞吐量。
- •128K上下文:支持128K上下文长度,满足复杂任务需求。
- •原生工具使用:具备原生工具使用能力,增强功能多样性。
- •JSON输出:支持模式对齐的 JSON 输出,方便集成。
- •价格优势:输入 1M tokens 价格为 $0.25,输出 1M tokens 价格为 $0.75。
在当今对速度要求极高的 AI 应用中,Mercury 2 提供了革命性的解决方案。它通过极速推理和低延迟优化,显著提升了用户体验,并为开发者带来了更多可能性。选择 Mercury 2,您将体验到 AI 应用的真正即时响应,并构建更高效、更智能的系统。










