Mercury 2 logo

Mercury 2

通过并行生成技术,在保持高质量的同时,实现更快的文本生成速度,满足实时应用的需求。

Inception Mercury 2 是一款基于扩散模型的 LLM,提供极速推理能力,适用于代码编辑、Agentic 循环、实时语音交互等场景,在速度和质量上实现突破。

Sponsors

Become one
Featured
NotchNook
NotchNook

NotchNook

Access media, calendar, files, and more from the Mac's notch

Visit Website
Featured
NoFilterGPT
NoFilterGPT

NoFilterGPT

Unleash the Unrestricted Power of anonymous and unfiltered ChatGPT

Visit Website

Promote your product

Seen by 300K+ monthly visitors

Mercury 2 - 通过并行生成技术,在保持高质量的同时,实现更快的文本生成速度,满足实时应用的需求。 | Product Screenshot
Mercury 2 product screenshot

更多关于 Mercury 2 的信息

Mercury 2

Mercury 2 是一款基于扩散模型的快速推理语言模型,旨在实现即时响应的生产级 AI。它通过并行生成和迭代优化,加速了生成速度,适用于需要快速响应的应用场景。

  • 极速推理:基于扩散模型,生成速度超过传统模型5倍以上,在 NVIDIA Blackwell GPU 上达到 1,009 tokens/秒。
  • 低延迟优化:针对用户体验进行优化,在高并发环境下保持低延迟,P95 延迟表现出色,提供稳定吞吐量。
  • 128K上下文:支持128K上下文长度,满足复杂任务需求。
  • 原生工具使用:具备原生工具使用能力,增强功能多样性。
  • JSON输出:支持模式对齐的 JSON 输出,方便集成。
  • 价格优势:输入 1M tokens 价格为 $0.25,输出 1M tokens 价格为 $0.75。

在当今对速度要求极高的 AI 应用中,Mercury 2 提供了革命性的解决方案。它通过极速推理和低延迟优化,显著提升了用户体验,并为开发者带来了更多可能性。选择 Mercury 2,您将体验到 AI 应用的真正即时响应,并构建更高效、更智能的系统。