
GPT‑5.4
提升专业工作效率,实现更精确、更流畅、更智能的解决方案。
GPT-5.4是OpenAI推出的前沿AI模型,在推理、编码、计算机操作等方面实现重大突破,尤其擅长处理复杂任务和专业工作流程。

更多关于 GPT‑5.4 的信息
GPT‑5.4
GPT-5.4 是一款集成了推理、编码和 Agent 工作流程的通用模型。 它在 ChatGPT、API 和 Codex 中提供,旨在帮助用户高效完成专业工作。 凭借其卓越的性能和多项改进,可以满足各种复杂任务的需求。
- •增强计算机使用能力:原生支持计算机操作,能够在网站和软件系统中执行任务。在 OSWorld-Verified 测试中,成功率达到 75.0%,远超 GPT-5.2 的 47.3%。
- •改进的推理能力:在 GDPval 评估中,GPT-5.4 在 83.0% 的对比中匹配或超过行业专业人士的表现,优于 GPT-5.2 的 70.9%。
- •更强的视觉理解:改进了对高分辨率图像的视觉理解,在 MMMU-Pro 测试中,GPT-5.4 达到 81.2% 的成功率,高于 GPT-5.2 的 79.5%。
- •高效的工具搜索:通过工具搜索功能,GPT-5.4 能够更高效地找到并使用正确的工具,减少了 47% 的总令牌使用量,同时保持了准确性。
- •改进编码能力:GPT-5.4 结合了 GPT-5.3-Codex 的编码优势,在 SWE-Bench Pro 上与 GPT-5.3-Codex 表现相当,同时在推理方面具有更低的延迟。
- •更快的网页浏览:在 BrowseComp 测试中,GPT-5.4 的表现比 GPT-5.2 高出 17%abs,能够更有效地在网络上查找信息。
- •更强的上下文保持:在 ChatGPT 中,GPT-5.4 Thinking 能够更好地维护上下文,特别是在需要更长时间思考的问题上,从而提供更高质量的答案。
- •改进的文档处理:GPT-5.4 在 OmniDocBench 上实现了 0.109 的平均错误率,优于 GPT-5.2 的 0.140,提升了文档解析能力。
- •更准确的工具调用:GPT-5.4 改进了工具调用功能,在 Toolathlon 测试中,能够更准确、更高效地使用工具。
- •更安全的模型:GPT-5.4 减少了 33% 的虚假声明和 18% 的错误,在事实准确性方面有所提升。
通过选择 GPT-5.4,您将体验到更高效的工作流程和更可靠的结果。 无论您是需要处理复杂任务的专业人士,还是希望提升代码质量的开发者,都能从中受益。 凭借其强大的功能和卓越的性能,GPT-5.4 将帮助您在竞争中保持领先,并显著提高工作效率。










