MiniCPM5-1B logo

MiniCPM5-1B

1B参数端侧模型,工具使用与推理能力领先

MiniCPM5-1B是1B参数稠密Transformer模型,专为端侧部署设计,在工具使用、代码生成和复杂推理任务上达到同尺寸开源SOTA,支持混合推理与长上下文。

Sponsors

Become one
Featured
NotchNook
NotchNook

NotchNook

Access media, calendar, files, and more from the Mac's notch

Visit Website
Featured
NoFilterGPT
NoFilterGPT

NoFilterGPT

Unleash the Unrestricted Power of anonymous and unfiltered ChatGPT

Visit Website

Promote your product

Seen by 300K+ monthly visitors

MiniCPM5-1B - 1B参数端侧模型,工具使用与推理能力领先 | Product Screenshot
MiniCPM5-1B product screenshot

更多关于 MiniCPM5-1B 的信息

MiniCPM5-1B

MiniCPM5-1B是一款面向设备端和本地部署的密集1B参数Transformer模型,在同类开源模型中达到最优水平。适用于本地助手、编码代理、工具调用和推理场景,提供原生长上下文支持和灵活推理模式。

  • 同类最优性能:在1B参数级别开源模型中达到SOTA,尤其在工具使用、代码生成和复杂推理方面优势显著。
  • 混合推理模式:内置思考模板,可通过参数切换快速响应与深度推理两种模式,同一模型兼顾效率与准确性。
  • 原生长上下文支持:支持131,072 token的上下文长度,满足长文档和复杂任务需求。
  • 轻量部署:采用标准Llama架构,无需自定义内核或代码分支,主流推理引擎可直接加载。
  • 多框架兼容:支持vLLM、SGLang、Transformers、llama.cpp等主流推理框架,并提供一键部署指南。
  • 工具调用优化:原生支持XML风格工具调用,SGLang后端可自动转换为OpenAI兼容格式。
  • 强化学习与蒸馏:通过RL+OPD技术,在数学、代码等任务上平均分数提升16点,同时过长响应比例降低29个百分点。

在资源受限场景下,MiniCPM5-1B以紧凑的模型体积提供了强大的语言理解和生成能力。无论是本地编码代理、工具助手还是推理应用,都能获得高效、可靠的AI支持,显著降低部署门槛并提升开发效率。