
MiniCPM5-1B
1B参数端侧模型,工具使用与推理能力领先
MiniCPM5-1B是1B参数稠密Transformer模型,专为端侧部署设计,在工具使用、代码生成和复杂推理任务上达到同尺寸开源SOTA,支持混合推理与长上下文。

更多关于 MiniCPM5-1B 的信息
MiniCPM5-1B
MiniCPM5-1B是一款面向设备端和本地部署的密集1B参数Transformer模型,在同类开源模型中达到最优水平。适用于本地助手、编码代理、工具调用和推理场景,提供原生长上下文支持和灵活推理模式。
- •同类最优性能:在1B参数级别开源模型中达到SOTA,尤其在工具使用、代码生成和复杂推理方面优势显著。
- •混合推理模式:内置思考模板,可通过参数切换快速响应与深度推理两种模式,同一模型兼顾效率与准确性。
- •原生长上下文支持:支持131,072 token的上下文长度,满足长文档和复杂任务需求。
- •轻量部署:采用标准Llama架构,无需自定义内核或代码分支,主流推理引擎可直接加载。
- •多框架兼容:支持vLLM、SGLang、Transformers、llama.cpp等主流推理框架,并提供一键部署指南。
- •工具调用优化:原生支持XML风格工具调用,SGLang后端可自动转换为OpenAI兼容格式。
- •强化学习与蒸馏:通过RL+OPD技术,在数学、代码等任务上平均分数提升16点,同时过长响应比例降低29个百分点。
在资源受限场景下,MiniCPM5-1B以紧凑的模型体积提供了强大的语言理解和生成能力。无论是本地编码代理、工具助手还是推理应用,都能获得高效、可靠的AI支持,显著降低部署门槛并提升开发效率。










