
Ollama v0.19
在 Apple 芯片上,通过机器学习框架,实现更快的模型推理和编码任务处理。
Ollama 现已通过 Apple 的 MLX 框架在 Apple Silicon 上实现加速,带来更快的性能,尤其针对 M5 芯片。支持 NVFP4,提升响应速度。

更多关于 Ollama v0.19 的信息
Ollama v0.19
Ollama is a tool that runs large language models locally on your computer. It now leverages Apple's MLX framework to significantly boost performance on Apple silicon devices. This enhancement allows for faster processing of tasks like personal assistants and coding agents.
- •MLX加速,性能飞跃:基于Apple的MLX框架,在Apple Silicon设备上实现显著加速。在M5、M5 Pro和M5 Max芯片上,利用GPU神经加速器提升首次Token时间(TTFT)和生成速度。
- •NVFP4支持,提高质量:支持NVIDIA的NVFP4格式,在保证模型准确性的同时,降低内存带宽和存储需求。这使得Ollama用户可以获得与生产环境一致的结果。
- •缓存升级,响应更快:升级缓存机制,提高编码和代理任务效率。降低内存使用率,在共享系统提示时,减少提示处理时间,加快响应速度。
通过选择Ollama,您将体验到在Apple Silicon上运行大型语言模型的极致性能。 借助MLX框架和NVFP4支持,Ollama在响应速度和模型质量上实现了显著提升,从而提升您的工作效率。 立即下载,体验本地运行模型的强大功能。










