
Perceptron Mk1
前沿视频与具身推理,低成本可部署
Mk1在视频和具身推理上达到前沿模型水平,成本低于Gemini Flash Lite。支持时间推理、视频时间定位、上下文学习、高级图像推理,适用于制造、媒体、机器人等领域。


更多关于 Perceptron Mk1 的信息
Perceptron Mk1
Perceptron Mk1 是一款面向物理世界的感知与推理层模型。它能够以低于同类产品的成本,实现与前沿模型相当的图像、视频和具身推理能力,适用于制造、媒体、机器人等场景。
- •时间推理与思考轨迹:跨时间推理,返回结构化的事件分解结果,并支持按需关闭推理功能。
- •视频时间定位:以动态帧率分析视频,返回精确时间码,支持自动剪辑和事件标记。
- •上下文学习与多模态提示:通过单张参考图像或视频即可识别所有匹配实例,无需微调或标注数据集。
- •高级图像推理:精准指向和计数,支持密集场景下的数百个目标计数;准确读取复杂OCR和仪表读数。
- •结构化文档提取:将复杂文档转换为HTML、JSON或Markdown,保留布局、表格和层级,处理多语言和手写注释。
- •机器人堆栈集成:输出结构化空间基元(点、框、多边形等),可直接用于训练策略或与VLA协同推理。
在当今物理世界与数字世界深度融合的时代,Perceptron Mk1 将前沿的视频与具身推理能力转化为可部署的解决方案。它简化了从数据标注到实时决策的流程,让机器人、制造和内容平台等领域的用户能够以更低成本实现可靠的视觉理解。选择 Mk1,意味着为物理智能应用奠定坚实且经济的基础。










