MolmoAct 2 logo

MolmoAct 2

Razonamiento 3D adaptativo para robots con inferencia en tiempo real

Modelo de razonamiento y acción para robots, con dataset bimanual abierto de 720 horas, inferencia 37x más rápida y rendimiento superior en benchmarks.

Sponsors

Become one
Featured
NotchNook
NotchNook

NotchNook

Access media, calendar, files, and more from the Mac's notch

Visit Website
Featured
NoFilterGPT
NoFilterGPT

NoFilterGPT

Unleash the Unrestricted Power of anonymous and unfiltered ChatGPT

Visit Website

Promote your product

Seen by 300K+ monthly visitors

MolmoAct 2 - Razonamiento 3D adaptativo para robots con inferencia en tiempo real | Product Screenshot
MolmoAct 2 product screenshot

Más sobre MolmoAct 2

MolmoAct 2

MolmoAct 2 es un modelo de base robótica de código abierto que permite a robots realizar tareas del mundo real con razonamiento 3D. Ofrece manipulación bimanual y un rendimiento superior en benchmarks, funcionando hasta 37 veces más rápido que su predecesor. Está diseñado para entornos no estructurados como laboratorios y hogares.

  • Razonamiento 3D adaptativo:Utiliza tokens de profundidad solo cuando es necesario, mejorando la precisión espacial sin sacrificar velocidad.
  • Velocidad de inferencia ultrarrápida:Ejecuta acciones en 180 ms (base) o 790 ms (con razonamiento adaptativo), frente a los 6700 ms de la versión anterior.
  • Manipulación bimanual integrada:Capacidad bimanual lista para usar sin ajuste fino por tarea, entrenada con el dataset más grande de código abierto (720+ horas).
  • Rendimiento líder en benchmarks:Supera a modelos propietarios como π0.5 en pruebas simuladas y reales, con un 87.1% de éxito en tareas zero-shot.
  • Adaptación a nuevas configuraciones:Se ajusta a brazos robóticos como SO-100, YAM y Franka mediante post-entrenamiento, con un 97.2% de éxito en LIBERO.
  • Tokenizador de acciones abierto:Reimplementación completamente abierta del tokenizador FAST, entrenado con datos propios y publicado para la comunidad.
  • Instrucciones en lenguaje natural:Responde a comandos de texto y trazas visuales, facilitando la interpretación y el ajuste del comportamiento.
  • Dataset de demostraciones bimanuales:Incluye el dataset YAM Bimanual con 720 horas de demostraciones, el más grande de su tipo en código abierto.

Al elegir MolmoAct 2, se obtiene una base robótica abierta que combina razonamiento 3D eficiente, velocidad de reacción casi en tiempo real y capacidad bimanual nativa. Esto permite automatizar tareas repetitivas en entornos no estructurados, acelerando la investigación y la productividad. Con su rendimiento superior y transparencia total, es la opción ideal para avanzar en robótica del mundo real.