Estimado(a)s colegas y amigo(a)s,
Un estimado colega nos comparte hoy el presente artículo escrito por Ingrid Fadelli, publicado el 15 de junio de 2024 por Tech Xplore y traducido por nosotros para este espacio. Veamos de que se trata….
El rendimiento de las herramientas de inteligencia artificial (IA), incluidos grandes modelos computacionales para el procesamiento del lenguaje natural (PLN) y algoritmos de visión por computadora, ha mejorado rápidamente en las últimas décadas. Una razón de esto es que los conjuntos de datos para entrenar estos algoritmos han crecido exponencialmente, recopilando cientos de miles de imágenes y textos, a menudo obtenidos directamente de Internet.
Los datos de entrenamiento para algoritmos de planificación y control de robots, por otro lado, siguen siendo mucho menos abundantes, en parte porque adquirirlos no es tan sencillo. Por lo tanto, algunos científicos informáticos han estado intentando crear plataformas y conjuntos de datos más grandes que podrían usarse para entrenar modelos computacionales para una amplia gama de aplicaciones robóticas.
En un artículo reciente, prepublicado en el servidor arXiv y que se presentará en la conferencia Robotics: Science and Systems 2024, investigadores de la Universidad de Texas en Austin y NVIDIA Research presentaron una de estas plataformas, llamada RoboCasa.
RoboCasa es un marco de simulación a gran escala que se puede utilizar para entrenar robots generalistas para completar diversas tareas en entornos cotidianos.
"El progreso reciente en IA se ha visto impulsado en gran medida por el entrenamiento de grandes modelos en fuentes de datos masivas",
dijo a Tech Xplore Yuke Zhu, autor principal del artículo.
"Inspirándonos en estos avances, buscamos desarrollar modelos básicos para robots generalmente capaces que puedan realizar diversas tareas cotidianas. RoboCasa está diseñado para proporcionar los datos de simulación de alta calidad necesarios para entrenar dichos modelos básicos de robótica".
El objetivo principal del trabajo reciente de Zhu, Soroush Nasiriany, Abhiram Maddukuri, Lance Zhang, Adeet Parikh, Aaron Lo, Abhishek Joshi y Ajay Mandlekar fue desarrollar una nueva plataforma de simulación de código abierto que facilitaría el entrenamiento de algoritmos robóticos.
Sus esfuerzos finalmente llevaron al desarrollo de RoboCasa, que es una extensión de RoboSuite, un marco de simulación que introdujeron hace unos años. RoboSuite sirve como infraestructura de simulación que el equipo utilizó para crear los entornos simulados de RoboCasa.
"Utilizamos herramientas de IA generativa para crear diversos objetos, escenas y tareas", explicó Zhu. "Estas herramientas de IA mejoraron significativamente la diversidad y el realismo del mundo simulado. Además, RoboCasa admite varias plataformas de hardware de robots y proporciona grandes conjuntos de datos con más de 100,000 trayectorias para el entrenamiento de modelos".
La plataforma RoboCasa incluye miles de escenas 3D que contienen más de 150 tipos diferentes de objetos cotidianos y decenas de muebles y electrodomésticos. RoboCasa presenta simulaciones altamente realistas, que se enriquecieron con herramientas de inteligencia artificial generativa.
Zhu y sus colegas diseñaron 100 tareas en las que se pueden entrenar algoritmos robóticos y compilaron demostraciones humanas de alta calidad para estas tareas. Su plataforma también incluye métodos para generar trayectorias y movimientos efectivos que permitirían a los robots completar.
"Dos hallazgos clave fueron los que más me emocionaron", dijo Zhu. "En primer lugar, demostramos una tendencia de escala: a medida que aumentamos el tamaño de los conjuntos de datos de entrenamiento (generados por máquinas), el rendimiento del modelo creció de manera constante. En segundo lugar, al combinar los datos de simulación con datos del mundo real, encontramos que el conjunto de datos aumentado mejoró el rendimiento del robot en tareas del mundo real".