Observa a un perro robot aprender a defenderse hábilmente de un humano

Estudia lo suficiente niños, y tal vez algún día te conviertas en un robot luchador profesional. Hace unos años, Boston Dynamics estableció el estándar para el campo al tener personas empuñando palos de hockey Intenta evitar que Spot, el robot cuadrúpedo, abra una puerta. Anteriormente, en 2015, la lejana agencia de investigación federal Darpa organizó un desafío en el que obligó a torpes robots humanoides a avergonzarse en una carrera de obstáculos. camino fuera de la liga de las máquinas. (Una vez les pregunté, queridos lectores, para dejar de reírme de ellos, pero desde entonces he cambiado de opinión.) Y ahora, he aquí: los creadores del perro robot Jueying le han enseñado una forma fascinante de defenderse de un antagonista humano que lo patea o lo empuja con un palo.

Un equipo de investigadores de la Universidad de Zhejiang de China, donde también se desarrolló el hardware de Jueying, y la Universidad de Edimburgo no enseñar los Jueying cómo recuperarse después de un asalto, tanto como dejaron que el robot lo resolviera. Es una desviación dramática de la forma en que un desarrollador de hardware como Boston Dynamics trabaja enseñarle a un robot a moverse, utilizando décadas de experiencia humana para codificar, línea por línea, la forma en que se supone que un robot reacciona a estímulos como, um, el pie de una persona.

Video: Yang y col., Sci Robot. 5, eabb2174 (2020)

Pero tiene que haber una forma mejor. Imagínese, por así decirlo, un equipo de fútbol. Los mediocampistas, los delanteros y un portero hacen cosas generalmente futbolísticas como correr y patear, pero cada posición tiene sus propias habilidades especializadas que la hacen única. El portero, por ejemplo, es la única persona en el campo que puede agarrar el balón con las manos sin que le griten.

En los métodos tradicionales de entrenamiento de robots, tendrías que codificar meticulosamente todos esos comportamientos especializados. Por ejemplo, ¿cómo deberían coordinarse los actuadores (motores que mueven las extremidades de un robot) para hacer que la máquina funcione como un mediocampista? “La realidad es que si quieres enviar un robot a la naturaleza para realizar una amplia gama de tareas y misiones diferentes, necesitas diferentes habilidades, ¿verdad?” dice el roboticista de la Universidad de Edimburgo Zhibin Li, autor correspondiente en un artículo reciente en el diario Ciencia Robótica describiendo el sistema.

Li y sus colegas empezaron por entrenar el software que guiaría una versión virtual del perro robot. Desarrollaron una arquitectura de aprendizaje con ocho “expertos” algorítmicos que ayudarían al perro a producir comportamientos complejos. Para cada uno de estos, se utilizó una red neuronal profunda para entrenar el modelo de computadora del robot para lograr una habilidad en particular, como trotar o enderezarse si caía de espaldas. Si el robot virtual intentaba algo que lo acercaba más a la meta, obtenía una recompensa digital. Si hizo algo que no era ideal, obtuvo un demérito digital. Esto se conoce como aprendizaje por refuerzo. Después de muchos de estos intentos guiados de prueba y error, el robot simulado se convertiría en un experto en una habilidad.

Video: Yang y col., Sci Robot. 5, eabb2174 (2020)

Compare esto con la forma tradicional línea por línea de codificar un robot para que haga algo aparentemente tan simple como subir escaleras.este actuador gira tanto, este otro actuador gira tanto. “El enfoque de la IA es muy diferente en el sentido de que captura experiencia, que el robot ha probado cientos de miles de veces, o incluso millones de veces ”, dice Li. “Entonces, en el entorno simulado, puedo crear todos los escenarios posibles. Puedo crear diferentes entornos o diferentes configuraciones. Por ejemplo, el robot puede comenzar con una postura diferente, como tumbarse en el suelo, pararse, caerse, etc. “

Fuente

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí