Al igual que ImageNet revolucionó el reconocimiento de imágenes, las máquinas podrían aprender a ejecutar tareas y navegar por su entorno viendo vídeos de sus