Как NVIDIA обучает роботов в виртуальной реальности

На GTC 2026 показали ролик про Reinforcement Learning в Omniverse с помощью модели GR00T 2.0. Десятки типов роботов — от гуманоидных до промышленных манипуляторов — обучаются в виртуальной среде через RL, а потом безупречно работают в реальном мире. GR00T 2.0 адаптируется к нестандартным ситуациям — перехватывает падающие предметы, работает рядом с людьми. Выглядит не как набор алгоритмов, а как ИИ, который понимает физику пространства.

В Omniverse создаётся точный цифровой двойник реальности — трение, гравитация, освещение как в жизни. Внутри запускаются тысячи копий робота одновременно, каждый пробует по-своему. RL-агент получает награду за правильное действие, штраф за ошибку. То, на что в реальности ушли бы годы, здесь занимает часы.

Самое интересное — Zero-Shot Transfer. Симуляция настолько точная, что робот, обученный в виртуальном мире, сразу работает в реальном без дополнительной настройки. Раньше каждого робота программировали вручную под конкретную операцию. Теперь GR00T 2.0 делает их универсальными.

Хуанг назвал Omniverse «заводом по производству интеллекта» — физические навыки кодируются в нейронные сети ещё до того, как робот сделает первый шаг в реальности.

Обучение в симуляции — тема, которая с прошлого года активно привлекает инвесторов (в последнем батче YC минимум три стартапа занимались этим в строительстве и логистике). Ждем, когда робот будет не просто учиться в симуляции, а сам создавать ее — по-человечески представлять, что будет, если он совершит те или иные действия. К этому все идет.