В России усовершенствовали ИИ-модель Vintix
Теперь ей не нужно переобучение под каждую новую задачу. Во время тестирования модель достигла 67% уровня эксперта и превзошла предыдущую версию на 28%.
Ученые из Института AIRI на конференции ICLR 2026 в Бразилии представили Vintix II – новую версию ИИ-модели, которая умеет подстраиваться под новые задачи без дополнительного обучения. Такой подход особенно важен для сфер, где условия постоянно меняются: в робототехнике, управлении энергосистемами и зданиями, автономном транспорте, в промышленном моделировании.
По сравнению с предыдущей версией – Vintix – проект стал значительно масштабнее. В обучающий набор включили шесть новых областей применения, а саму архитектуру дополнили специальным модулем, который помогает работать с разными типами данных. Благодаря этому, Vintix II может использовать опыт, полученный в одной среде, для решения задач в другой. Именно это сочетание – большого объема разнородных данных и новой архитектурной доработки – позволило создать более универсального ИИ-агента.
Модель проверяли на внушительном наборе задач: 209 использовались для обучения и еще 46 для тестирования. Всего исследование охватило 10 различных доменов и более 700 миллионов шагов взаимодействия со средой. В набор данных вошло большое количество сценариев: от климат-контроля в зданиях до управления роботами-манипуляторами и компьютерного моделирования.
Тестирование проходило в двух режимах. В первом случае модель начинала работу без каких-либо подсказок и постепенно улучшала свои действия уже по ходу взаимодействия со средой. Во втором случае ей сначала показывали несколько примеров, чтобы она быстрее поняла новый контекст и адаптировалась. Таким образом, исследователи проверили сразу два важных качества: насколько хорошо модель умеет разбираться в новой задаче с нуля и насколько эффективно использует даже небольшое количество примеров.
Результаты показали, что качество работы Vintix II стабильно растет, если давать ей больше демонстраций. Особенно заметно это проявилось в таких средах, как Meta-World, Industrial-Benchmark и SinerGym. В остальных случаях показатели как минимум не ухудшались. Это значит, что дополнительные примеры помогают модели точнее понять структуру задачи и выбрать более подходящую стратегию действий.
На тестовой выборке Vintix II достигла 67% уровня эксперта и показала прирост на 28% по сравнению с предыдущей версией Vintix в тех областях, где их можно было напрямую сравнить. В некоторых задачах модель также превзошла решение REGENT, что подтверждает ее высокий уровень среди подобных систем. Кроме того, результаты показали, что Vintix II умеет обобщать опыт и справляться даже с теми вариантами поведения среды, которых не было в обучающих данных.
«Такой подход можно рассматривать не только как исследовательскую идею, но и как практическую основу для создания универсальных ИИ-агентов. Модель умеет переносить полезные закономерности между разными средами и уточнять свою стратегию по мере накопления нового опыта. Это особенно ценно для задач со сложными, меняющимися условиями», – отметил Андрей Полубаров, научный сотрудник группы “Адаптивные агенты” Института AIRI
Об институте
Научно-исследовательский институт AIRI — автономная некоммерческая организация, занимающаяся фундаментальными и прикладными исследованиями в области искусственного интеллекта.
В 2026 году Институту исполнилось 5 лет.
Более 200 научных сотрудников AIRI задействованы в исследовательских проектах для работы совместно с глобальным сообществом разработчиков, академическими и индустриальными партнерами.
