Alibaba представила свою первую серию ИИ-моделей для роботов
Qwen-Robot Suite включает три основные версии
Китайский интернет-гигант Alibaba представил свою первую серию ИИ-моделей для роботов, передает Интерфакс-Казахстан.
Qwen-Robot Suite включает три основные модели, говорится в сообщении компании.
Модель Qwen-RobotManip обучена на 38 тыс. часов видео и построена по принципу «зрение-язык-действие» (VLA), который позволяет роботу совершать операции на основе визуальной информации и текстовых инструкций.
Qwen-RobotNav обучена на 15,6 млн образцов данных в областях планирования траектории и визуально-языковых рассуждений (vision-language reasoning) и действует как навигатор.
Наконец, Qwen-RobotWorld представляет собой так называемую видеомодель мира (video world model), которая прогнозирует траектории на основе текущих наблюдений. Она обучена на 8,6 млн пар видео и текста и может синтезировать видеоданные для обучения роботов и помогать им моделировать траекторию перед выполнением действия.
Многогранность Qwen-Robot Suite, который уже тестируют отдельные клиенты Alibaba, позволяет роботам динамически воспринимать информацию, рассуждать и действовать в режиме реального времени, отмечает компания. Благодаря этим моделям промышленные манипуляторы, роботы-доставщики и робособаки могут без проблем функционировать в незнакомой обстановке и взаимодействовать с новыми объектами, жестко придерживаясь законов физики и следуя командам на простом человеческом языке.
Традиционные роботы на больших мультимодальных моделях зачастую теряются в незнакомой обстановке и испытывают трудности с обработкой новых инструкций, поскольку не могут динамически преобразовывать языковые команды в физические действия.
При работе с материалами Центра деловой информации Kapital.kz разрешено использование лишь 30% текста с обязательной гиперссылкой на источник. При использовании полного материала необходимо разрешение редакции.
Вам может быть интересно
