Научно-исследовательский институт искусственного интеллекта AIRI и НИУ ВШЭ создали новый способ повышения точности распознавания искусственным интеллектом 3D-объектов, сообщает Inc. Russia.
Суть метода состоит в использовании малых генеративных моделей ИИ, обученных на качественном наборе данных, в обучении больших моделей и решении задач определения 3D-объектов. Новую технологию можно применять в беспилотном транспорте, в частности это перспективно для определения скорости, позиционирования и направления движения.
Существующие сейчас сенсоры, например лидар, не всегда могут определить положение предмета. В реальных условиях элементы пространства могут скрываться за другими объектами, например за деревом или проезжающей машиной. По сравнению с лидаром разработка российских ученых позволяет точнее определять предметы в 3D-пространстве.
Ученые за год на основе данных о проезде автомобиля по городским улицам обучили небольшую генеративную модель ИИ. Информация делилась на три сценария: объект виден полностью, частично или находится позади машины. С помощью метода Point Cloud Registration (PCR) ее соотносили с конкретными автомобилями и окружающими объектами в разных вариантах. Далее модель ИИ обучала уже большую нейросеть, которая в свою очередь начала корректно предсказывать форму предметов еще до их полного появления в поле зрения.
К слову, параллельно с российскими вузами подобное исследование проводили в OpenAI, только американские ученые действовали на основе текста, а российские сконцентрировались на компьютерном зрении. Однако обе команды независимо друг от друга пришли к схожим решениям, отметил руководитель группы «ИИ в промышленности» Института AIRI Илья Макаров.
Обложка: © Mohamed Hassan / PxHere