Компания выпускает в открытый доступ две нейросети: текстовую A-Vibe и мультимодальную A-Vision. Они обучены на 8 миллиардах параметров и созданы для задач анализа документов, автоматизации контента и создания ИИ-ассистентов. Модели адаптированы для работы с русскоязычным контентом.
Модели обеспечивают поддержку простых команд, таких как создание резюме документа или анализ таблиц, а также позволяют создавать автономных ИИ-агентов с функцией вызова внешних инструментов. Разработчики, стартапы, научные организации и бизнес смогут использовать эти модели для решения специфических задач. В проект было вложено около полумиллиарда рублей.
«Благодаря таким инициативам ИИ становится доступным не только корпорациям, но и студентам, стартапам, исследователям и небольшим командам. Чем больше разработчиков вовлечено в создание ИИ-решений, тем быстрее развивается вся отрасль», — поделился Андрей Рыбинцев, управляющий директор по искусственному интеллекту «Авито».
Текстовая A-Vibe и мультимодальная A-Vision созданы «Авито Тех» на базе открытых моделей Qwen3 и Qwen2.5-VL и глубоко адаптированы под российский рынок. Модели обучались на реальных данных в том числе из электронной коммерции. Поэтому они понимают контекст онлайн-торговли и могут работать с товарными описаниями, каталогами, запросами покупателей.
Нейросети работают с большими объёмами текста — до 100 страниц за раз. Они понимают команды без сложных настроек, например «сделай резюме документа» или «проанализируй таблицу».
На популярных российских бенчмарках MERA и RU Arena Hard модель A-Vibe заняла лидирующие места среди лёгких нейросетей и показала хорошие результаты в работе с кодом и отраслевых задачах. A-Vision справляется с анализом сложных документов, графиков, изображений с текстом и научных схем.
Команда «Авито» также перевела на русский язык четыре ведущих международных бенчмарка и выложила их в открытый доступ:
- MATH-500 — сложные математические задачи школьного и вузовского уровня;
- GPQA Diamond — научные вопросы уровня кандидата наук по физике, биологии, химии и другим дисциплинам;
- DROP_RU — задачи на понимание текста с рассуждениями и вычислениями;
- BFCL V3 — оценка способности модели работать с внешними инструментами для создания ИИ-агентов.
Модели находятся в открытом доступе под лицензией Apache 2.0 на платформе Hugging Face**.
* — признан Минюстом РФ иностранным агентом




