Нейросеть A-Vibe стала одной из лучших среди лёгких ИИ-моделей на русском языке

A-Vibe показала хорошие результаты среди аналогичных моделей в обработке запросов, генерации кода и поддержке осмысленного диалога. Технология уже работает в сервисах Авито, например, помогает продавцам писать продающие описания и быстрее договариваться о сделке в мессенджере. До конца года компания планирует добавить ещё 20 новых сценариев.

«Первое место доказывает, что оптимизированная архитектура и качественные данные могут обеспечить отличные результаты даже при небольшом размере модели. Именно обучение небольшой модели под наши нужды позволяет нам закладывать окупаемость инвестиций: Авито планирует вложить в GenAI около 12 млрд рублей, а заработать более 21 млрд рублей к 2028 году», — отметил Андрей Рыбинцев, старший директор по данным и аналитике Авито.

Результаты A-Vibe

A-Vibe продемонстрировала хорошие результаты в ряде задач различной сложности — от базового понимания текста до продвинутых лингвистических задач, требующих глубокой работы с контекстом.

Некоторые результаты тестирования MERA:

генерация кода на 25% лучше Gemini 1.5 с 8 млрд параметров;
ведение диалога на 32% точнее Llama 3.1 с 405 млрд параметров;
способность анализировать смысл текста на 23% точнее Claude 3.5 Haiku.

Познакомиться с рейтингом можно на сайте MERA https://mera.a-ai.ru/ru/leaderboard. В фильтре «Размер модели» нужно выбрать «≥5B — 10B», чтобы получить рейтинг среди небольших моделей.

Технические особенности A-Vibe

При разработке генеративных моделей A-Vibe и A-Vision использовалась открытая модель для начального этапа обучения. Однако она имела ограничения в работе с русским языком: модель обучалась на данных более чем 100 языков, при этом русский составлял менее 1% общего объёма данных, из-за чего модель плохо понимала и генерировала текст на русском.

Разработчики модифицировали и провели «русификацию» модели, заменив стандартный токенизатор на собственный, который умеет работать с русским языком. Это дало два ключевых преимущества, выделивших A-Vibe в своём классе:

модель стала обрабатывать русский текст быстрее до двух раз по сравнению с оригинальной;
понимание и генерация текста на русском улучшилась.

Анастасия Рысьмятова, руководитель разработки больших языковых моделей «Авито», рассказала, что планируется выпустить модель в открытый доступ. Она отмечает, что это может помочь малому бизнесу внедрять передовые технологии без значительных инвестиций, образовательным учреждениям — создавать прикладные программы, а независимым разработчикам — строить современные сервисы на базе отечественных технологий.

Справка

Бенчмарк MERA — это российский стандарт оценки языковых моделей, разработанный научным сообществом. В рамках замера тестируют понимание русского языка и культурного контекста. Проект поддерживает Альянс ИИ, ведущие индустриальные игроки и академические партнёры, которые занимаются исследованием языковых моделей.

Цифры HUMAN BENCHMARK — это реальные результаты людей. Языковые модели приближаются к этим значениям, но окончательно превзойти человека ещё не смогли.

Фото: «Авито»

Нашли опечатку? Выделите ее и нажмите Ctrl+Enter

Общественный транспорт в Новосибирске

Учебный год-2025 в Новосибирске

Куда пойти учиться

Рынок недвижимости в Новосибирске-2025

Нейросеть A-Vibe стала одной из лучших среди лёгких ИИ-моделей на русском языке