Яндекс запускает инновационный сервис для работы с ИИ на смартфонах и ПК

Новый проект с открытым кодом снижает затраты на использование больших языковых моделей

Яндекс представил новый сервис, который позволяет запускать решения на основе искусственного интеллекта на смартфонах и ПК с минимальными затратами вычислительных ресурсов. Этот проект с открытым кодом направлен на снижение расходов при использовании больших языковых моделей (LLM).

Исследователь Владимир Малиновский из научного отдела Яндекса разработал решение для работы с языковой моделью, содержащей 8 миллиардов параметров, на обычных устройствах. Это нововведение значительно упрощает доступ к нейросетям для компаний, стартапов и исследователей. Исходный код проекта доступен на GitHub.

Его основой является технология сжатия нейросетей AQLM, созданная командой Yandex Research в сотрудничестве с университетами ISTA и KAUST летом 2024 года. Это позволяет выполнять все вычисления непосредственно на устройствах пользователей, исключая необходимость в дорогих графических процессорах.

Сервис позволяет пользователям загрузить модель, размер которой был уменьшен с 15 до 2,5 ГБ. Она может функционировать без интернета, а её скорость обработки зависит от мощности устройства. Например, на MacBook Pro M1 модель обрабатывает 1,5 токена в секунду.

Новый сервис Яндекса написан на языке Rust с использованием технологии WebAssembly, что позволяет запускать её прямо в браузере. Несмотря на значительное сжатие, качество работы модели сохраняется на уровне 80% от исходных показателей благодаря методам AQLM и PV-tuning.

Читайте ещё по теме:

Нейросеть от Яндекса научилась тезисно пересказывать текст

YandexGPT сдала ЕГЭ по литературе

Следит за нитью разговора: нейросеть от Яндекса стала более самообучаемой

07:05 Новости
GG WB не случилось: Wildberries поставила игровые планы на паузу Выход на рынок гейминга оценивали в 2,5 миллиарда рублей, но риск оказался слишком высоким
06:59 Новости
Киберполигон для развития ИИ предложили создать в Челябинске Цифровую инфраструктуру могут разместить на базе межуниверситетского кампуса «Южный Урал»
06:16 Новости
Закон об ИИ«потерял зубы»: маркировку отменили, а авторские права и ответственность отложили Господдержку получат только «суверенные» и «национальные» разработки
21 июн 15:35 Новости
Mash: Российские хакеры взломали 50 тысяч камер в Европе и поставили ИИ следить за каждым шагом Группировка NoName057(16) проводит операцию «Разбитый байт» до 1 июля
21 июн 15:15 Новости
ИИ под закон: Госдума готовит поэтапное регулирование нейросетей Вице-спикер ГД Бабаков заявил, что путь будет долгим и не ограничится одним документом
Источники:
AQLMRS

Сейчас на главной