Поиск по публикациям и новостям

Яндекс запускает инновационный сервис для работы с ИИ на смартфонах и ПК
Новый проект с открытым кодом снижает затраты на использование больших языковых моделей

Яндекс представил новый сервис, который позволяет запускать решения на основе искусственного интеллекта на смартфонах и ПК с минимальными затратами  вычислительных ресурсов. Этот проект с открытым кодом направлен на снижение расходов при использовании больших языковых моделей (LLM).

Исследователь Владимир Малиновский из научного отдела Яндекса разработал решение для работы с языковой моделью, содержащей 8 миллиардов параметров, на обычных устройствах. Это нововведение значительно упрощает доступ к нейросетям для компаний, стартапов и исследователей. Исходный код проекта доступен на GitHub.

Его основой является технология сжатия нейросетей AQLM, созданная командой Yandex Research в сотрудничестве с университетами ISTA и KAUST летом 2024 года. Это позволяет выполнять все вычисления непосредственно на устройствах пользователей, исключая необходимость в дорогих графических процессорах.

Сервис позволяет пользователям загрузить модель, размер которой был уменьшен с 15 до 2,5 ГБ. Она может функционировать без интернета, а её скорость обработки зависит от мощности устройства. Например, на MacBook Pro M1 модель обрабатывает 1,5 токена в секунду.

Новый сервис Яндекса написан на языке Rust с использованием технологии WebAssembly, что позволяет запускать её прямо в браузере. Несмотря на значительное сжатие, качество работы модели сохраняется на уровне 80% от исходных показателей благодаря методам AQLM и PV-tuning.

Читайте ещё по теме:

Нейросеть от Яндекса научилась тезисно пересказывать текст

YandexGPT сдала ЕГЭ по литературе

Следит за нитью разговора: нейросеть от Яндекса стала более самообучаемой

Источники
AQLMRS

Сейчас на главной

4 минуты назад
АвтоВАЗ представил обновлённую Lada Niva Sport с усиленной трансмиссией к 48-летию легендарной модели ВАЗ-2121

Самая мощная «Нива» получила около 140 конструктивных изменений

5 минут назад
Птица высокого полета: «для разведчика СКАТ 350 М нет невыполнимых задач»

Беспилотник способен находиться в воздухе до четырех часов в любых погодных условиях

19 минут назад
«Автотор» понёс убытки в 4,3 млрд рублей от сборки автомобилей BAIC и Kaiyi

Калининградский завод столкнулся с финансовыми трудностями, несмотря на рост продаж BAIC

30 минут назад
В Хабаровском крае планируется открыть производство электроходов

Губернатор Хабаровского края Дмитрий Демешин рассказал, что в регионе планируется запустить производство электрических речных судов

44 минуты назад
Прототип спортивного болида BR03 для гонок на выносливость представила компания BR Engineering

Болид показали на выставке «Мотовесна 2025»

44 минуты назад
Изготовитель истребителей Су-30СМ вводит в эксплуатацию два новых производственных здания

Объекты стали частью масштабной программы модернизации предприятия

46 минут назад
Уникальный электрокар D-Car 1500 представили на выставке «Мотовесна 2025»

Машина оборудована бесщёточным редукторным электродвигателем

48 минут назад
Мощность 10 кВт, разгон до 120 км/ч: раскрыты характеристики новых электромотоциклов «Минск»

Запас хода — до 180 км

48 минут назад
Манёвренный, компактный, динамичный: электромобиль Evera представили на выставке «Мотовесна 2025»

Автомобиль отличается экономичным расходом энергии

48 минут назад
Метеозависимым расслабиться: в ИКИ РАН опровергли слухи о крупных магнитных бурях на выходных

Слабая геомагнитная активность не представляет опасности для Земли

48 минут назад
Уникальный робот-разведчик с необычным принципом движения разработали в России

Комплекс способен перемещаться практически по любой поверхности

49 минут назад
КамАЗ и «Ремдизель» готовят новый брутальный внедорожник: первые детали

Проект обещает надежную и мощную модель, схожую с DongFeng Warrior M600