Теперь умеет по-русски: Kandinsky Image научился генерировать изображения с надписями на кириллице

Нейросеть научилась писать без ошибок и на любых поверхностях

Сбер выпустил обновление модели генерации изображений Kandinsky, которая теперь умеет генерировать надписи на кириллице с учётом текстуры поверхностей.

Разработчики обучили нейросеть, используя более 10 миллионов изображений с русским текстом, написанным различными способами. Это позволило модели научиться различать печатные и прописные буквы.

Сначала Kandinsky обучался генерировать кириллический текст нативно, без использования дополнительных модулей, а потом его дообучили на экспертном датасете, тщательно отобранном и проверенном дизайнерами и художниками.

У новой модели все ещё возникают трудности в ряде категорий запросов — длинные надписи, надписи со смесью кириллицы и латиницы, подробное детальное описание сущности или фона могут получаться не с первого раза. Короткие запросы без указания фона, масштаба и ракурса получаются быстрее и качественней, но тут модель будет фантазировать сама, что, впрочем, часто только к лучшему.

Указание текстуры и освещения помогает создать интересные вариации надписей — камни, вода, лёд, стекло, мармелад, старая древесина, мох, лаковая кожа, глянцевый стол. Буквам можно добавить рельеф или объём. Для прозрачных фактур можно указать «контровой свет», «контражур» — буквы станут полупрозрачными. А для эффектности можно добавить дым или туман.

Потестировать модель самостоятельно уже можно в Telegram-боте Kandinsky и во всех ботах GigaChat (Telegram, ВКонтакте, Одноклассники, Max), а также в web-версии.

Мы тоже попробовали и результат нам понравился.

Читайте ещё материалы по теме:

15 мая 17:43 Новости
Китайские игры заходят через RuStore: магазин даёт до половины установок в России Азиатские издатели отмечают высокий трафик, платежи и возврат аудитории
15 мая 14:52 Новости
ИИ вместо вечного поиска: как «Алису AI» используют айтишники, юристы и маркетологи Почти четверть обращений с компьютера уже связана с работой, наукой или карьерой
15 мая 11:42 Новости
Соцсетям предложили самим блокировать дипфейки: в Роскомнадзоре придумали новый подход Подозрительный контент могут временно ограничивать, пока не подтвердят его подлинность
15 мая 08:33 Новости
Россия должна вложиться в свои аналоги OpenAI, Google и Anthropic: в Минфине рассказали о прорывных технологиях Замминистра Чебесков: развитие больших языковых моделей потребует серьёзных инвестиций
14 мая 10:42 Новости
Первую российскую BIOS убрали из реестра отечественного ПО Минцифры исключило систему из списка из-за неактуальных сведений о продукте
Источники:
Сбер

Сейчас на главной