Сбер выпустил обновление модели генерации изображений Kandinsky, которая теперь умеет генерировать надписи на кириллице с учётом текстуры поверхностей.
Разработчики обучили нейросеть, используя более 10 миллионов изображений с русским текстом, написанным различными способами. Это позволило модели научиться различать печатные и прописные буквы.
Сначала Kandinsky обучался генерировать кириллический текст нативно, без использования дополнительных модулей, а потом его дообучили на экспертном датасете, тщательно отобранном и проверенном дизайнерами и художниками.
У новой модели все ещё возникают трудности в ряде категорий запросов — длинные надписи, надписи со смесью кириллицы и латиницы, подробное детальное описание сущности или фона могут получаться не с первого раза. Короткие запросы без указания фона, масштаба и ракурса получаются быстрее и качественней, но тут модель будет фантазировать сама, что, впрочем, часто только к лучшему.
Указание текстуры и освещения помогает создать интересные вариации надписей — камни, вода, лёд, стекло, мармелад, старая древесина, мох, лаковая кожа, глянцевый стол. Буквам можно добавить рельеф или объём. Для прозрачных фактур можно указать «контровой свет», «контражур» — буквы станут полупрозрачными. А для эффектности можно добавить дым или туман.
Потестировать модель самостоятельно уже можно в Telegram-боте Kandinsky и во всех ботах GigaChat (Telegram, ВКонтакте, Одноклассники, Max), а также в web-версии.
Мы тоже попробовали и результат нам понравился.
Читайте ещё материалы по теме:
Сейчас на главной
Компания перешла на технологический стек Yadro для улучшения управления серверами
Комплекс остался на шасси КамАЗ-6560 и способен применять два вида зенитных ракет
За последние 5 лет в России построили и отремонтировали 140 тысяч км дорог
Доплата за версию гибрида 4x4 составляет 305 тысяч рублей
Планируется улучшить процедуру верификации на портале «Госуслуги»
На Липецком механическом заводе обновили систему вентиляции корпусного производства
Разработка снижает энергию активации термического разложения на 25%
«Ленморниипроект» приступил к поиску подрядчиков для проведения работ
Испытания провода для электромагнитной системы токамака провели впервые
Новые комплектующие завода отличаются пониженной шумностью и высокой точностью зацепления
Холдинг приобрёл 258 электровозов и 141 тепловоз
Воздушное судно с гидроцилиндрами и поворотной схемой крыла сможет перевозить до 40 человек
Статьи
-
Как турбина превращает пламя в тягу: инженеры раскрыли принцип работы ТРД
15 янв 2026
-
Нацпроект БАС: как Россия создала собственный рынок дронов
14 янв 2026
-
Без запасного аэродрома: санкции и устаревание авиапарка могут привести к кризису
13 янв 2026
-
Двигатели ОДК обеспечили 13 успешных пусков «Союзов» в 2025 году
13 янв 2026