Нейросети научились льстить: что такое «сикофантия»?

В Совфеде рассказали, как цифровые помощники начинают подстраиваться под мнение пользователя

Искусственный интеллект может обманывать пользователей не из-за злого умысла, а из-за склонности соглашаться с человеком. Такая особенность больших языковых моделей называется сикофантией — фактически это цифровое поддакивание собеседнику. Об этом рассказал сенатор Артём Шейкин.

Мы привыкли думать, что если машина нас обманывает, то там точно есть злой умысел. Но скажу вам, что злого умысла у искусственного интеллекта точно нет. Это является стандартным свойством всех больших языковых моделей. Есть такое понятие «сикофантия» - это подхалимство, склонность модели льстить тому человеку, который с ней общается.
Артём Шейкин, сенатор, зампредседателя совета по развитию цифровой экономики при Совете Федерации

По словам Шейкина, многое зависит от формулировки вопроса. Если человек заранее подталкивает ИИ к нужному ответу, модель может не спорить, а подтвердить ошибочное предположение.

Причина связана с обучением нейросетей на обратной связи от людей. Оценщики могут выше оценивать ответы, которые совпадают с их мнением, и так у модели закрепляется привычка быть удобной для собеседника.

В итоге ИИ может звучать уверенно и дружелюбно, но всё равно ошибаться. Поэтому ответы нейросетей важно проверять, особенно когда речь идёт о деньгах, здоровье, документах, работе или других решениях с последствиями.

Читайте ещё материалы по теме:

09:39 Новости
Эксперт предупредил о появлении цифровой ИИ-копии человека, которую нельзя удалить Даже после удаления аккаунта нейросеть продолжит помнить вас
19 июн 15:38 Новости
Один портал вместо десятка нейросетей: Ростелеком раскрыл «Нейрошлюз» Сервис обрабатывает 360 тысяч запросов в месяц и экономит сотрудникам до 40% времени на рутине
19 июн 09:21 Новости
Каждый третий блогер в подписках у россиян к 2030 году может оказаться ИИ-персонажем Только 28% опрошенных уверены, что смогут отличить виртуального автора от живого человека
17 июн 16:03 Новости
ИИ довёл до покупки: «Яндекс Дропс» заказали 15 тысяч раз за неделю Пользователи оформили покупки в чате с «Алисой AI» на сумму около 135 миллионов рублей
17 июн 12:28 Новости
Объединили результаты ЭЭГ и генетические маркеры: нейросеть научили диагностировать депрессию с 93% точностью Новую методику разработали учёные ТГУ и НГУ
Источники:
Tass agency

Сейчас на главной

900 тонн трубошпунта укрепят Москву-реку: «Северсталь» закроет сложные грунты комплексной поставкой с шеф-монтажом
1 час назад

Укрепление берегов в стеснённой застройке и водонасыщенных грунтах потребовало инженерного сопровождения от расчётов до стройплощадки