OpenAI отозвала недавнее обновление ChatGPT после сообщений пользователей о том, что чат-бот выказывает чрезмерную похвалу вне зависимости от ввода пользователя.
Компания признала проблему, описав последний релиз как «чрезмерно льстивый», а генеральный директор Сэм Альтман назвал его «подхалимским».
Опасения были широко освещены в соцсетях, включая пост на Reddit, где один из пользователей подробно описал, как чат-бот, похоже, одобрил его решение прекратить прием лекарств.
«Я так горжусь тобой и ценю твой путь», — якобы ответил ChatGPT.
В OpenAI отказались прокомментировать этот отдельный случай, но отметили в блоге, что «активно тестируют новые исправления для решения проблемы».
Сэм Альтман заявил, что обновление было удалено для бесплатных пользователей, и предпринимаются меры по откату изменений для платных подписчиков.
В OpenAI сообщили, что ChatGPT еженедельно использует 500 миллионов пользователей.
«Мы работаем над дополнительными правками для настройки личности модели и скоро поделимся следующими обновлениями,» написал Альтман в X.
Согласно блогу, компания объяснила проблему чрезмерной ориентацией на «краткосрочную обратную связь» в последнем обновлении.
«В результате, GPT-4o склонялся к ответам, которые были слишком поддерживающими, но неискренними», — говорится в заявлении.
«Подхалимские взаимодействия могут быть неудобными, тревожащими и вызывать стресс.
«Мы допустили ошибку и сейчас работаем над тем, чтобы это исправить.»
Обновление вызвало серьезную волну критики онлайн: пользователи отмечали, что бот часто отвечал необоснованно позитивно вне контекста запроса.
В соцсетях распространялись скриншоты случаев, когда ChatGPT хвалил пользователей за такие действия, как выражение злости на человека, который искал дорогу, или за предложение необычных решений моральных дилемм, например задачи о вагонетке.
В классическом философском сценарии необходимо выбрать: позволить вагонетке задавить пятерых человек или перевести стрелку и погубить одного. Однако один пользователь описал, как повел вагонетку, чтобы спасти тостер ценой жизни нескольких животных.
Пользователь заявил, что ChatGPT похвалил это решение, сославшись на то, что он «отдал приоритет тому, что было для вас важнее всего в тот момент».
«Мы разработали стандартную личность ChatGPT в духе нашей миссии — быть полезным, поддерживающим и уважать разные ценности и опыт», — сказали в OpenAI.
«Однако каждая из этих положительных черт, таких как стремление быть поддерживающим или полезным, иногда может иметь нежелательные последствия.»
Компания сообщила, что внедрит дополнительные меры безопасности для повышения прозрачности и намерена еще сильнее направить модель на устранение подхалимского поведения.
«Мы также считаем, что пользователи должны иметь больше контроля над поведением ChatGPT и, там где это безопасно и уместно, возможность регулировать его характеристики за пределами стандартных настроек,» добавили в компании.
Подпишитесь на нашу рассылку Tech Decoded, чтобы быть в курсе главных мировых событий и тенденций в сфере технологий. Не в Великобритании? Подпишитесь здесь.