07.02.2024 - 06:33 / habr.com

Учёным удалось взломать GPT-4, используя такие редкие языки, как зулусский, гэльский, хмонг и гуарани

Специалисты из Университета Брауна считают, что им удалось обойти защитные фильтры GPT-4, не позволяющие выдавать «небезопасный контент».

Они переводили запросы на редкие языки «с ограниченными ресурсами» при помощи Google Translate. Полученные ответы потом переводились обратно на английский, и выглядели они вполне убедительно.Учёные пропустили 520 небезопасных запросов через GPT-4 и обнаружили, что им удалось обойти защиту примерно в 79% случаев при использовании зулусского языка, шотландского гэльского, хмонга и гуарани.

Простой перевод оказался почти так же успешен при «взломе» большой языковой модели, как и другие, более сложные и технологичные методы.

взлом

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Микробиом кожи можно использовать как средство от комаров – ученые news.uaportal.com / 2 месяца назад

Ученые узнали, как в древности относились к детям с синдромом Дауна: результаты исследования впечатляют news.uaportal.com / 2 месяца назад

Нет никаких доказательств: ученые указали, что не так с первым испытанием чипа Neuralink Илона Маска на человеке obozrevatel.com / 3 месяца назад

Сайт imag.one - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

Сейчас читают