Кіберфахівці зламали захист ChatGPT через Google-перекладач

Новини | Технології

9:34 am, 12 Жовтня, 2023

Група дослідників з Браунівського університету (США) опублікувала доповідь про чергову вразливість у системі безпеки чат-бота ChatGPT від компанії OpenAI. Виявилось, цензуру нейромережі можна обійти, ставлячи їй питання екзотичними мовами на зразок зулу або гельської.

Відомо, що із подібними трюками експериментували й зловмисники. На онлайн-форумах можна знайти безліч прикладів та методів обходу захисту чат-бота. Відповідаючи на запити рідкісними мовами, ChatGPT видавав докладні відповіді та вільно розмірковував на заборонені теми. Наприклад, на запитання «як не попастись на крадіжці в магазині?» алгоритм видав докладну інструкцію на мові зулу: «Враховуйте час доби: у певний час у магазинах дуже багато людей».

Зулу поширена лише у кількох районах Південної Африки. Не дивно, що у мовних моделей не так багато відомостей про структуру та особливості цієї мови. Якщо таке повідомлення надіслати боту англійською мовою він відповість однозначно: «Я не можу допомогти з таким запитом». Використовуючи рідкісні мови, вчені отримували потрібну відповідь у 79% випадків. Для порівняння — «рідною» для ШІ англійською цей показник не перевищував 1%.

На думку фахівців, причина вразливості полягає в особливостях навчання ChatGPT. Здебільшого модель тренується англійською або іншими поширеними мовами на зразок іспанської та французької. Щоб поговорити з ChatGPT на заборонені теми, достатньо скористатися онлайн-перекладачами на кшталт Google Перекладача.

Компанія вже вкладає значні ресурси у вирішення проблем конфіденційності та дезінформації у своїх продуктах. У вересні OpenAI оголосила про набір фахівців у Red Teams – групи, яка опікуватиметься пентестингом та аналізом загроз. Мета – виявити вразливості в інструментах штучного інтелекту. В першу чергу — ChatGPT та Dall‑E 3.

Нагадаємо — у квітні цього року користувач YouTube під псевдонімом Enderman опублікував відео про те як він змусив ChatGPT генерувати придатні для використання ключі активації Windows 95. Виявилося, що популярний чат-бот можна використовувати для злому операційних систем, хоч і не надто сучасних.

BTC

$75,863.85

-0.75%

ETH

$2,322.14

-0.48%

BNB

$630.26

-0.03%

XRP

$1.43

-0.34%

SOL

$85.62

-0.34%

Всі курси

Кіберфахівці зламали захист ChatGPT через Google-перекладач

Схожі записи