Підписуйтеся на наш телеграм канал!

Розробники найвідомішого штучного інтелекту створили нейромережу, що критикує ChatGPT

Розробники найвідомішого штучного інтелекту створили нейромережу, що критикує ChatGPT

4:33 pm, 28 Червня, 2024

Компанія Ope­nAI представила нову модель штучного інтелекту Crit­icG­PT, призначену для виявлення помилок у коді, згенерованому Chat­G­PT. Нейромережа буде використовуватися як алгоритмічний помічник для тестувальників, які перевіряють програмний код, створений Chat­G­PT, інформує Ars Tech­ni­ca.

“Crit­icG­PT, заснований на сімействі великої мовної моделі GPT‑4, аналізує код і вказує на потенційні помилки, полегшуючи спеціалістам виявлення недоліків, які могли б залишитися непоміченими через людський фактор”, — заявили у компанії.

Дослідження Ope­nAI, опубліковане у рамках роботи “LLM Crit­ics Help Catch LLM Bugs”, показало, що в 63% випадків аннотатори надавали перевагу критиці Crit­icG­PT над людською. Команди, які використовували Crit­icG­PT, створювали повніші відгуки та знижували рівень конфабуляцій (хибних фактів і галюцинацій — ред.). Модель була навчена на наборі даних з навмисно внесеними помилками, що дозволило їй розпізнавати різні типи помилок у коді.

Crit­icG­PT виявився здатним вловлювати як навмисно внесені баги, так і природні помилки в коді, згенерованому Chat­G­PT. Для цього був розроблений новий метод “Force Sam­pling Beam Search” (FSBS), який допомагає моделі писати детальні огляди коду, регулюючи глибину пошуку проблем і контролюючи частоту хибних спрацьовувань.

Інтерес викликало те, що можливості Crit­icG­PT виходять за межі простої перевірки коду. В експериментах модель застосували до ряду тренувальних даних Chat­G­PT, раніше оцінених людьми як бездоганні, і Crit­icG­PT виявив помилки у 24% випадків, які згодом підтвердили експерти. Це демонструє потенціал моделі не лише для технічних завдань, але й для виявлення тонких помилок, які можуть залишитися непоміченими навіть при ретельній перевірці людиною.

Попри обнадійливі результати, Crit­icG­PT, як і всі моделі ШІ, має свої обмеження. Модель навчалася на відносно коротких відповідях Chat­G­PT, що може не підготувати її до оцінки довших і складніших завдань. Команда дослідників визнає, що модель найбільш ефективна у виявленні помилок, які можна визначити в одному конкретному місці коду, проте реальні помилки часто розкидані по декількох частинах відповіді, що є викликом для майбутніх ітерацій моделі.

BTC

$76,142.50

-0.98%

ETH

$2,311.29

-2.44%

BNB

$622.79

-1.72%

XRP

$1.42

-0.93%

SOL

$85.91

-1.27%

Всі курси
Показати більше