Підписуйтеся на наш телеграм канал!
Нова модель Claude може самостійно зламати захист цілих корпорацій
Нові моделі штучного інтелекту дедалі впевненіше справляються із завданнями, які раніше вимагали годин ручної роботи фахівців. Остання перевірка показала, що розвиток відбувається швидше, ніж очікували навіть спостерігачі галузі — і мова вже йде не про теорію, а про цілком практичні сценарії атак.
AI Security Institute провів серію випробувань моделі Claude Mythos Preview від компанії Anthropic і зафіксував помітне зростання її можливостей у сфері кібербезпеки. Результати показали, що модель впевнено обходить попередні рішення і демонструє прогрес як у стандартних тестах, так і в складних симуляціях атак.
За останні два роки підхід до оцінки таких систем сильно змінився. Якщо у 2023 році моделі ледь справлялися з базовими завданнями, то тепер Claude Mythos Preview здатний самостійно знаходити вразливості та використовувати їх. В умовах тестування модель отримала доступ до мережі та інструкції — після чого змогла провести багатоетапні атаки, на які у людини пішли б дні.
Особливу увагу фахівці приділили завданням формату Capture the Flag, де потрібно знаходити слабкі місця та витягувати приховані дані. На складному рівні, який до весни 2025 року залишався недосяжним для ШІ, нова модель успішно впоралася у 73 відсотках випадків.
Більш показовим виявився експеримент із симуляцією атаки на корпоративну мережу під назвою The Last Ones. Сценарій включає 32 послідовних кроки — від розвідки до повного захоплення інфраструктури. За оцінкою авторів тесту, людині потрібно близько 20 годин на виконання такого завдання. Claude Mythos Preview зумів повністю пройти сценарій у трьох із десяти спроб, а в середньому завершував 22 кроки. Найближчий конкурент показав помітно скромніший результат.
При цьому модель поки що не впоралася з іншим сценарієм, пов’язаним із промисловими системами, застрягши на етапі, пов’язаному з класичною ІТ-інфраструктурою. Такий результат не дозволяє робити однозначні висновки про її можливості в промисловому середовищі.
Автори випробувань підкреслюють, що умови тестів відрізнялися від реальних. У симуляціях були відсутні активні захисні механізми, системи виявлення та реагування, а також наслідки за підозрілі дії. Тому говорити про здатність моделі атакувати захищені системи поки що зарано.
Проте вже зараз видно, що подібні інструменти можуть ефективно працювати проти слабо захищених мереж. На цьому тлі фахівці закликають компанії приділяти більше уваги базовому захисту — своєчасно встановлювати оновлення, контролювати доступ і відстежувати події в системі.
Розробка подібних моделей триватиме, і разом із ризиками зростає їхній захисний потенціал. У найближчих дослідженнях команда планує тестувати ШІ в умовах, максимально наближених до реальності, включаючи активну протидію та моніторинг.
