Підписуйтеся на наш телеграм канал!
Розробник ChatGPT представив оновлену нейромережу, яка генерує найдосконаліші зображення
Компанія OpenAI представила нову версію генератора зображень DALL‑E та заявила про плани інтегрувати його у ChatGPT. Розробники повідомили, що DALL‑E 3 може “значно краще розуміти запити, аналізувати складні інструкції та генерувати надзвичайно детальні та точні зображення” в порівнянні з DALL‑E 2.
«Сучасні генератори зображень мають тенденцію ігнорувати слова чи описи, змушуючи користувачів вивчати промпт-інженерію. DALL‑E 3 є кроком вперед у нашій здатності створювати зображення, які точно відповідають наданому вами запиту», — повідомили представники OpenAI в описі нового генератора зображень.
Модель краще справляється з такими складними для штучного інтелекту дрібними деталями, як людські руки. Навіть за однакових запитів результати DALL‑E 3 набагато кращі, ніж у DALL‑E 2, заявили розробники. DALL‑E 3 зможе точно відобразити сцену з конкретними об’єктами і врахувати, як вони пов’язані один з одним.
OpenAI планує в найближчому майбутньому вбудувати DALL‑E 3 у чат-бот ChatGPT Plus та Enterprise. Комбінація мовних навичок чат-бота з генератором зображень дозволить створювати точніші зображення та надасть ще більше можливостей у налаштуванні запиту, якщо перший отриманий результат виявиться не тим, чого очікував користувач.
«При запиті ChatGPT автоматично згенерує індивідуальні докладні підказки для DALL‑E 3, на основі яких він створить зображення. Якщо отримане зображення сподобається користувачеві, але воно не зовсім точно відображатиме запит, то до нього можна буде внести зміни, додавши лише кілька додаткових уточнюючих слів», — кажуть в OpenAI
Зараз DALL‑E 3 знаходиться на стадії дослідницької попередньої версії та стане доступним підписникам ChatGPT Plus та Enterprise у жовтні через API. Слід нагадати, що використання DALL‑E 2 платне, а місячна підписка на ChatGPT Plus коштує $20. Наразі єдиним великим чат-ботом, що пропонує безкоштовний вбудований генератор зображень, є Bing Chat AI від Microsoft. Він працює на базі потужної мовної моделі GPT‑4 від OpenAI.
Нагадаємо — у квітні цього року штучний інтелект спровокував масштабний скандал, здобувши перемогу на міжнародному змаганні. Німецький фотограф Борис Ельдагсен зізнався, що його роботу, яка перемогла в номінації «Креатив» конкурсу Sony World Photography Awards 2023, згенеровано за допомогою нейромережі DALL‑E. Ситуація спровокувала масштабний скандал, обуривши фотографів та митців з усього світу.
За словами Ельдагсена, він відправив на розгляд журі згенероване зображення, щоб перевірити, чи візьмуть його до участі у такому престижному конкурсі. Після оголошення переможців фотограф відмовився від нагороди та грошового призу розміром в $ 5000. На роботі «PSEUDOMNESIA: The Electricia» зображено «фальшиві спогади про минуле, яке ніколи не існувало, і яке ніхто не фотографував».

