Підписуйтеся на наш телеграм канал!

Розробник ChatGPT представив оновлену нейромережу, яка генерує найдосконаліші зображення

Розробник ChatGPT представив оновлену нейромережу, яка генерує найдосконаліші зображення

5:33 pm, 21 Вересня, 2023

Компанія Ope­nAI представила нову версію генератора зображень DALL‑E та заявила про плани інтегрувати його у Chat­G­PT. Розробники повідомили, що DALL‑E 3 може “значно краще розуміти запити, аналізувати складні інструкції та генерувати надзвичайно детальні та точні зображення” в порівнянні з DALL‑E 2.

«Сучасні генератори зображень мають тенденцію ігнорувати слова чи описи, змушуючи користувачів вивчати промпт-інженерію. DALL‑E 3 є кроком вперед у нашій здатності створювати зображення, які точно відповідають наданому вами запиту», — повідомили представники Ope­nAI в описі нового генератора зображень.

Модель краще справляється з такими складними для штучного інтелекту дрібними деталями, як людські руки. Навіть за однакових запитів результати DALL‑E 3 набагато кращі, ніж у DALL‑E 2, заявили розробники. DALL‑E 3 зможе точно відобразити сцену з конкретними об’єктами і врахувати, як вони пов’язані один з одним.

Ope­nAI планує в найближчому майбутньому вбудувати DALL‑E 3 у чат-бот Chat­G­PT Plus та Enter­prise. Комбінація мовних навичок чат-бота з генератором зображень дозволить створювати точніші зображення та надасть ще більше можливостей у налаштуванні запиту, якщо перший отриманий результат виявиться не тим, чого очікував користувач.

«При запиті Chat­G­PT автоматично згенерує індивідуальні докладні підказки для DALL‑E 3, на основі яких він створить зображення. Якщо отримане зображення сподобається користувачеві, але воно не зовсім точно відображатиме запит, то до нього можна буде внести зміни, додавши лише кілька додаткових уточнюючих слів», — кажуть в Ope­nAI

Зараз DALL‑E 3 знаходиться на стадії дослідницької попередньої версії та стане доступним підписникам Chat­G­PT Plus та Enter­prise у жовтні через API. Слід нагадати, що використання DALL‑E 2 платне, а місячна підписка на Chat­G­PT Plus коштує $20. Наразі єдиним великим чат-ботом, що пропонує безкоштовний вбудований генератор зображень, є Bing Chat AI від Microsoft. Він працює на базі потужної мовної моделі GPT‑4 від Ope­nAI.

Нагадаємо — у квітні цього року штучний інтелект спровокував масштабний скандал, здобувши перемогу на міжнародному змаганні. Німецький фотограф Борис Ельдагсен зізнався, що його роботу, яка перемогла в номінації «Креатив» конкурсу Sony World Pho­tog­ra­phy Awards 2023, згенеровано за допомогою нейромережі DALL‑E. Ситуація спровокувала масштабний скандал, обуривши фотографів та митців з усього світу.

За словами Ельдагсена, він відправив на розгляд журі згенероване зображення, щоб перевірити, чи візьмуть його до участі у такому престижному конкурсі. Після оголошення переможців фотограф відмовився від нагороди та грошового призу розміром в $ 5000. На роботі «PSEUDOMNESIA: The Elec­tri­cia» зображено «фальшиві спогади про минуле, яке ніколи не існувало, і яке ніхто не фотографував».

BTC

$75,409.70

2.46%

ETH

$2,320.73

2.02%

BNB

$628.98

1.90%

XRP

$1.43

1.80%

SOL

$85.68

2.17%

Всі курси
Показати більше