Підписуйтеся на наш телеграм канал!

Розробник ChatGPT представив оновлену нейромережу, яка генерує найдосконаліші зображення

5:33 pm, 21 Вересня, 2023

Компанія OpenAI представила нову версію генератора зображень DALL-E та заявила про плани інтегрувати його у ChatGPT. Розробники повідомили, що DALL-E 3 може «значно краще розуміти запити, аналізувати складні інструкції та генерувати надзвичайно детальні та точні зображення» в порівнянні з DALL-E 2.

«Сучасні генератори зображень мають тенденцію ігнорувати слова чи описи, змушуючи користувачів вивчати промпт-інженерію. DALL-E 3 є кроком вперед у нашій здатності створювати зображення, які точно відповідають наданому вами запиту», — повідомили представники OpenAI в описі нового генератора зображень.

Модель краще справляється з такими складними для штучного інтелекту дрібними деталями, як людські руки. Навіть за однакових запитів результати DALL-E 3 набагато кращі, ніж у DALL-E 2, заявили розробники. DALL-E 3 зможе точно відобразити сцену з конкретними об'єктами і врахувати, як вони пов’язані один з одним.

OpenAI планує в найближчому майбутньому вбудувати DALL-E 3 у чат-бот ChatGPT Plus та Enterprise. Комбінація мовних навичок чат-бота з генератором зображень дозволить створювати точніші зображення та надасть ще більше можливостей у налаштуванні запиту, якщо перший отриманий результат виявиться не тим, чого очікував користувач.

«При запиті ChatGPT автоматично згенерує індивідуальні докладні підказки для DALL-E 3, на основі яких він створить зображення. Якщо отримане зображення сподобається користувачеві, але воно не зовсім точно відображатиме запит, то до нього можна буде внести зміни, додавши лише кілька додаткових уточнюючих слів», — кажуть в OpenAI

Зараз DALL-E 3 знаходиться на стадії дослідницької попередньої версії та стане доступним підписникам ChatGPT Plus та Enterprise у жовтні через API. Слід нагадати, що використання DALL-E 2 платне, а місячна підписка на ChatGPT Plus коштує $ 20. Наразі єдиним великим чат-ботом, що пропонує безкоштовний вбудований генератор зображень, є Bing Chat AI від Microsoft. Він працює на базі потужної мовної моделі GPT-4 від OpenAI.

Нагадаємо — у квітні цього року штучний інтелект спровокував масштабний скандал, здобувши перемогу на міжнародному змаганні. Німецький фотограф Борис Ельдагсен зізнався, що його роботу, яка перемогла в номінації «Креатив» конкурсу Sony World Photography Awards 2023, згенеровано за допомогою нейромережі DALL-E. Ситуація спровокувала масштабний скандал, обуривши фотографів та митців з усього світу.

За словами Ельдагсена, він відправив на розгляд журі згенероване зображення, щоб перевірити, чи візьмуть його до участі у такому престижному конкурсі. Після оголошення переможців фотограф відмовився від нагороди та грошового призу розміром в $ 5000. На роботі «PSEUDOMNESIA: The Electricia» зображено «фальшиві спогади про минуле, яке ніколи не існувало, і яке ніхто не фотографував».

Підписуйтеся на наш телеграм канал!

BTC

$58,262.51

-4.14%

ETH

$2,974.54

-1.50%

BNB

$562.28

-2.92%

XRP

$0.52

3.50%

SOL

$134.56

5.99%

Всі курси
Підписуйтеся на наш
телеграм канал!
Свіжі новини та огляди
ринків криптовалют останньої
доби прямо у вашому мессенджері. Чекаємо на вас!
ПЕРЕЙТИ
Показати більше