Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию

Страницы: 1 2  ... 4  ОТВЕТИТЬ НОВАЯ ТЕМА
Jus 25 мая 2022 в 06:15
Скарификатор перикарда  •  На сайте 19 лет
Сообщений: 400 521
93
Её уже прозвали главным конкурентом аналогичной нейросети DALL-E от OpenAI.

Google представила нейросеть Imagen, которая генерирует изображения на основе текста. Для этого используется метод диффузии: всё начинается с простого, можно сказать схематичного изображения, которое потом улучшается — до тех пор, пока ИИ не решит, что не может сделать его ещё более похожим на заданные параметры.

18 фото via

Imagen начинает с создания небольшого (64×64 пикселя) изображения, а затем выполняет два прохода «сверхвысокого разрешения», чтобы довести его до размера 1024×1024. Однако это не похоже на обычное масштабирование, поскольку суперразрешение AI создает новые детали на картинке, чтобы сделать её более похожей на «техническое задание», прописанное в текстовом запросе.

Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию
Yap 07.05.2026 - 00:18
Продам слона  •  На сайте 21 год
"Белоголовый орлан из шоколадного порошка, манго и взбитых сливок"

Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию
"Хромированная утка с золотым клювом спорит со злой черепахой в лесу"

Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию
"Милый корги живет в доме, сделанном из суши"

Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию
Например, если дать Imagen задание создать изображение собаки на велосипеде, то в его первой версии размер глаза пса будет иметь ширину 3 пикселя, во второй — уже 12 пикселей, а в третьей — все 48 пикселей. Получается, ИИ работает подобно художнику, который начинает с грубого наброска, постепенно дополняя деталями и масштабируя.

Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию
"Крайне злая птица"

Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию
"Мраморная статуя ди-джея Коала перед мраморной статуей проигрывателя. Коала носит большие мраморные наушники"

Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию
"Гигантская змея-кобра на ферме. Змея сделана из кукурузы"

Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию
"Талисман Android из бамбука"

Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию
В Google утверждают, что созданная компанией нейросеть генерирует изображения по описанию с «беспрецедентным фотореализмом». Создатели Imagen сами сравнивают нейросеть с DALL-E 2 — аналогичным ИИ, создающим изображения на основе текста, от OpenAI.

По оценкам Google, Imagen побеждает DALL-E 2 в тестах на человеческую оценку как по точности, так и по достоверности. Компания предложила группе тестировщиков сравнить иллюстрации, созданные при помощи Imagen, DALL-E 2 и других моделей преобразования. Эксперимент показал, что люди чаще всего отдавали предпочтение изображениям, сгенерированным нейросетью Google.

Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию
"Панда, создающая арт-латте": cлева - версия DALL-E, справа - Imagen

Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию


Однако нейросеть от OpenAI опережает аналогичную от Google, поскольку уже появляется полноценной, хоть и закрытой бета-версией, и люди используют её для выполнения повседневных задач и развлечения.

При этом разработчики Imagen изначально озаботились моральными проблемами, которые могут возникнуть в случае, если текстовое задание будет содержать неприемлемые материалы и, таким образом, усугублять имеющиеся в обществе предрассудки и стереотипы.

Потенциальные риски неправильного использования вызывают опасения в отношении открытого исходного кода кода и демонстраций. Поэтому мы решили пока не публиковать код и не проводить публичную демонстрацию.
разработчики Imagen


Требования к данным для моделей преобразования текста в изображение заставили исследователей в значительной степени полагаться на большие, в основном неконтролируемые наборы данных, извлечённые из Интернета. Хотя этот подход позволил в последние годы добиться быстрого прогресса в области алгоритмов, наборы данных такого рода часто отражают социальные стереотипы, уничижительные и вредные ассоциации с маргинализованными группами.

Разработчики Google использовали набор данных LAION-400M, который, как известно, содержит широкий спектр неприемлемого контента, включая порнографические изображения, расистские оскорбления и вредные социальные стереотипы. Imagen полагается на текстовые кодировщики, обученные на неконтролируемых данных веб-масштаба, и, таким образом, наследует социальные предубеждения и ограничения больших языковых моделей.

Imagen пока находится на стадии тестирования: на сайте доступна демо-версия, в которой пользователи не могут сами вводить запросы, а способны лишь выбирать слова из предложенных. Когда Google предложит желающим воспользоваться Imagen, пока неясно.
"Голубая сойка стоит на большой корзине с радужными макаронами"

Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию
"Сиба-ину в кожаной куртке и шляпке катается на скейтборде"

Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию
"Картина маслом, на которой енот в красной рубашке и ковбойской шляпе катается на скейтборде на вершине горы"

Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию
"Британская короткошерстная кошка в кожаной куртке и ковбойской шляпе катается на велосипеде"

Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию
"Панда в чёрной кожаной куртке и солнечных очках играет на гитаре в парке"

Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию
"Пара роботов ужинает на фоне Эйфелевой башни"

Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию
"Осьминог-инопланетянин проплывает через портал, читая газету"

Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию
"Кружка-клубника, наполненная семенами белого кунжута плавает в море тёмного шоколада"

Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию
Все комментарии:
TheUnknown 25 мая 2022 в 06:37
Юморист  •  На сайте 13 лет
19
"Панда в чёрной кожаной куртке и солнечных очках играет на гитаре в парке" - и у панд есть свой Пашкетт.

Размещено через приложение ЯПлакалъ
selans 25 мая 2022 в 06:49
Шутник  •  На сайте 11 лет
11
Под дождь косой с косой косой по косой за косой косой косой косой косой косой косил траву.

Размещено через приложение ЯПлакалъ
Альварес 25 мая 2022 в 06:50
Augie Morosco  •  На сайте 5 лет
2
Прикольно получается.
Kassan888 25 мая 2022 в 06:51
Ку, Ёпта!  •  На сайте 8 лет
4
збс тема, можно свои сайты контентом набивать
olegator133 25 мая 2022 в 06:51
❀wild kadosh❀  •  На сайте 6 лет
2
ну, понеслась бурная фантазия

Размещено через приложение ЯПлакалъ
Понравился пост? Ещё больше интересного в ЯП-Телеграм и ЯП-Max!
Только зарегистрированные и авторизованные пользователи могут оставлять комментарии. Авторизуйтесь, пожалуйста, или зарегистрируйтесь, если не зарегистрированы.
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) Просмотры темы: 13 204
0 Пользователей:
Страницы: 1 2  ... 4  ОТВЕТИТЬ НОВАЯ ТЕМА

 
 

Активные темы



Наверх