Posted 25 мая 2022,, 10:17

Published 25 мая 2022,, 10:17

Modified 7 марта, 12:11

Updated 7 марта, 12:11

Google представила нейросеть Imagen с генерацией картинки по текстовому описанию

25 мая 2022, 10:17
Американская корпорация Google представила нейросеть Imagen, обученную создавать фотореалистичные изображения по текстовому описанию. Разработчики заверяют, что Imagen превосходит существующие аналоги (в частности, DALL-E от OpenAI) по точности и достоверности.

Создатели объяснили, как работает нейросеть. Для генерации изображения используется метод каскадной диффузии. Таким образом Imagen создает схематический набросок, который в дальнейшем улучшается и масштабируется до нужного разрешения. Это делается до тех пор, пока результат не будет соответствовать запросу.

Несколько опубликованных примеров работы Imagen.

В конце осени «Сбер» представил аналогичную нейросеть ruDALL-E, напоминает «Ъ». Согласно заявлению разработчиков, она адаптирована для разработки дизайна интерьера, векторных иллюстраций, материалов для рекламы и создания стоковых картинок и других подобных задач.

"