ChatGPT теперь позволяет редактировать сгенерированные изображения. Посмотрите на пример с пуделем

04.04.2024 10:06

Trashbox.ru

Сегодня, 4 апреля, разработчики из компании OpenAI сообщили, что функция генерации изображений на основе DALL-E, которая была интегрирована в ChatGPT, получила ряд важных улучшений, позволяющих создавать более интересный контент с детальной настройкой под требования пользователя. Например, теперь пользователям доступны инструменты для редактирования сгенерированных изображений в интерфейсе чат-бота — это доступно как в веб-версии, так и на мобильных устройствах. Работает этот механизм предельно просто — нужно активировать инструмент, выделить область на изображении, которую нужно изменить, после чего прописать текстовую команду, а нейросеть всё сделает сама.

В демонстрационном ролике разработчики продемонстрировали работу этого механизма — сначала через чат-бот была дана команда DALL-E сгенерировать изображение с пуделем, празднующим день рождения, с чем нейросеть справилась на отлично (система предлагает несколько вариантов на выбор). После этого при помощи нового инструмента были выбраны области и прописана команда «добавь бантики» — спустя какое-то время система нарисовала красные банты с учётом шерсти пуделя, так что конечный результат выглядит достаточно реалистично. Интересно, что разработчики не стали ускорять или нарезать ролик с демонстрацией — в нём показано, что на дорисовку деталей ушло около 20 секунд.

Вторым важнейшим нововведением DALL-E в рамках ChatGPT является рекомендательная система стилей, которая должна помочь в поиске вдохновения создателям контента. Иногда пользователю сложно придумать с чего начать работу над генерацией контента, и новые подсказки по стилям будут служить некой отправной точкой, позволяя как минимум определиться со стилистикой конечного изображения. На текущий момент вариантов стилей уже предостаточно — есть гравюра на дереве, готический стиль, вариант с рисунком от руки и многое другое. Пользователь может просто навести курсор на название стиля, чтобы увидеть миниатюру с демонстрацией.

После того, как стиль был выбран, пользователь может выбрать соотношение сторон для конечного рисунка, что крайне удобно, а затем прописать саму подсказку для генерации изображения. Странно, что подобного рода инструментов нет у сервисов-конкурентов — это сильно упрощает процесс поиска подходящей стилистики.