После запуска генеративных ИИ-моделей, которые создают изображения на основе текстовых данных, предоставленных пользователями, OpenAI совершенствует свои предложения с большим мастерством. Компания, которая запустила ChatGPT, представляет третью версию своего искусственного интеллекта, создающего изображения, DALL-E 3. Вот что нового.
OpenAI утверждает, что DALL-E 3 понимает значительно больше нюансов и деталей (в текстовых подсказках), чем предыдущие системы. Это, в свою очередь, позволяет пользователям создавать изображения, которые более точно соответствуют представлениям пользователей.
Современные системы преобразования текста в изображения имеют тенденцию игнорировать слова или описания, заставляя пользователей учиться быстрому конструированию. DALL-E 3 — это скачок вперед в нашей способности генерировать изображения, которые точно соответствуют предоставленному вами тексту
отметили в компании.
Генеральный директор OpenAI Сэм Альтман поделился примерами изображений, созданных DALL-E 3, подчеркнув точность результатов, полученных на основе текстовых подсказок.
DALL-E 3 построен на базе ChatGPT
В OpenAI сообщили, что DALL-E 3 построен на базе ChatGPT, а это означает, что пользователи могут использовать чат-бот с искусственным интеллектом для создания изображений, а также уточнять свои подсказки — от простого предложения до развернутого абзаца в разговорной манере.
«Когда вы предлагаете идею, ChatGPT автоматически генерирует индивидуальные, детальные подсказки для DALL-E 3, которые помогут воплотить вашу идею в жизнь. Если вам нравится определенное изображение, но оно не совсем правильное, вы можете попросить ChatGPT внести коррективы, сказав всего несколько слов», — отметили в компании.
Доступность DALL-E 3
DALL-E 3 будет доступен для клиентов ChatGPT Plus и Enterprise в начале октября. Изображения, созданные с помощью DALL-E 3, можно будет перепечатывать, продавать или использовать в качестве сувенирной продукции.
OpenAI также заявила, что DALL-E 3 не будет генерировать насильственный, взрослый или ненавистнический контент. Он имеет смягчающие меры, которые позволяют отклонять запросы, содержащие имя публичного лица.

