OpenAI разработала генерацию изображений для ChatGPT
Вашингтон, 22 апреля (QNA) — OpenAI, ведущая компания в области исследований искусственного интеллекта, объявила о новом обновлении механизма генерации изображений в ChatGPT, добавив так называемые «способности к мышлению», позволяющие осуществлять онлайн-поиск и создавать набор связанных изображений по одной команде.
Обновление основано на новой модели GPT Image 2, которая повышает точность выполнения инструкций, сохраняет детали, определённые пользователем, и улучшает генерацию и отображение текста внутри изображений. Также оно позволяет активировать режим Thinking для анализа структуры изображения и использования онлайн-информации, а также создавать визуальные аннотации и инфографику на основе загруженных пользователем файлов.
В этом же контексте новая версия позволяет создавать до восьми изображений одновременно, сохраняя одни и те же элементы, такие как персонажи, объекты и стиль, в разных сценах.
Компания отметила, что модель также поддерживает создание страниц японской манги, дизайнов для социальных сетей и многое другое.
Обновление включает общие улучшения для всех пользователей ChatGPT, включая повышенную точность распознавания основных характеристик изображения, поддержку различных стилей, таких как пиксель-арт, манга и кинематографические кадры, а также разрешения до 2K с разными соотношениями сторон.
Что касается текста внутри изображений, OpenAI объяснила, что новая модель обеспечивает значительный прогресс в генерации текста на нелатинских языках, особенно улучшая отображение английского текста.
Компания указала, что модель ChatGPT Images 2.0 теперь доступна всем пользователям ChatGPT и приложения Codex, а новая «мыслящая» модель предназначена для подписчиков платных планов, таких как ChatGPT Plus, ChatGPT Pro и ChatGPT Business. (QNA)
This content was translated using AI
English
Français
Deutsch
Español
русский
हिंदी
اردو