ChatGPT Images 2.0 улучшает текст, серии и форматы изображений
ChatGPT Images 2.0 описывается как заметное обновление генерации изображений в ChatGPT и Copilot. Модель сначала рассуждает над промптом и может использовать web search перед генерацией, что должно повышать точность сложных визуальных задач. Для платных пользователей ChatGPT Plus, Pro и Business доступны thinking mode, поиск при генерации и до восьми изображений за один промпт. В статье отдельно отмечены улучшения читаемого текста, non-Latin scripts, мелких элементов, UI, инфографики и плотных композиций. В Copilot rollout идет постепенно: PowerPoint 365 with Copilot уже поддерживается, Copilot Chat заявлен как coming soon, а GPT-image-2 доступен через Azure/Foundry. Есть выбор aspect ratio в интерфейсе и разрешения до 2K через API, но факты в схемах и инфографике все равно нужно проверять вручную.
- Plus/Pro/Business получают до восьми изображений за один запрос
- Модель лучше справляется с читаемым текстом и non-Latin scripts
- Доступны разные aspect ratio для баннеров, портретов и widescreen
- Инфографику и подписи нужно проверять на фактические ошибки
- Copilot и Azure/Foundry могут стать дополнительными каналами генерации