...
Вівторок, 11 Листопада, 2025
9.8 C
Kyiv

OpenAI розгортає створення зображень GPT-4O для всіх

OpenAI розгорнув нову систему генерації зображень, безпосередньо інтегровану з GPT-4O. Ця система дозволяє AI отримати доступ до своєї бази знань та контексту розмови при створенні зображень.

Кажуть, що ця інтеграція забезпечує більш контекстно актуальні та точні візуальні виходи.

У оголошенні OpenAI написано:

“Генерація зображень GPT -4O перевершує текст, точно дотримуючись підказок та використовуючи притаманну базу знань 4O та контекст чату – включаючи перетворення завантажених зображень або використання їх як візуального натхнення. Ці можливості полегшують створення саме зображення, яке ви передбачите, допомагаючи вам більш ефективно спілкуватися за допомогою візуальних та сприяння покоління зображень у практику з точністю.”

Ось усе інше, що потрібно знати.

Технічні можливості

OpenAI підкреслює такі можливості своєї нової системи генерації зображень:

  1. Він точно надає текст у зображеннях.
  2. Це дозволяє користувачам вдосконалювати зображення за допомогою розмови, зберігаючи послідовний стиль.
  3. Він підтримує складні підказки з до 20 різних об'єктів.
  4. Він може генерувати зображення на основі завантажених посилань.
  5. Це створює візуальні засоби, використовуючи інформацію з навчальних даних GPT-4O.

Відповідно повідомляє OPENAI:

“Оскільки генерація зображень тепер є рідною для GPT -4O, ви можете вдосконалити зображення за допомогою природної розмови. GPT -4O може будувати зображення та текст у контексті чату, забезпечуючи послідовність протягом усього часу. Наприклад, якщо ви проектуєте персонаж відеоігор, зовнішній вигляд персонажа залишається цілісним у різних ітераціях, коли ви вдосконалюєте та експериментуєте”.

Приклади

Продемонструвати Консистенція персонажівось приклад, що показує кота, а потім той самий кіт з капелюхом і монокле.

Скріншот від: openai.com/index/introducing-4o-image-generation/, березень 2025 року.

Ось більш практичний приклад для маркетологів, демонструючи Генерація тексту: Повне меню ресторану, створене з детальним підказкою.

Скріншот від: openai.com/index/introducing-4o-image-generation/, березень 2025 року.

У повідомленні OpenAI є десятки більше прикладів, багато з яких містять кілька підказок та подальших дій.

Обмеження

OpenAi зізнається:

“Наша модель не є ідеальною. На даний момент нам відомо про кілька обмежень, які ми будемо працювати над вирішенням вдосконалення моделі після початкового запуску”.

Компанія відзначає наступні обмеження своєї нової системи генерації зображень:

  • Обрізання: GPT-4O іноді обрізає довгі зображення, як плакати, занадто уважно внизу.
  • Галюцинації: Ця модель може створити помилкову інформацію, особливо з розпливчастими підказками.
  • Високі проблеми змішування: Він бореться за те, щоб точно зобразити більше від 10 до 20 понять, як повна періодична таблиця.
  • Багатомовний текст: У моделі можуть виникнути проблеми, що показують не латинські символи, що призводять до помилок.
  • Редагування: Запити на редагування конкретних частин зображення можуть змінити інші області або створити нові помилки. Він також намагається підтримувати обличчя послідовними у завантажених зображеннях.
  • Щільність інформації: Модель має труднощі з показом детальної інформації при невеликих розмірах.

Наслідки пошуку

Це оновлення змінює генерацію зображень AI від переважно декоративних використання до більш практичних функцій у бізнесі та комунікації.

Веб-сайти можуть використовувати зображення, що генеруються AI, але з важливими міркуваннями.

Керівні принципи Google не забороняють візуальні зображення, що генеруються AI, не зосереджуючись на тому, чи вміст забезпечує цінність незалежно від того, як він виробляється.

Рекомендується дотримання цих найкращих практик:

  • Використання метаданих C2PA (які GPT-4O додає автоматично) для підтримки прозорості
  • Додавання належного тексту ALT для доступності та індексації
  • Забезпечення зображень обслуговує наміри користувача, а не просто наповнення місця
  • Створення унікальних візуальних зображень, а не загальних шаблонів AI

Адвокат пошуку Google Джон Мюллер висловив негативну думку щодо зображень, що генеруються AI. Хоча його особисті уподобання не впливають на алгоритми Google, вони можуть вказувати, як інші ставляться до зображень AI.

Скріншот від: bsky.app/profile/johnmu.com, березень 2025 року.

Зауважте, що Google впроваджує заходи для позначення зображень, що генеруються AI у результатах пошуку.

Наявність

Ця функція тепер доступна для користувачів ChatGPT з плюс, професіоналами, командними або безкоштовними планами. Доступ до користувачів Enterprise та EDU буде доступний незабаром.

Розробники можуть очікувати доступ API в найближчі тижні. Через більш високі потреби в обробці, генерація зображень займає в середньому близько однієї хвилини.


Популярне зображення: Patrickassale/Shutterstock

Гаряче цього тижня

Теми

Життя у швидкісній смузі: досягнення високошвидкісної газової хроматографії

Остін Добрецевич є науковим співробітником Університету Вашингтона в...

Огляди Google AI з’являються в 21% пошукових запитів: нові дані

Ahrefs проаналізував 146 мільйонів результатів пошуку, щоб визначити, які...

Школа та вибір школи привели цю сім’ю до Флориди

ДЖЕКСОНВІЛЛЬ, Флорида. Чотири роки тому Філ і Кеті Вотсон...

Tech Talk: ізраїльська компанія використовує ШІ для маркетингових кампаній

Tech Talk: Ізраїльська компанія використовує ШІ для маркетингових кампаній...