OpenAI wprowadza nową wersję ChatGPT Images, która obiecuje lepsze przestrzeganie instrukcji, bardziej precyzyjną edycję oraz nawet czterokrotnie szybsze generowanie obrazów.
Nowy model, nazwany GPT-Image-1.5, jest dostępny od wtorku dla wszystkich użytkowników ChatGPT oraz poprzez API. To najnowsza eskalacja w rywalizacji z Gemini od Google po tym, jak w zeszłym miesiącu CEO OpenAI, Sam Altman, ogłosił „code red” w ujawnionej wewnętrznej notatce. Notatka szczegółowo opisywała plany OpenAI dotyczące odzyskania pozycji lidera AI po tym, jak Google zaczął przejmować udziały w rynku po wydaniu Gemini 3, swojego najnowszego flagowego modelu, oraz Nano Banana Pro, najnowszej wersji wiralowego generatora obrazów Google — oba te produkty zajmują czołowe miejsca na liście LMArena w wielu benchmarkach.
Google utrzymuje swoją przewagę nawet po tym, jak OpenAI odpowiedziało na jego sukces w zeszłym tygodniu, wprowadzając GPT-5.2, reklamując go jako swój najbardziej zaawansowany model dla deweloperów i codziennego użytku profesjonalnego. Według doniesień, OpenAI planowało wypuścić nowy generator obrazów na początku stycznia, przyspieszając te plany wraz z ogłoszeniem w tym tygodniu. Ostatni model generowania obrazów został wydany w kwietniu jako GPT-Image-1.
GPT-Image-1.5 pojawia się w momencie, gdy generatory obrazów i wideo wychodzą poza fazę prototypów i zyskują coraz więcej funkcji gotowych do produkcji. Podobnie jak Nano Banana Pro, ChatGPT Images oferuje funkcje postprodukcji, zapewniając bardziej szczegółową kontrolę edycji w celu zachowania spójności wizualnej, takiej jak podobieństwo twarzy, oświetlenie, kompozycja i tonacja kolorystyczna podczas edycji.
Ten sam obraz przedstawiony powyżej z różnymi edycjami, aby zaprezentować ulepszone przestrzeganie instrukcji przez GPT-Image-1.5. Image Credits:OpenAI Większość narzędzi GenAI do generowania obrazów słabo radzi sobie z iteracją, więc byłby to ogromny krok naprzód. Po poproszeniu o konkretną zmianę, taką jak „dostosuj wyraz twarzy” lub „zrób zimniejsze oświetlenie”, modele często reinterpretują cały obraz, co prowadzi do braku spójności.
Aktualizacja nie dotyczy tylko nowych funkcji. ChatGPT Images będzie teraz również dostępny poprzez dedykowany punkt wejścia w pasku bocznym ChatGPT, który działa „bardziej jak kreatywne studio”, napisała Fidji Simo, CEO aplikacji OpenAI, we wtorkowym wpisie na blogu.
„Nowe ekrany do przeglądania i edycji obrazów ułatwiają tworzenie obrazów zgodnych z twoją wizją lub czerpanie inspiracji z popularnych promptów i gotowych filtrów”, napisała Simo.
Dołącz do listy oczekujących na Disrupt 2026
Dodaj się do listy oczekujących na Disrupt 2026, aby być pierwszym w kolejce, gdy pojawią się bilety Early Bird. Poprzednie edycje Disrupt gościły na scenie Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil i Vinod Khosla — część ponad 250 liderów branży prowadzących ponad 200 sesji zaprojektowanych, by wspierać twój rozwój i ostrzyć twoją przewagę. Dodatkowo poznaj setki startupów wprowadzających innowacje w każdej branży.
Dołącz do listy oczekujących na Disrupt 2026
Dodaj się do listy oczekujących na Disrupt 2026, aby być pierwszym w kolejce, gdy pojawią się bilety Early Bird. Poprzednie edycje Disrupt gościły na scenie Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil i Vinod Khosla — część ponad 250 liderów branży prowadzących ponad 200 sesji zaprojektowanych, by wspierać twój rozwój i ostrzyć twoją przewagę. Dodatkowo poznaj setki startupów wprowadzających innowacje w każdej branży.
Oprócz nowego generatora obrazów, OpenAI wprowadza nowe sposoby ulepszania doświadczenia ChatGPT poprzez więcej elementów wizualnych. Plan zakłada, że zapytania wyszukiwania będą wyświetlać więcej wizualizacji z wyraźnymi źródłami, co może być pomocne przy zadaniach takich jak konwersja jednostek czy sprawdzanie wyników sportowych, według Simo.
„Podczas tworzenia powinieneś móc zobaczyć i kształtować to, co tworzysz. Gdy wizualizacje lepiej opowiadają historię niż same słowa, ChatGPT powinien je uwzględniać”, napisała Simo. „Kiedy potrzebujesz szybkiej odpowiedzi lub kolejny krok znajduje się w innym narzędziu, powinien być pod ręką. Robiąc to, możemy stale skracać dystans między tym, co masz w głowie, a twoją zdolnością do urzeczywistnienia tego.”

