Một trong những nâng cấp thiết thực nhất là khả năng render chữ. Mô hình mới xử lý tốt các đoạn văn bản dày đặc và đặc biệt hỗ trợ mạnh các hệ thống chữ viết ngoài bảng chữ cái Latinh như tiếng Nhật, Hàn, Trung, Hindi và Bengali. Văn bản được tạo ra tự nhiên và liền mạch, giúp người dùng dễ dàng tạo các sản phẩm như poster, biểu đồ hay truyện tranh bằng ngôn ngữ bản địa mà không bị lỗi font hay sai ký tự.
ChatGPT Images 2.0 hiện hỗ trợ dải tỷ lệ khung hình rộng từ 3:1 đến 1:3, có thể thiết lập trực tiếp qua prOmpt. Điểm đáng chú ý là người dùng có thể thay đổi tỷ lệ của một bức ảnh đã tạo mà không làm mất đi các chi tiết chủ đạo. Cùng với đó, OpenAI bổ sung tính năng Image Library tích hợp trên nền tảng web, iOS và Android, giúp người dùng lưu trữ và quản lý các hình ảnh đã tạo dễ dàng hơn.
Đây là lần đầu tiên OpenAI tích hợp khả năng suy luận vào mô hình tạo ảnh. Khi kích hoạt chế độ Thinking (hoặc Pro), AI có thể tìm kiếm dữ liệu web theo thời gian thực, tự động kiểm tra lại kết quả (double-check) và tạo ra tối đa 8 biến thể từ một câu lệnh trong khi vẫn giữ được tính nhất quán của nhân vật hoặc đối tượng. Chế độ này sẽ mất nhiều thời gian xử lý hơn so với thông thường, bù lại độ chính xác về mặt logic (như chuỗi hình ảnh cho truyện tranh, infographic) sẽ cao hơn.
Hiện tại, Images 2.0 đã khả dụng cho mọi người dùng ChatGPT, Codex và thông qua API (hỗ trợ độ phân giải lên đến 2K). Riêng chế độ Thinking sẽ dành cho các tài khoản Plus, Pro và Business.