OpenAI ra mắt ChatGPT Images 2.0: Cải thiện khả năng render chữ, hỗ trợ tỷ lệ linh hoạt,...

Trang chủ > Tin tức > Chuyên mục Ngày

OpenAI ra mắt ChatGPT Images 2.0: Cải thiện khả năng render chữ, hỗ trợ tỷ lệ linh hoạt,...

22/04/2026 08:57

TinhTe/Anh Tú - OpenAI ra mắt ChatGPT Images 2.0: Cải thiện khả năng render chữ, hỗ trợ tỷ lệ linh hoạt,...

OpenAI đã chính thức giới thiệu ChatGPT Images 2.0 (hay ImageGen 2.0). Được xây dựng dựa trên mô hình cốt lõi gpt-image-2 mới, bản cập nhật này tập trung giải quyết những hạn chế tồn đọng trên các thế hệ trước, đặc biệt là khả năng tuân thủ prOmpt, kết xuất văn bản (text rendering) và tính nhất quán của hình ảnh.

Khả năng tuân thủ prOmpt và chi tiết hình ảnh

Theo công bố, gpt-image-2 có khả năng xử lý các yêu cầu phức tạp với độ chính xác cao hơn. Mô hình này sắp xếp vị trí và mối quan hệ giữa các đối tượng trong ảnh logic hơn, đồng thời thể hiện tốt các chi tiết nhỏ như biểu tượng hay các thành phần giao diện (UI). Các lỗi thường gặp trước đây khiến bức ảnh nhìn giống AI đã được giảm thiểu. Thay vào đó, Images 2.0 có thể mô phỏng các phong cách từ ảnh chụp thực tế (có cả những khuyết điểm nhỏ để tăng tính chân thực), pixel art cho đến manga một cách sát với yêu cầu của người dùng.

Hiểu đa ngôn ngữ và kết xuất văn bản

Một trong những nâng cấp thiết thực nhất là khả năng render chữ. Mô hình mới xử lý tốt các đoạn văn bản dày đặc và đặc biệt hỗ trợ mạnh các hệ thống chữ viết ngoài bảng chữ cái Latinh như tiếng Nhật, Hàn, Trung, Hindi và Bengali. Văn bản được tạo ra tự nhiên và liền mạch, giúp người dùng dễ dàng tạo các sản phẩm như poster, biểu đồ hay truyện tranh bằng ngôn ngữ bản địa mà không bị lỗi font hay sai ký tự.

Tỷ lệ khung hình tùy chỉnh và Image Library

ChatGPT Images 2.0 hiện hỗ trợ dải tỷ lệ khung hình rộng từ 3:1 đến 1:3, có thể thiết lập trực tiếp qua prOmpt. Điểm đáng chú ý là người dùng có thể thay đổi tỷ lệ của một bức ảnh đã tạo mà không làm mất đi các chi tiết chủ đạo. Cùng với đó, OpenAI bổ sung tính năng Image Library tích hợp trên nền tảng web, iOS và Android, giúp người dùng lưu trữ và quản lý các hình ảnh đã tạo dễ dàng hơn.

Chế độ Thinking: Khả năng tự kiểm tra và đồng nhất

Đây là lần đầu tiên OpenAI tích hợp khả năng suy luận vào mô hình tạo ảnh. Khi kích hoạt chế độ Thinking (hoặc Pro), AI có thể tìm kiếm dữ liệu web theo thời gian thực, tự động kiểm tra lại kết quả (double-check) và tạo ra tối đa 8 biến thể từ một câu lệnh trong khi vẫn giữ được tính nhất quán của nhân vật hoặc đối tượng. Chế độ này sẽ mất nhiều thời gian xử lý hơn so với thông thường, bù lại độ chính xác về mặt logic (như chuỗi hình ảnh cho truyện tranh, infographic) sẽ cao hơn.

Tính khả dụng và những hạn chế

Hiện tại, Images 2.0 đã khả dụng cho mọi người dùng ChatGPT, Codex và thông qua API (hỗ trợ độ phân giải lên đến 2K). Riêng chế độ Thinking sẽ dành cho các tài khoản Plus, Pro và Business.

Dù có nhiều nâng cấp, OpenAI cũng lưu ý rằng mô hình vẫn còn những giới hạn vật lý nhất định. Cụ thể, Images 2.0 sẽ gặp khó khăn khi mô phỏng các chi tiết ẩn, góc nghiêng lạ, hoặc các cấu trúc vật lý phức tạp như cách gấp giấy origami hay khối Rubik. Các biểu đồ chứa quá nhiều thông tin dày đặc cũng cần được người dùng kiểm tra lại tính chính xác trước khi sử dụng. Hãng cũng áp dụng các biện pháp an toàn để ngăn chặn việc tạo ra các nội dung độc hại.

Tin xem thêm

TSMC đang cân nhắc tăng giá dịch vụ sản xuất chip lên tới 25% vào năm 2027

Chuyên mục Ngày

03/08/2026 10:27

MXH mygo - TSMC đang cân nhắc tăng giá dịch vụ sản xuất chip lên tới 25% vào năm 2027, với kế hoạch tăng giá cơ bản từ 5% đến 10% đối với các tiến trình sản xuất tiên tiế...

Xiaomi tăng giá điện thoại thông minh lên tới 13% tại Trung Quốc.

Chuyên mục Ngày

02/08/2026 22:33

MXH mygo - Chi phí chip nhớ tăng cao đã khiến Xiaomi phải tăng giá các dòng sản phẩm Redmi và Xiaomi 17 tại thị trường Trung Quốc. Các mẫu máy sử dụng chip Snapdragon và ...

Amazon hoàn tất khoản đầu tư 50 tỷ USD vào OpenAI

Chuyên mục Ngày

02/08/2026 22:17

MXH mygo - Amazon hoàn tất khoản đầu tư 50 tỷ USD vào OpenAI, chốt lại đợt rót vốn trị giá 35 tỷ USD.

Xiaomi SkyNomad: Ra mắt mẫu SUV hybrid cỡ lớn với phạm vi hoạt động 1.060 dặm.

Chuyên mục Ngày

01/08/2026 23:51

MXH mygo - Xiaomi đang thực sự nghiêm túc trong cuộc chơi này. Tại sự kiện ra mắt công nghệ quy mô lớn, CEO Lôi Quân đã giới thiệu các mẫu SUV EREV mới mang tên SkyNomad ...

Khoản tài trợ từ Google mang lại thêm việc làm và cơ hội đào tạo nghề thợ điện, thợ mộc...

Chuyên mục Ngày

31/07/2026 11:38

MXH mygo - Khoản tài trợ từ Google mang lại thêm việc làm và cơ hội đào tạo cho các thành viên IBEW.

Tesla cân nhắc tách mảng kinh doanh tại TQ khi Elon Musk tính đến khả năng sáp nhập với SpaceX

Chuyên mục Ngày

31/07/2026 11:20

MXH mygo - Tesla đang chuẩn bị các phương án dự phòng để tách mảng kinh doanh tại Trung Quốc trong bối cảnh Elon Musk xem xét khả năng sáp nhập giữa nhà sản xuất xe điện ...

4 thông số kỹ thuật có thể bị cắt giảm trên chiếc điện thoại Android giá rẻ tiếp theo

Chuyên mục Ngày

30/07/2026 21:39

MXH mygo - 4 thông số kỹ thuật có thể bị cắt giảm trên chiếc điện thoại Android giá rẻ tiếp theo, vì giá linh kiện đã và đang tăng vọt

Liệu nhà sản xuất ống kính Tamron có sắp bị Sony thâu tóm?

Chuyên mục Ngày

30/07/2026 21:20

MXH mygo - Liệu nhà sản xuất ống kính Tamron có sắp bị Sony thâu tóm? Dưới đây là lý do tại sao điều này có thể là tin cực xấu đối với người hâm mộ Nikon.

Google xác nhận tăng giá Pixel 11 do chi phí RAM đẩy giá điện thoại lên cao.

Chuyên mục Ngày

29/07/2026 16:02

MXH mygo - Google cho biết chi phí bộ nhớ tăng cao sẽ đẩy giá Pixel 11 lên mức cao hơn, trong bối cảnh nhu cầu do AI thúc đẩy đang định hình lại chuỗi cung ứng điện thoại...

nội dung mới