Gemini 3.1 Pro là bản nâng cấp mới nhất trong dòng mô hình Gemini 3 mà Google định vị là “bộ não” dành cho những tác vụ phức tạp nhất, từ lập trình, phân tích dữ liệu cho tới xây dựng agent nhiều bước.
Về nền tảng, 3.1 Pro vẫn thuộc cùng thế hệ kiến trúc với Gemini 3.0 Pro (thường được gọi là Gemini 3 Pro), giữ nguyên khả năng đa phương thức và cửa sổ ngữ cảnh cực lớn, nhưng được tinh chỉnh rất mạnh về chất lượng suy luận, độ ổn định khi thực thi chuỗi tác vụ nhiều bước và cách kiểm soát độ “chịu khó suy nghĩ” của mô hình.
Ở phần cốt lõi, khác biệt lớn nhất giữa Gemini 3.1 Pro và Gemini 3.0 Pro nằm ở năng lực reasoning. Google cho biết 3.1 Pro được thiết kế như một “baseline thông minh hơn cho các tác vụ giải quyết vấn đề phức tạp”, chứ không chỉ là bản vá nhỏ. Bộ benchmark ARC‑AGI‑2, vốn đo khả năng giải các bài toán logic và nhận diện mẫu trừu tượng mà mô hình chưa từng thấy, Gemini 3.1 Pro đạt khoảng 77,1%, cao hơn hơn gấp đôi so với điểm của Gemini 3 Pro trước đó. Trong khi đó, bài Humanity’s Last Exam - một bài kiểm tra kiến thức chuyên sâu cho thấy Gemini 3.1 Pro cũng cải thiện đáng kể so với 3 Pro, từ khoảng 37% lên 44,4%, phản ánh sự tiến bộ cả ở chiều rộng kiến thức và chiều sâu suy luận. Điều này có nghĩa với những tác vụ nhiều bước, đòi hỏi xâu chuỗi lập luận dài, 3.1 Pro có xác suất hiểu đúng bài toán và giữ mạch logic tốt hơn rõ rệt.
Về mặt “kỹ sư phần mềm” và agent, Gemini 3.1 Pro cũng được Google nhấn mạnh là đã cải thiện có chủ đích. Tài liệu chính thức của Google Vertex AI mô tả 3.1 Pro có “improved SWE and agentic capabilities”, tức là hành vi sinh mã nguồn và khả năng điều phối công cụ (tool calling, API, thao tác dữ liệu) đã được tinh chỉnh để phù hợp hơn với các workflow kỹ sư phần mềm trong thực tế. Các phân tích độc lập nhận xét rằng khi dùng Gemini 3.1 Pro để xây agent nhiều bước, ví dụ: gọi API, xử lý kết quả, sinh code, rồi quay lại xác thực thì mô hình giữ trạng thái tốt hơn, ít “đi lạc” hơn so với Gemini 3 Pro. Với những người dùng mô hình để scaffold dự án, sinh nhiều file, hoặc dựng nhanh một ứng dụng từ một yêu cầu mô tả duy nhất, Gemini 3.1 Pro cho đầu ra mạch lạc và ít phải chỉnh tay hơn.
Một điểm quan trọng khác là cách Gemini 3.1 Pro xử lý “suy luận có kiểm soát”. Ngay từ thế hệ Gemini 3.0 Pro, Google đã giới thiệu tham số thinking level để điều chỉnh mức độ suy luận: thấp, linh hoạt, hoặc cao, cho phép cân bằng giữa độ thông minh, độ trễ và chi phí. Với Gemini 3.1 Pro, tài liệu Vertex AI cho biết mô hình vừa được tối ưu hiệu quả token khi suy luận, vừa mở rộng thêm mức thinking mới, cụ thể là bổ sung thêm lựa chọn trung gian, giúp tinh chỉnh tốt hơn giữa chất lượng và hiệu năng. Thay vì chỉ có lựa chọn “rất nhanh, suy ít” hoặc “rất kỹ, suy lâu”, người dùng có thêm một nấc hợp lý hơn ở giữa, phù hợp với đa số tác vụ thực tế. Điều này đặc biệt hữu ích với khối lượng công việc lớn, nơi việc kiểm soát chi phí trên mỗi ngữ cảnh là rất quan trọng.
Về thông số kỹ thuật nền tảng, Gemini 3.1 Pro và Gemini 3.0 Pro giống nhau ở những điểm then chốt. Cả hai đều là mô hình đa phương thức “native”, xử lý được văn bản, hình ảnh, âm thanh, video, PDF và mã nguồn trong cùng một ngữ cảnh, thay vì phải ghép nhiều mô hình con. Cửa sổ ngữ cảnh tối đa mà Google và các trang phân tích như Artificial Analysis công bố cho cả 3 Pro và 3.1 Pro đều ở mức xấp xỉ 1 triệu token, cho phép nạp vào cả codebase lớn, thư viện tài liệu kỹ thuật hoặc tập hợp nhiều tài liệu PDF dài. Nói cách khác, 3.1 Pro không đổi “khung gầm” về context và modality so với 3.0 Pro, mà tập trung vào việc dùng cùng lượng thông tin đó một cách thông minh và hiệu quả hơn.
Hiện tại thì Gemini 3.1 Pro đã xuất hiện trên app Gemini và ứng dụng web Gemini dành cho người dùng gói Pro và Ultra.
