Ngoài ra, hệ Aristotle vận hành trên Lean, có thể tự động hóa phần việc nặng nhọc này và đã đạt trình độ tương đương học sinh đoạt huy chương IMO trong các bài toán chứng minh được kiểm tra bằng Lean. Khi đó, lời giải của ChatGTP được kiểm chứng bởi hệ thống tự động Aristotle và sau khi đoạn mã Lean được kiểm tra, hệ thống xác nhận rằng “tất cả các bước suy luận đều hợp lệ, không có chỗ nhảy cóc hay sai logic”.
Điểm thú vị là mô hình của OpenAI không chỉ tra cứu rồi chép lại. Trong quá trình lập luận, GPT‑5.2 viện dẫn các định lý và công cụ số học như công thức của Legendre, tiên đề Bertrand, rồi tìm được một bài trả lời trên MathOverflow của Noam Elkies về một bài toán tương tự, nhưng lời giải cuối cùng lại khác và bao quát hơn so với Elkies, giải cho một phiên bản rộng hơn của bài toán Erdős. Điều này khiến nhiều người trong giới toán học bắt đầu xem đây là dấu hiệu của việc sáng tạo ở mức thực dụng: ghép nối kiến thức cũ thành chứng minh mới, có thể công bố và kiểm chứng được.
Đứng ở bối cảnh rộng hơn thì đây sẽ là một “sân chơi” lớn từ các bài toán Erdős. Bộ sưu tập hơn một nghìn giả thuyết của Erdős được duy trì online đã trở thành nơi thử nghiệm lý tưởng cho các hệ thống AI, với nhiều mức độ khó khác nhau. Từ cuối 2025, AlphaEvolve, một hệ thống AI xây dựng trên nền tảng Gemini mở hàng khi giải được vài bài trong danh sách bài toán Erdős và công bố kết quả và giờ đây thêm Chat GPT‑5.2 tiếp tục giải thêm một số bài. Chỉ tính từ Giáng sinh đến nay, khoảng 15 bài đã chuyển trạng thái từ “open” sang “solved” trên website Erdős, trong đó 11 bài ghi nhận vai trò trực tiếp của các mô hình AI.
Terence Tao, một trong những nhà toán học vĩ đại nhất còn sống hiện nay, thường được gọi là “thần đồng toán học” và được ví như “Mozart của toán học”, thì nhìn câu chuyện này khá tỉnh táo. Trên GitHub và Mastodon, anh phân loại rõ những trường hợp AI thật sự tự đẩy được ý tưởng chứng minh, và những trường hợp AI chủ yếu làm “trợ lý tra cứu tài liệu”. Tao cho rằng sức mạnh quy mô của AI khiến nó rất hợp để “càn quét” cái đuôi dài của những bài Erdős dễ hơn nhưng ít người để ý. Thực tế thì trong bộ bài toán Erdős, có một số ít bài cực kỳ khó, nổi tiếng, được nhiều người biết tới và săn đuổi; đó là phần “đầu”. Ngược lại, còn hàng trăm bài toán “vừa vừa” hoặc khá dễ, chủ đề rất đa dạng, ít được chú ý, nằm rải rác đó chính là cái “đuôi dài”.
Khi đó, các chatbot AI rất phù hợp để giải những bài toán này vì nhiều bài trong số đó có lời giải khá thẳng, chỉ là không ai dành thời gian ngồi làm. Theo Tao, với lớp bài toán này, khả năng chúng được giải hoàn toàn bằng AI thậm chí cao hơn con đường truyền thống.
Tuy nhiên, điều đáng ghi nhận không chỉ là số lượng bài toán được giải, mà là việc các giáo sư toán và khoa học máy tính hàng đầu đã bắt đầu công khai dùng những công cụ này trong nghiên cứu. Họ có danh tiếng phải bảo vệ, nên việc họ dám đứng tên cùng các hệ thống AI được xem như một tín hiệu mạnh: AI đã chuyển từ món đồ chơi thú vị thành một cộng sự nghiêm túc trong thế giới toán học.