Khi thế giới đang kì vọng vào AGI thì François Chollet lại đang cho thấy AI "khờ dại" như thế nào

11/04/2025 11:35
Khi thế giới đang kì vọng vào AGI thì François Chollet lại đang cho thấy AI "khờ dại" như thế nào

Thế giới đang bước vào kỷ nguyên bùng nổ của trí tuệ nhân tạo (AI). Các mô hình AI ngôn ngữ như GPT-4 của OpenAI, Claude của Anthropic hay Gemini của Google đã có thể làm thơ, viết mã, tư vấn pháp lý và thậm chí thi lấy những chứng chỉ vốn dành cho con người. Sam Altman, CEO của OpenAI, đã không ngần ngại tuyên bố rằng OpenAi biết cách để xây dựng AGI hay gần đây là DeepMind đã dự báo rằng AGI sẽ tới vào năm 2030.


Tuy nhiên, không phải ai cũng đồng tình với góc nhìn này. Một trong những người lên tiếng mạnh mẽ nhất, phản đối cách nhìn “quá lạc quan” về AI hiện nay chính là François Chollet, nhà nghiên cứu trí tuệ nhân tạo nổi tiếng, là tác giả của framework Deep Learning Keras, và cũng đồng thời là cựu kỹ sư phần mềm cấp cao tại Google. Trên thực tế thì Chollet không chỉ hoài nghi những lời hứa hẹn về AGI, ông còn chủ động tạo ra một thách thức mà cho đến nay, phần lớn các mô hình AI hàng đầu đều thất bại: bài kiểm tra ARC-AGI.


François Chollet – Từ nhà nghiên cứu deep learning đến người phản biện số 1 của AGI


Công bằng mà nói thì François Chollet không phải là một “anti-AI”. Trái lại, ông là người có vai trò quan trọng trong việc thúc đẩy sự phát triển của phong trào deep learning hiện đại, đặc biệt nổi tiếng với framework Keras, giúp đơn giản hóa việc xây dựng và huấn luyện các mô hình học sâu. Tuy nhiên, có lẽ việc làm quá sâu trong ngành mang lại những góc nhìn khác để ông nhận ra một vấn đề lớn: AI hiện nay quá phụ thuộc vào dữ liệu huấn luyện và thiếu khả năng trừu tượng hóa và linh hoạt thích ứng. Rất nhiều bài kiểm tra đã cho thấy rằng các mô hình như GPT có thể vượt qua bài thi LSAT hay GMAT. Tuy nhiên, những kết quả này phần lớn đến từ việc học thuộc lòng hàng tỷ mẫu dữ liệu và nhận diện mẫu (pattern recognition), chứ không phải thật sự hiểu hay suy nghĩ sáng tạo.


François Chollet từng nghiên cứu tại Google và là chả đẻ của framework Deep Learning Keras


Điều này khác biệt với góc nhìn của Chollet khi ông cho rằng điểm cao không có nghĩa là thông minh mà trí thông minh thật sự phải là “fluid intelligence”, nôm na theo mình hiểu là trí thông minh linh hoạt, không đến từ việc “nhồi nhét”, mà đến từ khả năng áp dụng nguyên lý quen thuộc vào tình huống mới, khả năng trừu tượng hóa và suy luận logic từ nền tảng. Và để kiểm tra điều đó, ông tạo ra ARC-AGI.


ARC-AGI – Bài kiểm tra định nghĩa lại “thông minh” trong thế giới AI


Vậy ARC-AGI (Abstraction and Reasoning Corpus) là gì, cơ bản thì đó là một bài kiểm tra được thiết kế để buộc AI phải suy nghĩ từ nguyên lý đầu tiên (the first principle), không dựa vào dữ liệu có sẵn. Cho anh em nào chưa biết thì nguyên lý đầu tiên là cách suy nghĩ dựa trên bản chất gốc rễ của vấn đề, thay vì chỉ dựa vào kinh nghiệm, giả định có sẵn hay “cách người ta thường làm”. Điều này có nghĩa là thay vì hỏi “người ta thường làm gì” thì câu hỏi với nguyên lý này sẽ là “Vấn đề cốt lõi ở đây là gì?”. Đây là cách mà Elon Musk áp dụng trong suốt quá trình vận hành và phát triển các công ty của ổng, từ Tesla tới SpaceX hay The Boring Company.


Quay lại vấn đề về ARC-AGI thì với bài kiểm tra này, người tham gia hoặc AI phải nhìn vào câu hỏi, ví dụ một như một quy tắc hình học đơn giản, và suy luận để điền vào hình tiếp theo mà không cần hướng dẫn, không cần gợi ý. Điểm đặc biệt là các mô hình AI không thể học thuộc. Tất cả các câu hỏi đều do con người tạo mới, đảm bảo không trùng lặp với bất kỳ nội dung nào trong dữ liệu huấn luyện của AI. Chính vì thế, nếu mô hình trả lời đúng, điều đó có nghĩa là nó phải tự suy luận ra quy luật mới hoàn toàn và đây là điều mà Chollet cho là bản chất của “fluid intelligence”


Một ví dụ trong bài kiểm tra ARC-AGI khi mô hình phải dự đoán ô vuông cuối có hình ảnh như thế nào


Vậy khi con người hay các mô hình trí tuệ nhân tạo thực hiện bài kiểm tra ARC-AGI này như thế nào? Người tham gia dù lần đầu tiên tiếp cận với những dạng đề này, có thể đạt mức điểm trung bình từ 60–70%. Trong khi đó, mô hình GPT-3 đạt 0 điểm, GPT-4 và Gemini 1.5 chỉ nhỉnh lên mức 5%, Claude 3.7 cao hơn một chút ở mức 14%. Các mô hình “xịn” nhất hiện nay đều gần như bó tay với ARC. Điều này cho thấy rằng các mô hình trí tuệ nhân tạo dù giỏi bắt chước nhưng gặp rất nhiều khó khăn với việc phải tư duy linh hoạt. Các mô hình này chưa thật sự hiểu bài toán mà chỉ giỏi trong việc “làm lại những gì đã thấy”. Chính Chollet đã khẳng định rằng ARC-AGI là bài kiểm tra mà người tham gia không thể gian lận. Họ buộc phải thật sự thông minh mới có thể thực hiện các bài kiểm tra đó.


OpenAI và bước đột phá với mô hình o3 và cú bứt phá 87%


Sau khi thất bại ở lần kiểm tra đầu tiên, OpenAI không bỏ cuộc khi họ tiếp tục nghiên cứu và phát triển mô hình AI của mình. Đến cuối năm 2023, họ tung ra mô hình mới có khả năng lý luận với tên gọi o1, sau đó là o3. Phiên bản đầu tiên của o1 chỉ đạt 18%, vẫn thấp hơn người bình thường. Tuy nhiên, mô hình o3 đã đạt một bước đột phá rất lớn khi đạt 87% điểm số ARC-AGI. Đây là lần đầu tiên một AI chạm đến, thậm chí vượt qua hiệu suất trung bình của con người.


Và mô hình o3 đạt một mức điểm rất cao trong ARC-AGI


Với kết quả này, OpenAI cho rằng đây là bước đột phá thực sự. Mô hình o3 không chỉ tạo một đáp án duy nhất, mà còn dành đến 14 phút để suy nghĩ mỗi bài toán, thử hàng nghìn khả năng rồi mới chọn câu trả lời cuối cùng. Tuy nhiên, chính điều này lại khiến Chollet thêm phần nghi ngờ. Tuy nhiên, “thể hiện nhiều quá" đôi khi cũng bất lợi khi Chollet tự đặt ra câu hỏi rằng liệu đây là thông minh, hay chỉ là “brute force”, tức là dùng sức mạnh tính toán khổng lồ để thử tới khi đúng.


ARC-AGI-2 – Khi trí thông minh phải nâng cấp thật sự


Câu hỏi kể trên đã khiến Chollet nâng cấp bài kiểm tra của mình. Đầu năm 2024, khi mọi thứ tưởng như đang khởi sắc với các mô hình AI, Chollet lại tung ra phiên bản nâng cao: ARC-AGI-2. Trong phiên bản này, độ khó tăng vọt hơn trước. Điều đặc biệt là trong khi con người vẫn giữ mức điểm trung bình khoảng 60% thì các mô hình như o1 rớt từ 32% xuống còn 3%, bản mini o3 còn chưa tới 2%. Các mô hình của Google và Anthropic cũng không khá khẩm gì hơn là mấy.


Và câu hỏi của ARC-AGI-2 được nâng mức độ khó lên hẳn


Sau đó, chính Chollet đã giải thích rằng ARC-AGI-1 là bài kiểm tra xác định liệu trí thông minh linh hoạt có tồn tại hay không còn còn ARC-AGI-2 là bài kiểm tra xem coi trình độ thông minh linh hoạt đến đâu. Những bài toán mới trong phiên bản này yêu cầu AI phải tổng hợp nhiều chiến lược cùng lúc, thử nghiệm và thích nghi, điều mà phần lớn các mô hình hiện nay vẫn chưa làm được nếu không dùng đến lượng tài nguyên khổng lồ.


Vậy, AGI có thật sự đang đến, hay chỉ là mọi người đang quá ảo tưởng về nó?


Khi OpenAI công bố mô hình o3 đạt 87% điểm ARC-AGI, nhiều người đã tuyên bố rằng AGI – trí tuệ nhân tạo tổng quát – đã thành hình. Nhưng với François Chollet, đây mới chỉ là điểm khởi đầu của một cuộc tranh luận sâu sắc: AI thông minh là gì, và chúng ta đang đo lường điều đó như thế nào?


Chollet cho rằng, AGI không thể được định nghĩa bằng việc giải bài tốt hay viết văn giỏi. Mà phải là khả năng suy luận trừu tượng, học từ ít dữ liệu nhưng lại có thể giải quyết tình huống hoàn toàn mới, giống như cách con người xử lý một vấn đề chưa từng gặp. Đó cũng là mục đích của bài kiểm tra ARC-AGI.


Tuy nhiên, một số công ty công nghệ lại chọn cách định nghĩa AGI bằng lợi nhuận. Theo tài liệu bị rò rỉ, Microsoft và OpenAI từng đồng thuận rằng nếu AI tạo ra 100 tỷ USD doanh thu, thì nó có thể được xem là AGI, một quyết định sẽ do hội đồng quản trị phê duyệt. Điều này cho thấy sự khác biệt lớn giữa quan điểm khoa học và thương mại: một bên muốn đo khả năng tư duy, đo chất lượng bản chất của mô hình trí tuệ nhân tạo, và một bên thì đo bằng khả năng sinh tiền.


Microsoft và OpenAI lại đặt mục tiêu lợi nhuận để định nghĩa cột mốc AGI


Và nếu đứng ở góc nhìn bản chất về chất lượng của các mô hình và với kết quả của ARC-AGI-2, thì AGI vẫn còn là một mục tiêu xa vời nếu chỉ dựa vào sức mạnh tính toán. Trí tuệ nhân tạo hiện tại vẫn chưa có trực giác, vẫn chưa có trải nghiệm sống và chưa thể học nhanh từ chỉ vài ví dụ, điều mà những đứa trẻ thể hiện tốt nhất khi chúng liên tục khám phá thế giới mỗi ngày. Với Chollet, trí tuệ con người là hình mẫu không thể bỏ qua: nơi tư duy, cảm xúc và trực giác cùng tồn tại. AGI nếu tồn tại, phải mang một phần nào đó của khả năng hiểu chứ không đơn giản là làm đúng. Và để đo điều đó, có lẽ loài người cần những tiêu chuẩn chặt chẽ thay vì chỉ nhìn vào lợi nhuận mà chúng mang lại.


Và François Chollet không chống lại các công cụ trí tuệ nhân tạo. Nó tốt, nó hữu ích, nó mang lại giá trị cho con người. Nhưng ông chỉ muốn ngành công nghiệp dừng lại một chút, suy nghĩ về điều quan trọng hơn: làm sao để xây dựng một AI biết tư duy thay vì chỉ học thuộc lòng. Trong khi các công ty đua nhau phát triển mô hình ngày càng lớn, chi hàng triệu đô cho phần cứng và huấn luyện, những câu hỏi mà Chollet đưa ra tưởng đơn giản nhưng lại có khả năng làm lộ rõ giới hạn hiện tại của AI, buộc các nhà phải thay đổi cách chúng học, cách suy nghĩ rồi mới có thể tiến tới AGI.


Tin xem thêm

Hy hữu: Chim cánh cụt làm rơi máy bay trực thăng

Chuyên mục Ngày
12/04/2025 10:49

Hy hữu: Chim cánh cụt làm rơi máy bay trực thăng

Giá vàng sáng 12/4 đồng loạt tăng, vàng miếng vượt 106 triệu đồng/lượng

Chuyên mục UH Plus
12/04/2025 10:47

Giá vàng trong nước sáng 12/4 đồng loạt tăng, cùng chiều với giá vàng thế giới, vàng miếng SJC vượt 106 triệu đồng/lượng.

Từ bài viết của Tổng Bí thư Tô Lâm, nghĩ về tư duy hội nhập trong kỷ nguyên mới

Chuyên mục UH Plus
12/04/2025 10:47

Hội nhập quốc tế đã trở thành một bộ phận hữu cơ của chiến lược phát triển quốc gia kể từ công cuộc Đổi mới. Tuy nhiên, trong bối cảnh tình hình thế giới có nhiều chuyển ...

Khi thế giới đang kì vọng vào AGI thì François Chollet lại đang cho thấy AI "khờ dại" như thế nào

Chuyên mục Ngày
11/04/2025 11:35

Khi thế giới đang kì vọng vào AGI thì François Chollet lại đang cho thấy AI "khờ dại" như thế nào

Apple đã ship 600 tấn iPhone về Mỹ để né thuế

Chuyên mục Ngày
11/04/2025 11:30

Apple đã ship 600 tấn iPhone về Mỹ để né thuế

Hà Nội đầu tư gần 3.000 tỷ đồng xây dựng hầm chui Hoàng Quốc Việt-Phạm Văn Đồng

Chuyên mục UH Plus
11/04/2025 11:26

Dự án xây dựng hầm chui đường Hoàng Quốc Việt kéo dài đường Phạm Văn Đồng, kết nối với phố Trần Vỹ có tổng chiều dài khoảng 600m. Dự án thuộc nhóm B, công trình giao thôn...

Ủy ban Thường vụ Quốc hội xem xét, thông qua nghị quyết sắp xếp đơn vị hành chính

Chuyên mục UH Plus
11/04/2025 11:25

Tại phiên họp thứ 43, Ủy ban Thường vụ Quốc hội sẽ xem xét, thông qua Nghị quyết về sắp xếp đơn vị hành chính vào ngày 14/4.

Anh em vẫn mơ "iPhone giá 2.300 USD"?

Chuyên mục Ngày
11/04/2025 00:01

"iPhone giá 2.300 USD": Lắp ráp iPhone ở Mỹ không chỉ khó ở chuyện nhân công

Chuyện thật như đùa: Mang video làm bằng AI đến tòa án để tự bào chữa

Chuyên mục UH Plus
10/04/2025 23:59

Chuyện thật như đùa: Mang video làm bằng AI đến tòa án để tự bào chữa