GLM-5.2: Mô hình AI mã nguồn mở đánh bại GPT-5.5 và đang đuổi kịp Claude Opus 4.8

02/07/2026 20:49
MXH mygo - GLM-5.2 của Z.ai đã đánh bại GPT-5.5 trên nhiều tiêu chuẩn mã hóa với chi phí chỉ bằng 1/6. Được cấp phép theo giấy phép MIT, có 1 triệu ngữ cảnh và có thể chạy cục bộ thông qua lượng tử hóa Unsloth...

Một mô hình mở với 744 tỷ tham số từ Z.ai vừa đánh bại GPT-5.5 trên nhiều bài kiểm tra mã hóa dài hạn — với chi phí chỉ bằng một phần sáu. GLM-5.2 là mô hình mở mạnh nhất từng được phát hành, và nó thay đổi cách tính toán cho bất kỳ doanh nghiệp nào đang đánh giá cơ sở hạ tầng AI vào năm 2026.

GLM-5.2 là mô hình ngôn ngữ lớn mở mới nhất của Z.ai, được phát hành vào ngày 16 tháng 6 năm 2026 theo giấy phép MIT không hạn chế. Nó có tổng cộng 744 tỷ tham số với khoảng 40 tỷ tham số hoạt động trên mỗi token (thông qua Mixture-of-Experts), cửa sổ ngữ cảnh 1 triệu token và những cải tiến kiến ​​trúc giúp nó cạnh tranh với — và trong một số hạng mục tốt hơn — các mô hình độc quyền tiên tiến từ OpenAI và Anthropic. Điều này rất quan trọng bởi vì khoảng cách giữa các mô hình AI mở và đóng đang thu hẹp nhanh chóng, nhưng GLM-5.2 đại diện cho một điều mới mẻ: một mô hình mở không chỉ "tiến gần" đến ranh giới mà còn sánh ngang hoặc vượt trội hơn trên các tiêu chuẩn quan trọng cụ thể. Đối với các doanh nghiệp, điều này có nghĩa là việc xây dựng hay mua cơ sở hạ tầng AI đã thay đổi về cơ bản. Giờ đây, bạn có thể tải xuống một mô hình hàng đầu, tinh chỉnh nó trên dữ liệu của mình và chạy nó trên phần cứng của riêng bạn mà không ảnh hưởng đáng kể đến khả năng.



GLM-5.2 liên tục được xếp hạng là mô hình trọng số mở đạt điểm cao nhất trong các đánh giá của bên thứ ba. Trên Chỉ số Trí tuệ Phân tích Nhân tạo v4.1 — tổng hợp 9 đánh giá bao gồm GDPval, Terminal-Bench, Humanity's Last Exam và GPQA Diamond — nó đạt 51 điểm, trở thành mô hình trọng số mở hàng đầu. Quan trọng hơn, nó cạnh tranh sòng phẳng với các mô hình độc quyền hàng đầu trên các tiêu chuẩn quan trọng nhất đối với công việc kỹ thuật thực tế. Các kết quả nổi bật được công bố như sau:
FrontierSWE: 74,4% — chỉ kém Claude Opus 4.8 (75,1%) 1% và vượt trội hơn GPT-5.5 (72,6%)
PostTrainBench: 34,3% — vượt xa GPT-5.5 (25,0%)
SWE-Marathon: 13,0% — chỉ đứng sau Claude Opus 4.8, đánh bại GPT-5.5 (12,0%)
SWE-bench Pro: 62,1 — vượt trội hơn hẳn GPT-5.5 (58,6) và phiên bản tiền nhiệm GLM-5.1 (58,4)
MCP-Atlas (sử dụng công cụ): 77,0 — vượt trội hơn GPT-5.5 (75,3), chỉ kém Claude Opus 4.8 (77,8)
Bài kiểm tra cuối cùng của nhân loại (với công cụ): 54,7 — vượt trội hơn GPT-5.5 (52,2), xếp sau Claude Opus 4.8 (57,9)
Terminal-Bench 2.1: 81,0 — một bước nhảy vọt đáng kể so với 63,5 của GLM-5.1, gần bằng Claude Opus 4.8 (85,0)
Design Arena: Đứng đầu với điểm ELO 1360, thậm chí vượt qua cả Claude Fable 5
Code Arena (Frontend): Thực tế là số 1 ở mức nỗ lực tối đa, vượt trội hơn Claude Opus 4.7 Thinking

Mô hình rất rõ ràng: GLM-5.2 vượt trội trong các tác vụ phức tạp, nhiều bước, đòi hỏi khả năng suy luận liên tục trong thời gian dài. Đó chính xác là nơi mà hầu hết giá trị AI doanh nghiệp được tạo ra vào năm 2026...

Trích dẫn https://flowtivity.ai/blog/glm-5-2-open-source-frontier-model/


Tin xem thêm

LG đã hồi sinh dòng Gram laptop

Chuyên mục Ngày
02/07/2026 20:23

MXH mygo - Dòng laptop Gram năm 2026 của LG có giá khởi điểm từ 1.150 đô la.

Redmi K90 Ultra ra mắt với Snapdragon 8 Elite

Chuyên mục Ngày
01/07/2026 11:12

MXH mygo - Redmi K90 Ultra ra mắt với Snapdragon 8 Elite, quạt tản nhiệt chủ động, màn hình AMOLED 165Hz & pin 8550mAh

Apple siết chặt kiểm soát sau khi các video rò rỉ về iPhone 18 Pro

Chuyên mục Ngày
01/07/2026 10:43

MXH mygo - Apple có thể đang thực hiện các biện pháp để hạn chế sự lan truyền của các đoạn video rò rỉ về iPhone 18 Pro xuất hiện trên mạng sau một cuộc tấn công mạng gần...

Sàn giao dịch tiền điện tử OKX muốn các tác nhân AI tuyển dụng và trả lương cho nhau!

Chuyên mục Ngày
30/06/2026 17:44

MXH mygo - Sàn giao dịch tiền điện tử OKX muốn các tác nhân AI tuyển dụng và trả lương cho nhau.

Microsoft Edge gỡ 119 tiện ích chứa mã độc

Chuyên mục Ngày
30/06/2026 17:13

MXH mygo - 119 tiện ích mở rộng của Edge hứa hẹn cung cấp các công cụ hữu ích, nhưng thay vào đó lại tải xuống phần mềm độc hại.

Ấn Độ dự đoán AI sẽ đóng vai trò quan trọng trong kỷ nguyên thanh toán kỹ thuật số

Chuyên mục Ngày
29/06/2026 09:22

MXH mygo - Quan chức ngành thanh toán Ấn Độ cho rằng trí tuệ nhân tạo (AI) sẽ đóng vai trò quan trọng trong kỷ nguyên tiếp theo của sự phát triển thanh toán kỹ thuật số.

Vì sao từ OpenAI đến SpaceX đều đang tự sản xuất chip của riêng mình?

Chuyên mục Ngày
29/06/2026 08:53

MXH mygo - Vì sao tất cả các công ty từ OpenAI đến SpaceX đều đang tự sản xuất chip của riêng mình (và gia tăng áp lực lên Nvidia)?

Apple xin "phá rào" được sử dụng nhà sản xuất Trung Quốc vốn đang chịu lệnh trừng phạt

Chuyên mục Ngày
28/06/2026 22:51

MXH mygo - Apple xin phép Mỹ sử dụng nhà sản xuất bộ nhớ Trung Quốc CXMT đang chịu lệnh trừng phạt.

Microsoft gia hạn chương trình cập nhật bảo mật miễn phí cho Windows 10 thêm 1 năm

Chuyên mục Ngày
28/06/2026 22:41

MXH mygo - Microsoft gia hạn chương trình cập nhật bảo mật miễn phí cho Windows 10 thêm một năm nữa — thời hạn kết thúc hiện được dời sang ngày 12 tháng 10 năm 2027.