MXH mygo - GLM-5.2 của Z.ai đã đánh bại GPT-5.5 trên nhiều tiêu chuẩn mã hóa với chi phí chỉ bằng 1/6. Được cấp phép theo giấy phép MIT, có 1 triệu ngữ cảnh và có thể chạy cục bộ thông qua lượng tử hóa Unsloth...
Một mô hình mở với 744 tỷ tham số từ Z.ai vừa đánh bại GPT-5.5 trên nhiều bài kiểm tra mã hóa dài hạn — với chi phí chỉ bằng một phần sáu. GLM-5.2 là mô hình mở mạnh nhất từng được phát hành, và nó thay đổi cách tính toán cho bất kỳ doanh nghiệp nào đang đánh giá cơ sở hạ tầng AI vào năm 2026.
GLM-5.2 là mô hình ngôn ngữ lớn mở mới nhất của Z.ai, được phát hành vào ngày 16 tháng 6 năm 2026 theo giấy phép MIT không hạn chế. Nó có tổng cộng 744 tỷ tham số với khoảng 40 tỷ tham số hoạt động trên mỗi token (thông qua Mixture-of-Experts), cửa sổ ngữ cảnh 1 triệu token và những cải tiến kiến trúc giúp nó cạnh tranh với — và trong một số hạng mục tốt hơn — các mô hình độc quyền tiên tiến từ OpenAI và Anthropic. Điều này rất quan trọng bởi vì khoảng cách giữa các mô hình AI mở và đóng đang thu hẹp nhanh chóng, nhưng GLM-5.2 đại diện cho một điều mới mẻ: một mô hình mở không chỉ "tiến gần" đến ranh giới mà còn sánh ngang hoặc vượt trội hơn trên các tiêu chuẩn quan trọng cụ thể. Đối với các doanh nghiệp, điều này có nghĩa là việc xây dựng hay mua cơ sở hạ tầng AI đã thay đổi về cơ bản. Giờ đây, bạn có thể tải xuống một mô hình hàng đầu, tinh chỉnh nó trên dữ liệu của mình và chạy nó trên phần cứng của riêng bạn mà không ảnh hưởng đáng kể đến khả năng.

GLM-5.2 liên tục được xếp hạng là mô hình trọng số mở đạt điểm cao nhất trong các đánh giá của bên thứ ba. Trên Chỉ số Trí tuệ Phân tích Nhân tạo v4.1 — tổng hợp 9 đánh giá bao gồm GDPval, Terminal-Bench, Humanity's Last Exam và GPQA Diamond — nó đạt 51 điểm, trở thành mô hình trọng số mở hàng đầu. Quan trọng hơn, nó cạnh tranh sòng phẳng với các mô hình độc quyền hàng đầu trên các tiêu chuẩn quan trọng nhất đối với công việc kỹ thuật thực tế. Các kết quả nổi bật được công bố như sau:
FrontierSWE: 74,4% — chỉ kém Claude Opus 4.8 (75,1%) 1% và vượt trội hơn GPT-5.5 (72,6%)
PostTrainBench: 34,3% — vượt xa GPT-5.5 (25,0%)
SWE-Marathon: 13,0% — chỉ đứng sau Claude Opus 4.8, đánh bại GPT-5.5 (12,0%)
SWE-bench Pro: 62,1 — vượt trội hơn hẳn GPT-5.5 (58,6) và phiên bản tiền nhiệm GLM-5.1 (58,4)
MCP-Atlas (sử dụng công cụ): 77,0 — vượt trội hơn GPT-5.5 (75,3), chỉ kém Claude Opus 4.8 (77,8)
Bài kiểm tra cuối cùng của nhân loại (với công cụ): 54,7 — vượt trội hơn GPT-5.5 (52,2), xếp sau Claude Opus 4.8 (57,9)
Terminal-Bench 2.1: 81,0 — một bước nhảy vọt đáng kể so với 63,5 của GLM-5.1, gần bằng Claude Opus 4.8 (85,0)
Design Arena: Đứng đầu với điểm ELO 1360, thậm chí vượt qua cả Claude Fable 5
Code Arena (Frontend): Thực tế là số 1 ở mức nỗ lực tối đa, vượt trội hơn Claude Opus 4.7 Thinking
Mô hình rất rõ ràng: GLM-5.2 vượt trội trong các tác vụ phức tạp, nhiều bước, đòi hỏi khả năng suy luận liên tục trong thời gian dài. Đó chính xác là nơi mà hầu hết giá trị AI doanh nghiệp được tạo ra vào năm 2026...
Trích dẫn https://flowtivity.ai/blog/glm-5-2-open-source-frontier-model/