MXH mygo - OpenAI ra mắt con chip tùy chỉnh đầu tiên do Broadcom sản xuất.
Vào thứ Tư, OpenAI đã công bố bộ xử lý suy luận (inference processor) đầu tiên do hãng tự phát triển, được thiết kế và sản xuất với sự hợp tác của Broadcom. Mang tên Jalapeño, bộ xử lý mới này được thiết kế riêng để đáp ứng các nhu cầu đặc thù của hệ thống suy luận tại OpenAI. Công ty cho biết chính các mô hình AI của họ cũng đã hỗ trợ quá trình phát triển con chip này. Mặc dù con chip vẫn đang trong giai đoạn thử nghiệm, OpenAI cho biết các kết quả ban đầu cho thấy hiệu suất trên mỗi watt (performance-per-watt) vượt trội đáng kể so với các giải pháp tiên tiến nhất hiện có trên thị trường.
Chủ tịch OpenAI, ông Greg Brockman, đã giải thích về cách tiếp cận của công ty đối với việc phát triển chip trong chương trình podcast nội bộ, ngay sau khi thông tin hợp tác với Broadcom được công bố. "Chúng tôi có sự hiểu biết sâu sắc về các tác vụ xử lý," ông Brockman chia sẻ trong tập podcast. "Chúng tôi luôn tìm kiếm những tác vụ cụ thể chưa được đáp ứng đầy đủ, [và tự hỏi] làm thế nào để tạo ra một giải pháp có thể thúc đẩy và mở rộng các giới hạn của những gì có thể thực hiện được?"
Jalapeño được thiết kế chuyên biệt cho quá trình suy luận (inference) – tức là việc vận hành các mô hình AI đã được xây dựng sẵn để phản hồi lại lệnh từ người dùng. Trong thông báo của mình, OpenAI nhấn mạnh chi phí vận hành thấp của con chip này khi chạy các mô hình lập trình theo thời gian thực. Nhiều khả năng, các tác vụ đòi hỏi hiệu năng cao hơn như huấn luyện sơ bộ (pre-training) vẫn sẽ phụ thuộc vào phần cứng của Nvidia; tuy nhiên, ngay cả việc giảm thiểu một phần nhỏ chi phí suy luận cũng có thể mang lại tác động lớn đến hiệu quả tài chính của công ty. "OpenAI không chỉ phát triển các mô hình tiên tiến hay xây dựng sản phẩm dựa trên nền tảng đó, mà còn thiết kế cả cơ sở hạ tầng bên dưới: từ kiến trúc chip, nhân hệ thống (kernel), hệ thống bộ nhớ, mạng lưới, cơ chế điều phối, hệ thống triển khai cho đến trải nghiệm sản phẩm," công ty cho biết. "Nhờ hoạt động xuyên suốt toàn bộ hệ thống, mỗi lớp thành phần đều có thể được tối ưu hóa hướng tới cùng một mục tiêu: giúp các mô hình vận hành nhanh hơn, ổn định hơn và có chi phí hợp lý hơn cho người dùng".

Theo Russell Brandom https://techcrunch.com/2026/06/24/openai-unveils-its-first-custom-chip-built-by-broadcom/