TinhTe/Nhật Minh - Anh nhân viên AI đang thổi bay ngân sách doanh nghiệp năm 2026. AI có thật sự rẻ hơn con người?
Nhiều doanh nghiệp đang nhận ra rằng việc dùng AI thay thế nhân viên không hề rẻ như họ từng nghĩ, thậm chí chi phí còn tăng lên đáng kể so với trước.
Câu chuyện bắt đầu từ một kỳ vọng khá phổ biến: triển khai AI agent để tự động hóa công việc, cắt giảm nhân sự, và từ đó giảm chi phí vận hành. Nhưng thực tế đang đi theo hướng ngược lại với nhiều tổ chức. Chi phí token, tức chi phí tính theo lượng dữ liệu mà AI xử lý, đang tăng rất nhanh khi quy mô triển khai mở rộng, và không ít công ty đã bị "sốc" khi nhìn vào hóa đơn cuối tháng.
Theo dự báo của Gartner, tổng chi tiêu CNTT toàn cầu năm 2026 sẽ đạt hơn 6,31 nghìn tỷ đô la Mỹ, tăng 13,5% so với năm 2025. Phần lớn mức tăng này đến từ nhu cầu hạ tầng phục vụ AI, bao gồm trung tâm dữ liệu, chip xử lý hiệu năng cao và các công nghệ hỗ trợ. Đây vừa là tín hiệu cho thấy AI đang phát triển mạnh mẽ, vừa là lời cảnh báo về áp lực ngân sách mà doanh nghiệp đang gánh chịu.

Một trong những ví dụ được nhắc đến nhiều nhất gần đây là trường hợp của Uber. CTO của công ty này được cho là đã tiêu hết toàn bộ ngân sách AI dành cho năm 2026 trước thời hạn, chủ yếu do chi phí token vượt dự kiến. "Tôi phải tính lại từ đầu vì ngân sách tôi nghĩ là đủ giờ đã bay hết rồi," người này cho biết.
Vấn đề nằm ở bản chất hoạt động của AI agent. Từ việc trả lời yêu cầu của khách hàng cho đến debug các hệ thống phần mềm phức tạp, AI có thể xử lý nhiều loại công việc khác nhau, trong đó phổ biến nhất là sinh code với tốc độ mà con người không thể đạt được. Tuy nhiên, tất cả những tác vụ đó đều tiêu thụ token, và khi chạy liên tục, con số này tích lũy rất nhanh. Một ước tính được chia sẻ với tờ The New York Times cho thấy một AI agent hoạt động toàn thời gian có thể tiêu thụ khoảng 700 triệu token mỗi tuần. Một số nhà phát triển thậm chí báo cáo mức tiêu thụ từ 1 tỷ đến 10 tỷ token một tuần.
Hiện tượng này đã sinh ra một thuật ngữ mới trong giới công nghệ: "tokenmaxxing", tức là cố tình sử dụng token ở mức tối đa để khai thác tối đa năng suất AI. Không ít kỹ sư phần mềm đang chạy đua xem ai dùng được nhiều token nhất trong một ngày. Hệ quả là những hóa đơn lên đến 150.000 đô la mỗi tháng không còn là chuyện hiếm. Một kỹ sư phần mềm ở Stockholm chia sẻ với The New York Times rằng anh chi cho Claude còn nhiều hơn mức lương của mình. Với nhiều chủ doanh nghiệp, điều này đồng nghĩa với việc họ đang trả tiền cho cả AI lẫn chính nhân viên mà AI đáng ra phải thay thế.
Về phía các nhà cung cấp, đây lại là cơ hội kinh doanh. Một số nhà đầu tư vào OpenAI cho rằng nỗi lo về chi phí token có thể giúp sản phẩm của họ cạnh tranh tốt hơn, với lập luận rằng Codex xử lý token hiệu quả hơn Claude Code của Anthropic. Trong khi đó, Anthropic lại tăng giá dịch vụ để đáp ứng nhu cầu ngày càng cao. Ngay cả tại các công ty công nghệ lớn, áp lực chi phí cũng đang hiện rõ. Phó chủ tịch phụ trách mảng deep learning ứng dụng tại Nvidia cho biết với nhóm của ông, chi phí tính toán đã vượt qua chi phí nhân sự. Đây là một tín hiệu đáng chú ý khi đến từ chính một công ty đang hưởng lợi lớn từ làn sóng AI.
Câu hỏi mà nhiều tổ chức đang phải đối mặt lúc này không còn là "AI có thể làm gì?" mà là "AI thực sự mang lại giá trị bao nhiêu so với những gì ta bỏ ra?" Áp lực chứng minh ROI, tức hiệu quả đầu tư thực sự, đang ngày càng rõ ràng hơn, dù đó là công ty khởi nghiệp hay tập đoàn hàng đầu thế giới.