Amazon Web Services (AWS) vừa thừa nhận một sự cố kéo dài 13 giờ trong tháng 12 năm ngoái là do...
Amazon Web Services (AWS) vừa thừa nhận một sự cố kéo dài 13 giờ trong tháng 12 năm ngoái là do trợ lý AI Kiro, công cụ lập trình tự động của chính Amazon, gây ra. Theo Financial Times, Kiro trong quá trình làm việc đã quyết định xóa rồi dựng lại toàn bộ môi trường hệ thống mà nó đang xử lý, dẫn đến gián đoạn dịch vụ tại một số khu vực ở Trung Quốc. Điều đáng nói là Kiro vốn được thiết kế để mọi thay đổi phải có hai nhân viên phê duyệt, nhưng do lỗi phân quyền từ con người, AI này đã có quyền truy cập lớn hơn dự kiến.
Amazon khẳng định đây chỉ là “sự cố rất giới hạn” và không thể so sánh với vụ ngừng hoạt động diện rộng hồi tháng 10, khi nhiều dịch vụ lớn như Alexa, Fortnite, ChatGPT và Amazon.com cùng bị ảnh hưởng. Tuy nhiên, nhiều nhân viên AWS tiết lộ đây là lần thứ hai trong vài tháng qua sự cố sản xuất có liên quan đến công cụ AI. Trước đó, một rắc rối tương tự xuất phát từ chatbot lập trình Q Developer, dù may mắn là không ảnh hưởng đến dịch vụ hướng khách hàng.
Sau sự việc, Amazon cho rằng lỗi thuộc về con người, không phải AI “nổi loạn”. Hãng giải thích rằng Kiro hành động trong phạm vi được cấp phép sai và nhấn mạnh “sự cố này có thể xảy ra với bất kỳ công cụ phát triển hay thao tác thủ công nào”. Công ty cũng tuyên bố đã bổ sung hàng loạt biện pháp an toàn mới và đào tạo lại nhân viên nhằm tránh lặp lại tình huống tương tự.
Sự cố lần này cho thấy ranh giới mong manh giữa tự động hóa do AI điều khiển và trách nhiệm của con người, đặt ra câu hỏi về mức độ tin cậy của các công cụ AI trong hạ tầng quan trọng như AWS.
