Gần đây, cây bút công nghệ Geoffrey A. Fowler của tờ Washington Post đã thử nghiệm tính năng mới “ChatGPT Health” bằng cách kết nối dữ liệu sức khỏe hơn 10 năm từ Apple Watch của mình với AI, và kết quả thật sự khiến anh hoảng hốt.
ChatGPT chấm sức khỏe tim mạch của anh ở mức “F”, ngụ ý rằng tình trạng tim mạch của anh đang “nguy kịch”. Thế nhưng khi Fowler đem dữ liệu này tới bác sĩ thật, kết luận lại hoàn toàn ngược lại: anh hoàn toàn khỏe mạnh, nguy cơ bệnh tim cực kỳ thấp.
Vấn đề nằm ở cách ChatGPT diễn giải dữ liệu sức khỏe. AI dựa quá nhiều vào chỉ số VO2 max và nhịp tim biến thiên (HRV), vốn chỉ là ước lượng, không phải kết quả đo chính xác. Trong khi đó, các chuyên gia tim mạch cho rằng những con số này không đủ đáng tin để đánh giá rủi ro tim mạch. ChatGPT còn không nhận ra rằng các mẫu Apple Watch khác nhau có thể theo dõi khác nhau, khiến phân tích sai lệch thêm. Nguy hiểm hơn, mỗi lần Fowler hỏi lại, kết quả lại thay đổi: lúc thì điểm F, lúc thì B, thậm chí đôi khi chatbot còn “quên” cả tuổi và giới tính của anh.
Vụ việc này là lời cảnh báo về việc tin tưởng mù quáng vào AI trong y tế. Dù OpenAI khẳng định dữ liệu được mã hóa và không dùng để huấn luyện mô hình, nhưng ChatGPT không phải là nhà cung cấp dịch vụ y tế và không chịu sự bảo vệ của luật HIPAA. Cho đến khi các công cụ AI được kiểm chứng và quản lý chặt chẽ hơn, có lẽ điều khôn ngoan nhất vẫn là xem chúng như công cụ tham khảo, chứ không phải chuyên gia sức khỏe thật sự.
