Anh em thấy sao? Kết quả tìm kiếm, trích dẫn từ các công cụ AI không hoàn toàn chính xác!

09/04/2025 11:57
Nghiên cứu mới đây cho thấy kết quả tìm kiếm, trích dẫn từ các công cụ AI không hoàn toàn chính xác

Các công cụ trí tuệ nhân tạo có thể cách mạng hoá cách con người truy cập và tiếp cận thông tin, tuy nhiên, các công cụ này lại đang gặp vấn đề trong việc trích nguồn tin mà chúng tổng hợp trong quá trình cung cấp thông tin cho người dùng.


Theo đó, một nghiên cứu mới đây của Trung tâm Báo chí Kỹ thuật số Tow thuộc Columbia Journalism Review đã đặt ra những nghi vấn nghiêm trọng về độ tin cậy của các công cụ tìm kiếm sử dụng trí tuệ nhân tạo. Hai nhà nghiên cứu Klaudia Jaźwińska và Aisvarya Chandrasekar đã tiến hành đánh giá tám mô hình ngôn ngữ lớn (LLM) bằng cách sử dụng 10 đoạn trích từ 20 nhà xuất bản khác nhau. Họ đã chạy tổng cộng 1.600 truy vấn và đánh giá thủ công từng kết quả để xác định mức độ chính xác trong việc xác định đúng nhà xuất bản, tìm đúng bài viết gốc và trích dẫn đúng liên kết URL.


Các mức đánh giá trong nghiên cứu


Từ cách tiếp cận này, họ sẽ đưa ra một thang điểm để đánh giá các mô hình ngôn ngữ lớn, đồng thời tổng hợp để tạo thành một biểu đồ trực quan để thể hiện xu hướng sai lệch với các câu trả lời không chính xác. Sau đây là một số phát hiện chính từ nghiên cứu:


  • Thiếu chính xác trong trích dẫn và xác định nguồn gốc: Các công cụ AI thường xuyên không thể xác định đúng tên nhà xuất bản hoặc bài viết mà đoạn trích được lấy ra. Nhiều liên kết bị làm giả hoặc dẫn đến bản sao của bài viết thay vì trang gốc.
  • Thiên lệch về sai sót: Biểu đồ tổng hợp cho thấy phần lớn các công cụ AI tạo ra kết quả sai hoặc không chính xác, với rất ít màu xanh biểu thị độ chính xác. Trong số các mô hình được đánh giá, chỉ có Perplexity và Perplexity Pro là đạt kết quả tốt nhất, trong khi các mô hình GrokGemini gặp nhiều khó khăn trong việc cho ra kết quả chính xác.
  • Tạo ra kết quả giả: Một phát hiện không quá bất ngờ là nhiều công cụ AI có xu hướng tạo ra kết quả sai thay vì thừa nhận rằng chúng không có thông tin chính xác. Chúng thường bịa ra liên kết hoặc trích dẫn từ các phiên bản sao chép, gây hiểu lầm cho người dùng. Đây vốn là một vấn đề cố hữu của các công cụ trí tuệ nhân tạo khi chúng thường “chém gió” với người dùng.

Kết quả mà nghiên cứu trả về với các công cụ ChatGPT, Perplexity, Perplexity Pro, DeepSeek, Copilot, Grok, Gemini


  • Các phiên bản trả phí hoạt động kém hơn: Ngược với kỳ vọng, các phiên bản trả phí của các chatbot AI lại thường đưa ra câu trả lời sai với sự tự tin cao hơn so với các phiên bản miễn phí. Nếu điều này được xác thực, câu hỏi đặt ra là liệu các dịch vụ trả phí có thật sự đáng tiền khi có hiệu năng kém hơn so với phiên bản miễn phí?
  • Thiếu minh bạch: Không một công cụ nào trong nghiên cứu kể trên đưa ra thông tin rõ ràng về nguồn dữ liệu mà chúng có thể truy cập hoặc không thể truy cập. Tất cả đều tạo ra ảo giác về độ tin cậy, ngay cả khi thông tin cung cấp là sai lệch.
  • Tác động tiêu cực đến ngành báo chí: Khi các công cụ AI tạo nội dung mà không dẫn liên kết đến nguồn gốc, các nhà xuất bản sẽ mất lượng truy cập trực tiếp, ảnh hưởng đến doanh thu quảng cáo, lượt đăng ký và khả năng tồn tại của họ. Sự thiếu chính xác trong trích dẫn còn đe dọa niềm tin của người dùng không chỉ vào nội dung báo chí mà còn cả hiệu năng của các công cụ AI.

Nghiên cứu này cho thấy rằng các công cụ trí tuệ nhân tạo dù mang lại giá trị lớn nhưng vẫn đi kèm với những vấn đề nhất định, buộc các nhà phát triển cần cải thiện tính tính minh bạch, độ chính xác trong trích dẫn và khả năng phản hồi trước các mối lo ngại về thông tin sai lệch. Nếu không có cơ chế giám sát và trách nhiệm rõ ràng, các công cụ tìm kiếm AI có nguy cơ tiếp tục cung cấp thông tin không chính xác đồng thời tác động đến những người làm sản xuất nội dung. Ở thời điểm hiện tại, người dùng nên có sự thận trọng, kiểm tra kĩ lưỡng với các thông tin mà AI cung cấp để tránh ảnh hưởng tới công việc của mình.


Tin xem thêm

Elon Musk giải thích lý do "ám ảnh" với Sao Hỏa: Mặt trời sẽ nung nóng Trái đất 450 triệu năm nữa

Chuyên mục UH Vip
09/05/2025 10:08

Elon Musk giải thích lý do "ám ảnh" với Sao Hỏa: Mặt trời sẽ nung nóng Trái đất 450 triệu năm nữa

Bình Dương soán ngôi HAGL và chuyện nghịch lý đáng buồn

Chuyên mục UH Vip
09/05/2025 10:04

Bầu Đức từng tuyên bố HAGL đá ở V-League cho vui, nhưng những gì mà đội bóng phố Núi cho thấy còn rất… lâu mới bằng CLB Bình Dương, từ độ chịu chi tới bết bát

Chia sẻ cá nhân: Mình đã không còn dùng Google tìm kiếm thông tin nữa, AI giúp mình...

Chuyên mục UH Vip
08/05/2025 09:13

Mình đã không còn dùng Google tìm kiếm thông tin nữa, AI giúp mình...

Cho anh em bất ngờ: Du lịch thế giới qua ảnh vệ tinh góc nhìn nghiêng, Trái Đất đẹp thế nào?

Chuyên mục UH Vip
08/05/2025 09:08

Du lịch thế giới qua ảnh vệ tinh góc nhìn nghiêng, Trái Đất đã bao giờ đẹp như thế này chưa

Câu chuyện trên bức họa “Ngày Phán Xét Cuối Cùng” của Michelangelo

Chuyên mục UH Vip
08/05/2025 09:05

Câu chuyện trên bức họa “Ngày Phán Xét Cuối Cùng” của Michelangelo

Bị loại khỏi Champions League, Arsenal có mùa giải trắng tay

Chuyên mục UH Vip
08/05/2025 09:02

Rạng sáng 8/5, Arsenal thua PSG 1-2 trên sân khách, qua đó dừng chân ở bán kết Champions League.

Anh em có thích? iPhone 18 Pro có khả năng sẽ tích hợp công nghệ Face ID ẩn dưới màn hình?

Chuyên mục UH Vip
06/05/2025 09:59

iPhone 18 Pro dự kiến ra mắt trong 2026, có khả năng sẽ tích hợp công nghệ Face ID ẩn dưới màn hình

Anh em thấy sao? Bộ nhớ điện thoại - chiêu trò tối đa lợi nhuận của Apple, Google, Samsung?

Chuyên mục UH Vip
06/05/2025 09:55

Bộ nhớ điện thoại - chiêu trò tối đa lợi nhuận của Apple, Google, Samsung?

Chỉ bằng 1 ký muối bạc, TQ có thể tăng lượng mưa cho một vùng rộng 8 ngàn km vuông

Chuyên mục UH Vip
06/05/2025 09:52

Chỉ bằng 1 ký muối bạc, TQ có thể tăng lượng mưa cho một vùng rộng 8 ngàn km vuông