Có thể mô hình GPT-5 sẽ được OpenAI ra mắt ngay mùa hè năm nay

Có thể mô hình GPT-5 sẽ được OpenAI ra mắt ngay mùa hè năm nay

OpenAI đã cho ra mắt mô hình ngôn ngữ GPT-4 khoảng 1 năm trước. Nó là một bản nâng cấp rất mạnh so với GPT-3 và sau đó là GPT-3.5. Nhưng câu hỏi vẫn là, tới khi nào GPT-5 sẽ được OpenAI tung ra. Trong những cuộc phỏng vấn hay xuất hiện trước truyền thông, CEO Sam Altman luôn tránh né câu hỏi này.

Nhưng mới đây theo một bài viết của Business Insider, GPT-5, phiên bản mới nhất của mô hình ngôn ngữ được OpenAI phát triển và vận hành có thể sẽ ra mắt ngay trong mùa hè năm nay. Hai nguồn tin nội bộ của OpenAI cách đây 1 tuần đã cho biết, bản thử nghiệm của GPT-5 đã được OpenAI giao cho những đối tác doanh nghiệp, để thấy những cải tiến trong ChatGPT vận hành dựa trên GPT-4 so với GPT-5. Một CEO doanh nghiệp được chiêm ngưỡng sức mạnh của GPT-5 mô tả nó là một mô hình ngôn ngữ rất mạnh, tốt hơn hẳn so với GPT-4.

Cùng lúc, Sam Altman trên podcast của Lex Fridman cũng đã hé lộ những thông tin về thời điểm ra mắt GPT-5: “Chúng tôi sẽ tung mô hình ngôn ngữ này ra thị trường trong vài tháng tới, bên cạnh những công cụ khác đang được phát triển. Tôi nghĩ mô hình ngôn ngữ này sẽ rất ngon. Nhưng mà trước khi nói đến bản thân mô hình GPT-5 và những ứng dụng vận hành dựa trên GPT-5, tôi nghĩ sẽ còn rất nhiều những thứ quan trọng khác sẽ được chúng tôi cho ra mắt trước.”

Nguồn tin nội bộ của OpenAI nói, GPT-5 hiện tại đang hoàn tất quá trình huấn luyện nhờ dữ liệu con người tạo ra. Sau đó, nó sẽ được đưa vào giai đoạn thử nghiệm nội bộ để đảm bảo những hàng rào an toàn vận hành như ý muốn của con người. Mọi vấn đề nảy sinh đều phải được chỉnh sửa và khắc phục trước khi GPT-5 chính thức ra mắt công chúng.

Mô hình ngôn ngữ AI tạo văn bản bằng cách nào?

Giống như GPT-4, GPT-5, hay mô hình ngôn ngữ thế hệ mới do OpenAI nghiên cứu cũng sẽ là một mô hình ngôn ngữ quy mô lớn với nhiều chế độ nội dung, từ hình ảnh đến văn bản. Nó vẫn có thể nhận câu lệnh dạng văn bản hoặc hình ảnh để xử lý lệnh mà con người yêu cầu. Về mặt vận hành, GPT-5 vẫn sẽ hoạt động theo hướng dự đoán và nội suy dạng next-token, dựa vào những nội dung và dữ liệu nó được huấn luyện trước đó để tạo ra những cụm ký tự, những đoạn văn với chất lượng hợp lý, phục vụ cho nhiều nhu cầu như viết luận văn hay tổng hợp thông tin.

GPT-4 ra mắt vào tháng 3/2023, là bản nâng cấp lớn so với GPT-3, ra mắt năm 2020, và sau đó là bản nâng cấp GPT-3.5 hồi cuối năm 2022. Rồi đến tháng 11/2023, GPT-4 Turbo đã được ra mắt, với lợi thế lớn nhất là giảm chi phí nội suy tạo nội dung khi chạy trên những data center phục vụ các dịch vụ chatbot AI. Tuy nhiên GPT-4 Turbo đã có vài lần bị phát hiện là “lười biếng” khi mô hình ngôn ngữ không chịu trả lời câu lệnh của người dùng, hoặc hoàn thiện những dòng code mà con người yêu cầu mô hình AI viết.

Để có được sức mạnh như vậy, GPT hay bất kỳ mô hình ngôn ngữ do các tập đoàn công nghệ phát triển đều cần lượng dữ liệu đầu vào khổng lồ để phục vụ quá trình huấn luyện cho thuật toán machine learning và neural network. Hầu hết dữ liệu này đều được thu thập từ các dịch vụ và nền tảng trực tuyến trên mạng internet, thường phải bỏ tiền mua lại từ chủ sở hữu và đơn vị vận hành dịch vụ trực tuyến, như các mạng xã hội Facebook, Twitter và Reddit, hay những cơ sở dữ liệu văn bản và hình ảnh của các đơn vị nắm giữ bản quyền hay các tập đoàn truyền thông.

Chất lượng dữ liệu và văn bản mà mô hình AI tạo ra luôn luôn phụ thuộc vào chất lượng bộ cơ sở dữ liệu dùng để huấn luyện mô hình AI, và dựa vào yếu tố kiểm soát mô hình, để chatbot không có xu hướng tổng hợp những thông tin sai, hoặc tệ hơn là bịa đặt thông tin cho người dùng. Trường hợp bịa đặt thông tin được gọi bằng khái niệm “AI bị loạn”, hay tiếng Anh gọi là hallucination.