OpenAI vừa ra mắt GPT-Realtime-2, GPT-Realtime-Translate và GPT-Realtime-Whisper cho nền tảng Realtime API, hỗ trợ các trợ lý ảo suy luận, dùng công cụ và xử lý tác vụ phức tạp theo thời gian thực.
Trong đó, GPT-Realtime-2 đạt mức thông minh của GPT-5, mở rộng cửa sổ ngữ cảnh lên 128K (từ mức 32K). Mô hình này cải thiện khả năng khôi phục lỗi, kiểm soát giọng điệu và tăng 26 điểm tỷ lệ cuộc gọi thành công.
Đồng thời, GPT-Realtime-Translate cho phép dịch giọng nói trực tiếp từ hơn 70 ngôn ngữ đầu vào sang 13 ngôn ngữ đích. Kết hợp cùng tính năng chuyển đổi âm thanh thành văn bản độ trễ thấp của GPT-Realtime-Whisper, các nhà phát triển hiện có thêm công cụ để xây dựng những ứng dụng giọng nói đa ngôn ngữ linh hoạt hơn.
