Apple hé lộ mô hình AI mới: Tạo văn bản nhanh như chớp, có thể sớm tích hợp trên iPhone

15/10/2025 09:08
Apple hé lộ mô hình AI mới: Tạo văn bản nhanh như chớp, có thể sớm tích hợp trên iPhone

Trong một nghiên cứu mới, Apple đã giới thiệu mô hình ngôn ngữ mang tên Few-Step Discrete Flow-Matching (FS-DFM), hứa hẹn khả năng tạo văn bản dài nhanh hơn đến 128 lần so với các chatbot phổ biến hiện nay như GPT hay Grok. Đây là một bước tiến quan trọng, mở đường cho những tính năng AI mạnh mẽ, xử lý ngay trên thiết bị (on-device AI) trong tương lai.

Hầu hết các chatbot mà chúng ta đang sử dụng, từ ChatGPT đến Google Gemini, đều hoạt động theo phương pháp "autoregressive". Có thể hình dung phương pháp này giống như một người đang viết văn bản từng chữ một. Chúng tạo ra từ tiếp theo dựa trên những từ đã viết trước đó, rồi cứ thế lặp lại cho đến khi hoàn thành. Cách làm tuần tự này tuy đảm bảo sự mạch lạc nhưng lại vô tình tạo ra một giới hạn về tốc độ. Ngược lại, các mô hình Diffusion hoạt động theo một cách khác biệt hơn. Hãy tưởng tượng nó giống như việc phác thảo toàn bộ một bức tranh mờ ảo trước, sau đó mới dần dần làm sắc nét từng chi tiết. Mô hình này tạo ra một loạt từ ngữ cùng lúc, sau đó "tinh chỉnh" chúng qua nhiều bước để cho ra đoạn văn hoàn chỉnh.

Mô hình FS-DFM của Apple cũng làm tương tự: nó tạo ra một loạt từ ngữ (một bản nháp thô) cùng lúc, sau đó "tinh chỉnh" chúng qua nhiều bước để cho ra đoạn văn cuối cùng. Điểm đột phá ở đây là, trong khi các mô hình diffusion truyền thống cần hàng trăm, thậm chí hàng nghìn vòng lặp để làm "sắc nét" văn bản, công nghệ của Apple chỉ cần một số bước rất ít (few-step), đôi khi chỉ cần 8 vòng lặp là đã có thể cho ra kết quả chất lượng cao.

Để tối ưu hóa quá trình này, các nhà nghiên cứu của Apple đã áp dụng một phương pháp huấn luyện gồm ba bước: Đầu tiên, mô hình được "dạy" cách hoạt động hiệu quả với các "ngân sách" vòng lặp khác nhau (tức là giới hạn số lần được phép tinh chỉnh). Sau đó, họ sử dụng một mô hình lớn hơn, mạnh hơn đóng vai trò "giáo viên" để hướng dẫn, giúp mô hình chính học hỏi và đưa ra các bản cập nhật chính xác hơn trong mỗi vòng lặp. Và cuối cùng, họ áp dụng các kỹ thuật để đảm bảo kết quả đầu ra luôn nhất quán và chất lượng, ngay cả khi chỉ thực hiện trong vài bước tinh chỉnh.
[​IMG]
Khi so sánh, FS-DFM tỏ ra vượt trội hơn các mô hình Diffusion khác ở hai chỉ số quan trọng là độ phức tạp và "entropy". Có thể hiểu nôm na, "entropy" là thước đo mức độ sáng tạo và ngẫu nhiên của văn bản. Nếu entropy quá thấp, văn bản sẽ trở nên nhàm chán, lặp đi lặp lại. Nếu quá cao, văn bản sẽ trở nên vô nghĩa. So với các dòng diffusion model lớn (Dream 7B, LLaDA 8B), các phiên bản FS-DFM “nhẹ” (chỉ 1.7B, 1.3B, 0.17B tham số) vẫn đạt hiệu quả tốt hơn về chất lượng văn bản và tốc độ, bất kể số lượt lặp refinement.

FS-DFM mở ra hướng đi mới cho các mô hình tạo văn bản AI: sinh ra văn bản dài chất lượng chỉ với vài lần xử lý, phù hợp với thiết bị hiệu năng vừa phải, không cần phần cứng mạnh. Apple và nhóm nghiên cứu dự kiến sẽ công khai mã nguồn, thông số mô hình để cộng đồng kiểm nghiệm, thử nghiệm tiếp tục.


Tin xem thêm

Top 10 sản phẩm điện thoại thông minh bán chạy nhất thế giới

Chuyên mục Ngày
24/05/2026 07:37

MXH mygo - Tất nhiên iphone 17 tiếp tục thống trị!

Xiaomi ra mắt vòng đeo tay thông minh Smart Band 10 Pro

Chuyên mục Ngày
23/05/2026 07:37

MXH mygo - Xiaomi ra mắt vòng đeo tay thông minh Smart Band 10 Pro với tính năng theo dõi HRV, độ sáng 2000 nits và chế độ chơi game.

Một dãy núi cổ đại ở Mỹ chứa đủ lượng lithium để sản xuất 500 tỷ chiếc điện thoại di động.

Chuyên mục Ngày
23/05/2026 07:10

MXH mygo - Việc phát hiện mỏ lithium khổng lồ ở Mỹ có thể cung cấp năng lượng cho 130 triệu xe điện, và cuộc đua về pin có thể không còn chỉ thuộc về Trung Quốc nữa.

SAIC dự kiến ​​đạt cột mốc 100 triệu xe được giao vào cuối tháng 5.

Chuyên mục Ngày
23/05/2026 06:45

MXH mygo - SAIC Motor: Chuẩn bị đón khách hàng toàn cầu thứ 100 triệu vào cuối tháng 5.

Tin đồn iPhone 19 Pro sẽ có màn hình cong bốn chiều.

Chuyên mục Ngày
22/05/2026 10:34

MXH mygo - Nguyên mẫu iPhone 19 Pro đang được thử nghiệm được cho là có màn hình cong bốn chiều.

Thiết kế camera "LED phát sáng" của Pixel 11 và Pixel 11 Pro được hé lộ trước khi ra mắt.

Chuyên mục Ngày
22/05/2026 09:17

MXH mygo - Một đoạn teaser tại Google I/O 2026 đã tiết lộ Pixel Glow, một dải đèn thông báo mới cho dòng Pixel 11. Trong một video trình diễn AI tại sự kiện, Google đã ch...

Elon Musk có thể trở thành tỷ phú nghìn tỷ đầu tiên trên thế giới sau đợt IPO của SpaceX?

Chuyên mục Ngày
22/05/2026 08:51

MXH mygo - Elon Musk sở hữu khoảng 5,1 tỷ cổ phiếu của SpaceX, cùng với gần 350 triệu quyền chọn cổ phiếu với giá CP 8,39 đô la

YouTube đang được cho rằng thử nghiệm tính năng tìm kiếm hội thoại 'Hỏi YouTube'

Chuyên mục Ngày
21/05/2026 09:42

MXH mygo - YouTube thử nghiệm tính năng tìm kiếm hội thoại ’Hỏi YouTube’ được hỗ trợ bởi trí tuệ nhân tạo.

Tin đồn tiếp theo về kính Samsung Galaxy...

Chuyên mục Ngày
21/05/2026 09:15

MXH mygo - Sản phẩm Android XR tiếp theo của Samsung được cho là một cặp kính thông minh có tên mã là “Jinju”.