Hướng dẫn anh chị em sử dụng model ChatGPT miễn phí ngay trên máy tính mac/win

07/08/2025 08:26
Hướng dẫn sử dụng model ChatGPT miễn phí ngay trên máy tính mac/win của bạn
Sau nhiều năm cố gắng bắt chúng ta nộp tiền thì cuối cùng OpenAI hôm nay cũng đã chịu mở mã nguồn một trong các model của họ để chúng ta tự tải về, tự host và tự xài mà không cần lên online. Hôm nay họ chính thức phát hành model GPT-OSS 120 tỷ và 20 tỷ tham số, sử dụng công nghệ MoE (mix of expert) chứa nhiều ông chuyên gia trong đó tự suy luận, để chúng ta tự tải về vận hành dưới máy. Có rất nhiều cách để tự host model này, bên dưới đây mình sẽ chia sẻ một cách dễ nhất để mọi người host nó nhé.

Như chúng ta đã biết thì xưa giờ OpenAI họ theo đuối chiến lược đóng, nghĩa là giữ kín mã nguồn và model dù hồi mới thành lập, họ với Elon Musk đặt mục tiêu là thúc đẩy tạo ra mã nguồn mở AI cho mọi người. Tới hiện tại thì trong những bên lớn thì còn mỗi họ với Claude là vẫn đóng mã nguồn. Tuy nhiên khoảng 1 năm trở lại đây, các model mã nguồn mở đã ngày càng trở nên mạnh mẽ hơn bao giờ hết, điển hình là DeepSeek của TQ chấn động hồi đầu năm. Từ đó đến nay, không chỉ model TQ như DeepSeek, Qwen mà cả model phương tây như Llama của Meta, Mistral rồi cả Gemma của Google cũng trở thành những model mã nguồn mở ngày càng mạnh. Và mãi đến ngày hôm nay, OpenAI mới lần đầu tiên trong lịch sử công ty phát hành model mã nguồn mở của họ.

Cụ thể thì 2 model reasoning mà OpenAI hôm nay phát hành là GTP-OSS-120B, 120 tỷ tham số, cần GPU rất mạnh để vận hành và model GPT-OSS-20b, 20 tỷ tham số. Cái 20 tỷ mới là cái chúng ta cần quan tâm bởi nó chạy được trên GPU hay laptop phổ thông, chỉ cần 16GB RAM là chạy được. 2 model này đều phát hành dưới dạng giấy phép Apache 2.0, nghĩa là cho chúng ta tự tải về, triển khai, fine tune và dĩ nhiên là tự kiểm soát dữ liệu, triển khai thương mại mà không bị ràng buộc như Llama của Meta.

Một khi tự host một model, thí dụ như GPT-OSS, chúng ta sẽ đảm bảo mọi data đưa cho model đều được kiểm soát, tuyệt đối riêng tư, không sợ data đi đâu mà chúng ta không biết (thuyết âm mưu là được dùng để train cho model online). Đồng thời chúng ta sẽ xài ChatGPT mà không tốn tiền API hay nộp tiền cho OpenAI. OpenAI hôm nay còn phát hành cả bộ tokenizer gần như là hiệu quả nhất thị trường. Nôm na cho bạn nào lỡ quên thì đây là kỹ thuật bẻ chữ ra thành các đoạn nhỏ hơn và đưa vào model để train / truy vấn. Do tokenizer của OpenAI được phát triển dựa trên ký tự latin nên tiếng Việt của chúng ta chắc chắn được hỗ trợ hiệu quả, không cần phải đi finetune lại bằng tập data tiếng Việt nữa. Cái này thì đi xa quá rồi, nào có dịp mình sẽ share với mọi người về câu chuyện fine tune này nọ nha.



Có rất nhiều cách khác nhau để tự host một model, thí dụ như tự host trên máy tính bằng LMStudio, xài Ollama, tự host riêng,.... Trong bài này, mình sẽ hướng dẫn mọi người cách dùng Ollama làm back end - bộ não, và xài OpenUI làm front end - giao diện để mọi người chạy thử. Tại sao mình chọn cách này? Vì nó không quá phức tạp, bạn chỉ cần cài đúng vài cái trước để tạo môi trường trên máy cho nó chạy và sau đó là có thể xài ChatGPT gần như là trên bản online. Đồng thời cách này có thể áp dụng để bạn không chỉ nghịch với OpenAI mà còn bất cứ model mã nguồn mở nào mà bạn thích.

Về yeu cầu phần cứng, để chạy GPT-OSS 20 tỷ tham số, máy tính của bạn cần phải có phần cứng tối thiểu là:
  • RAM: từ 16GB trở lên
  • GPU: đề nghị có Nvidia hoặc AMD, CPU chạy cũng được mà nó chậm
  • Dung lượng ổ cứng: trên 20GB
  • OS: macOS 11+, Windows hoặc Ubuntu đều được.

Rồi giờ bắt tay vô cài. Mình đang viết hướng dẫn này bằng mac nên hình chụp cũng bằng mac, tuy nhiên cài Windows thì gần như tương tự hết nha.

Đầu tiên là những thứ cần cài trước:
  • Cài Python 3.11.x: đừng cài bản mới là 3.12 vì có thể chưa tương thích tốt. Cứ cài bản 3.11.x. Trong quá trình cài, mọi người nhớ chọn tick vào "Add to path" nha. Cái này rất quan trọng, vô số lỗi sinh ra khi mấy bạn nghịch AI có nguồn gốc từ cái này.
  • Cài node.js. Cái này dùng để build giao diện front end cho Open WebUI nó chạy. Các bạn cứ vào trang chủ tại đây, tải về và cài vào máy bình thường.
  • Cài git. Tương tự các bạn vào trang chủ Git tại đây, tải bộ cài về và next hết mọi thứ là xong. Cái này dùng để clone mã nguồn của Open WebUI về máy mình

Rồi, cài hết mấy thứ đó vậy là xong môi trường rồi đó. Bây giờ sẽ có 2 bước chính là vô ollama kéo model Open-OSS về, xong chạy Open WebUI lên xài.

Thực ra nó đơn giản lắm. Các bạn vào trang web của Ollama tại đây, tải bộ cài về và cài như phần mềm thông thường. Cài xong thì thử mở terminal / cmd lên chạy lệnh: ollama --version, nếu nó trả về phiên bản bao nhiêu là cài thành công rồi đó. Sau khi cài, các bạn sẽ thấy biểu tượng hình con heo trắng của ollama nó chạy ở chỗ taskbar. Lúc này là ollama nó đang chạy ở địa chỉ localhost:11434 rồi đó. Các bạn vào trình duyệt bất kỳ, gõ địa chỉ này vào sẽ thấy nó hiện ollama is running.

Bây giờ chúng ta sẽ dùng ollama để kéo model GPT-OSS 20b về. Các bạn vào terminal / cmd và gõ lệnh:

QUẢNG CÁO


ollama pull gpt-oss:20b

Nó sẽ chạy như thế này để kéo model về máy các bạn. Tổng có cỡ 13G.
[​IMG]

Sau khi nó chạy xong, các bạn có thể thử tương tác với model ngay trong command line luôn. Chỉ cần gõ:

Ollama run gpt-oss:20b

Nó sẽ hiện ra như bên dưới, kêu mình Send a message để chat với nó.
Screenshot 2025-08-06 at 2.36.39 PM.png

Thử hỏi nó phát, nó hiện ra dòng suy nghĩ của nó, rồi sau đó trả lời. Vậy là xong. Để nghỉ nói chuyện với nó, chỉ cần gõ /bye là xong. Tới đây là đã đi được nửa đường rồi. Bước tiếp theo là mình tạo một cái giao diện front end để chat với chatbot cho nó giống ChatGPT nha.
Screenshot-2025-08-06-at-2.37.30 PM.jpg

Open WebUI là một phần mềm mã nguồn mở để làm front end cho chatbot. Mình chạy nó trực tiếp trên máy tính luôn chứ không qua docker, sẽ tiết kiệm được chút tài nguyên nữa, dành nguồn lực máy tính cho model nó suy luận mình xài thay vì phải chạy thêm 1 bước docker nữa.

Mở terminal chạy lệnh cài Open WebUI:

pip install open-webui

Sau khi lệnh trên chạy xong, giờ chúng ta muốn chạy Open WebUI lên chỉ cần gõ vào:

open-webui serve
Screenshot-2025-08-06-at-4.41.27 PM.jpg
Lúc này server Open WebUI sẽ được chạy. Các bạn đợi vài giây (lần đầu sẽ lâu chút do nó cần tải một số thứ khác nữa để build), OpenUI WebUI sẽ chạy ở địa chỉ localhost:8080
Screenshot 2025-08-06 at 4.40.26 PM.png
Bây giờ chỉ cần vào trình duyệt, gõ địa chỉ đó, tạo tài khoản admin / user và sử dụng được hoàn toàn.
Screenshot 2025-08-06 at 4.50.07 PM.png
Tới đây, chúng ta đã vào được giao diện Open WebUI, model mà bạn load về bằng ollama sẽ nằm sẵn ở đó. Bắt đầu xài thôi. Mình chạy trên macbook M1 Max, phản hồi sau khi gõ câu hỏi chỉ khoảng vài giây nên các bạn yên tâm nha.

Xài xong lỡ tắt cửa sổ terminal / cmd, muốn mở lại thì chỉ cần vào gõ lệnh open-webui serve là lại vào localhost:8080 xài được bình thường.

Open WebUI này còn làm nhiều thứ khác lắm. CÁc bạn nghịch tiếp nha. Mình sẽ share thêm ít thông tin nữa trong các bài tới về cấu hình, websearch này nọ cho nó giống ChatGPT bản online luôn nha.

Tin xem thêm

Apple giải thích lý do tăng giá 14 sản phẩm

Chuyên mục UH Plus
26/06/2026 09:48

MXH mygo - Apple giải thích lý do tăng giá 14 sản phẩm kể từ 25/6

Thay đổi lớn từ Google với Play Store

Chuyên mục UH Plus
25/06/2026 11:11

MXH mygo - Google giảm phí Play Store và cho phép các phương thức thanh toán thay thế trên toàn cầu.

Samsung bắt đầu sản xuất tấm nền OLED cho chiếc iPhone màn hình gập đầu tiên

Chuyên mục UH Plus
25/06/2026 10:43

MXH mygo - Công ty đang sản xuất cả tấm nền màn hình bên ngoài lẫn bên trong cho thiết bị có thể là chiếc iPhone Ultra đầu tiên.

Garmin Enduro 4: hé lộ mẫu đồng hồ thông minh mới

Chuyên mục UH Plus
24/06/2026 15:15

MXH mygo - Thời điểm ra mắt Garmin Enduro 4 đang đến gần, khi một mẫu đồng hồ thông minh của Garmin – được cho là Enduro 4 – đã được Ủy ban Truyền thông Liên bang Hoa Kỳ ...

Meta ra mắt mẫu kính thông minh mới, giá rẻ hơn

Chuyên mục UH Plus
24/06/2026 10:40

MXH mygo - Meta ra mắt mẫu kính thông minh mới, giá rẻ hơn dưới thương hiệu riêng của mình.

Chỉ sau 2 tuần, macOS Golden Gate Beta 2 đã có sẵn cho các nhà phát triển

Chuyên mục UH Plus
23/06/2026 10:08

MXH mygo - Apple đã cung cấp cho các nhà phát triển bản beta thứ hai của macOS Golden Gate, bản cập nhật này được phát hành hai tuần sau khi Apple tung ra bản beta đầu ti...

CEO mới của Apple lên kế hoạch cho 'cuộc cải tổ lớn về thiết kế'

Chuyên mục UH Plus
23/06/2026 09:52

MXH mygo - CEO mới John Ternus khẳng định thiết kế ’là cốt lõi trong mọi hoạt động của Apple’, nhưng muốn tạo ’dấu ấn mạnh mẽ’ lên đội ngũ.

Các tính năng AI hữu ích sẽ có mặt trên iPhone trong iOS 27

Chuyên mục UH Plus
22/06/2026 11:10

MXH mygo - Các tính năng AI hữu ích sẽ có mặt trên iPhone trong iOS 27

iPhone Air 2 có thể bị giảm cấu hình phần cứng?

Chuyên mục UH Plus
22/06/2026 10:36

MXH mygo - iPhone Air 2 có thể bị giảm cấu hình phần cứng, nhưng việc giảm cấu hình này có thể sẽ đặt dấu chấm hết cho tương lai sản phẩm