Hướng dẫn anh chị em sử dụng model ChatGPT miễn phí ngay trên máy tính mac/win

07/08/2025 08:26
Hướng dẫn sử dụng model ChatGPT miễn phí ngay trên máy tính mac/win của bạn
Sau nhiều năm cố gắng bắt chúng ta nộp tiền thì cuối cùng OpenAI hôm nay cũng đã chịu mở mã nguồn một trong các model của họ để chúng ta tự tải về, tự host và tự xài mà không cần lên online. Hôm nay họ chính thức phát hành model GPT-OSS 120 tỷ và 20 tỷ tham số, sử dụng công nghệ MoE (mix of expert) chứa nhiều ông chuyên gia trong đó tự suy luận, để chúng ta tự tải về vận hành dưới máy. Có rất nhiều cách để tự host model này, bên dưới đây mình sẽ chia sẻ một cách dễ nhất để mọi người host nó nhé.

Như chúng ta đã biết thì xưa giờ OpenAI họ theo đuối chiến lược đóng, nghĩa là giữ kín mã nguồn và model dù hồi mới thành lập, họ với Elon Musk đặt mục tiêu là thúc đẩy tạo ra mã nguồn mở AI cho mọi người. Tới hiện tại thì trong những bên lớn thì còn mỗi họ với Claude là vẫn đóng mã nguồn. Tuy nhiên khoảng 1 năm trở lại đây, các model mã nguồn mở đã ngày càng trở nên mạnh mẽ hơn bao giờ hết, điển hình là DeepSeek của TQ chấn động hồi đầu năm. Từ đó đến nay, không chỉ model TQ như DeepSeek, Qwen mà cả model phương tây như Llama của Meta, Mistral rồi cả Gemma của Google cũng trở thành những model mã nguồn mở ngày càng mạnh. Và mãi đến ngày hôm nay, OpenAI mới lần đầu tiên trong lịch sử công ty phát hành model mã nguồn mở của họ.

Cụ thể thì 2 model reasoning mà OpenAI hôm nay phát hành là GTP-OSS-120B, 120 tỷ tham số, cần GPU rất mạnh để vận hành và model GPT-OSS-20b, 20 tỷ tham số. Cái 20 tỷ mới là cái chúng ta cần quan tâm bởi nó chạy được trên GPU hay laptop phổ thông, chỉ cần 16GB RAM là chạy được. 2 model này đều phát hành dưới dạng giấy phép Apache 2.0, nghĩa là cho chúng ta tự tải về, triển khai, fine tune và dĩ nhiên là tự kiểm soát dữ liệu, triển khai thương mại mà không bị ràng buộc như Llama của Meta.

Một khi tự host một model, thí dụ như GPT-OSS, chúng ta sẽ đảm bảo mọi data đưa cho model đều được kiểm soát, tuyệt đối riêng tư, không sợ data đi đâu mà chúng ta không biết (thuyết âm mưu là được dùng để train cho model online). Đồng thời chúng ta sẽ xài ChatGPT mà không tốn tiền API hay nộp tiền cho OpenAI. OpenAI hôm nay còn phát hành cả bộ tokenizer gần như là hiệu quả nhất thị trường. Nôm na cho bạn nào lỡ quên thì đây là kỹ thuật bẻ chữ ra thành các đoạn nhỏ hơn và đưa vào model để train / truy vấn. Do tokenizer của OpenAI được phát triển dựa trên ký tự latin nên tiếng Việt của chúng ta chắc chắn được hỗ trợ hiệu quả, không cần phải đi finetune lại bằng tập data tiếng Việt nữa. Cái này thì đi xa quá rồi, nào có dịp mình sẽ share với mọi người về câu chuyện fine tune này nọ nha.



Có rất nhiều cách khác nhau để tự host một model, thí dụ như tự host trên máy tính bằng LMStudio, xài Ollama, tự host riêng,.... Trong bài này, mình sẽ hướng dẫn mọi người cách dùng Ollama làm back end - bộ não, và xài OpenUI làm front end - giao diện để mọi người chạy thử. Tại sao mình chọn cách này? Vì nó không quá phức tạp, bạn chỉ cần cài đúng vài cái trước để tạo môi trường trên máy cho nó chạy và sau đó là có thể xài ChatGPT gần như là trên bản online. Đồng thời cách này có thể áp dụng để bạn không chỉ nghịch với OpenAI mà còn bất cứ model mã nguồn mở nào mà bạn thích.

Về yeu cầu phần cứng, để chạy GPT-OSS 20 tỷ tham số, máy tính của bạn cần phải có phần cứng tối thiểu là:
  • RAM: từ 16GB trở lên
  • GPU: đề nghị có Nvidia hoặc AMD, CPU chạy cũng được mà nó chậm
  • Dung lượng ổ cứng: trên 20GB
  • OS: macOS 11+, Windows hoặc Ubuntu đều được.

Rồi giờ bắt tay vô cài. Mình đang viết hướng dẫn này bằng mac nên hình chụp cũng bằng mac, tuy nhiên cài Windows thì gần như tương tự hết nha.

Đầu tiên là những thứ cần cài trước:
  • Cài Python 3.11.x: đừng cài bản mới là 3.12 vì có thể chưa tương thích tốt. Cứ cài bản 3.11.x. Trong quá trình cài, mọi người nhớ chọn tick vào "Add to path" nha. Cái này rất quan trọng, vô số lỗi sinh ra khi mấy bạn nghịch AI có nguồn gốc từ cái này.
  • Cài node.js. Cái này dùng để build giao diện front end cho Open WebUI nó chạy. Các bạn cứ vào trang chủ tại đây, tải về và cài vào máy bình thường.
  • Cài git. Tương tự các bạn vào trang chủ Git tại đây, tải bộ cài về và next hết mọi thứ là xong. Cái này dùng để clone mã nguồn của Open WebUI về máy mình

Rồi, cài hết mấy thứ đó vậy là xong môi trường rồi đó. Bây giờ sẽ có 2 bước chính là vô ollama kéo model Open-OSS về, xong chạy Open WebUI lên xài.

Thực ra nó đơn giản lắm. Các bạn vào trang web của Ollama tại đây, tải bộ cài về và cài như phần mềm thông thường. Cài xong thì thử mở terminal / cmd lên chạy lệnh: ollama --version, nếu nó trả về phiên bản bao nhiêu là cài thành công rồi đó. Sau khi cài, các bạn sẽ thấy biểu tượng hình con heo trắng của ollama nó chạy ở chỗ taskbar. Lúc này là ollama nó đang chạy ở địa chỉ localhost:11434 rồi đó. Các bạn vào trình duyệt bất kỳ, gõ địa chỉ này vào sẽ thấy nó hiện ollama is running.

Bây giờ chúng ta sẽ dùng ollama để kéo model GPT-OSS 20b về. Các bạn vào terminal / cmd và gõ lệnh:

QUẢNG CÁO


ollama pull gpt-oss:20b

Nó sẽ chạy như thế này để kéo model về máy các bạn. Tổng có cỡ 13G.
[​IMG]

Sau khi nó chạy xong, các bạn có thể thử tương tác với model ngay trong command line luôn. Chỉ cần gõ:

Ollama run gpt-oss:20b

Nó sẽ hiện ra như bên dưới, kêu mình Send a message để chat với nó.
Screenshot 2025-08-06 at 2.36.39 PM.png

Thử hỏi nó phát, nó hiện ra dòng suy nghĩ của nó, rồi sau đó trả lời. Vậy là xong. Để nghỉ nói chuyện với nó, chỉ cần gõ /bye là xong. Tới đây là đã đi được nửa đường rồi. Bước tiếp theo là mình tạo một cái giao diện front end để chat với chatbot cho nó giống ChatGPT nha.
Screenshot-2025-08-06-at-2.37.30 PM.jpg

Open WebUI là một phần mềm mã nguồn mở để làm front end cho chatbot. Mình chạy nó trực tiếp trên máy tính luôn chứ không qua docker, sẽ tiết kiệm được chút tài nguyên nữa, dành nguồn lực máy tính cho model nó suy luận mình xài thay vì phải chạy thêm 1 bước docker nữa.

Mở terminal chạy lệnh cài Open WebUI:

pip install open-webui

Sau khi lệnh trên chạy xong, giờ chúng ta muốn chạy Open WebUI lên chỉ cần gõ vào:

open-webui serve
Screenshot-2025-08-06-at-4.41.27 PM.jpg
Lúc này server Open WebUI sẽ được chạy. Các bạn đợi vài giây (lần đầu sẽ lâu chút do nó cần tải một số thứ khác nữa để build), OpenUI WebUI sẽ chạy ở địa chỉ localhost:8080
Screenshot 2025-08-06 at 4.40.26 PM.png
Bây giờ chỉ cần vào trình duyệt, gõ địa chỉ đó, tạo tài khoản admin / user và sử dụng được hoàn toàn.
Screenshot 2025-08-06 at 4.50.07 PM.png
Tới đây, chúng ta đã vào được giao diện Open WebUI, model mà bạn load về bằng ollama sẽ nằm sẵn ở đó. Bắt đầu xài thôi. Mình chạy trên macbook M1 Max, phản hồi sau khi gõ câu hỏi chỉ khoảng vài giây nên các bạn yên tâm nha.

Xài xong lỡ tắt cửa sổ terminal / cmd, muốn mở lại thì chỉ cần vào gõ lệnh open-webui serve là lại vào localhost:8080 xài được bình thường.

Open WebUI này còn làm nhiều thứ khác lắm. CÁc bạn nghịch tiếp nha. Mình sẽ share thêm ít thông tin nữa trong các bài tới về cấu hình, websearch này nọ cho nó giống ChatGPT bản online luôn nha.

Tin xem thêm

Anh em choáng chưa? Google Pixel 10 sẽ có tính năng chỉnh sửa ảnh bằng cách nhập prOmpt

Chuyên mục UH Plus
07/08/2025 08:23

Google Pixel 10 sẽ có tính năng chỉnh sửa ảnh bằng cách nhập prompt

Nhiều nước ghi nhận mức nhiệt cao chưa từng thấy trong lịch sử: Vòng lặp nguy hiểm

Chuyên mục UH Plus
07/08/2025 08:20

Những ngày đầu tháng 8 này, nhiều nước trên thế giới từ châu Âu, châu Á đến Trung Đông một lần nữa ghi nhận mức nhiệt cao chưa từng thấy trong lịch sử.

Bài Trên tay: Thiết bị massage cầm tay Theragun Mini gen 2: Nhỏ gọn hơn - Tiện lợi hơn

Chuyên mục UH Plus
06/08/2025 09:34

Trên tay Thiết bị massage cầm tay Theragun Mini gen 2: Nhỏ gọn hơn - Tiện lợi hơn

Apple phát hành iOS 26 beta 5 và đây là những điểm mới

Chuyên mục UH Plus
06/08/2025 09:27

Apple phát hành iOS 26 beta 5 và đây là những điểm mới

Dự báo giá xăng RON 95-III tăng vượt ngưỡng 20.000 đồng/lít

Chuyên mục UH Plus
06/08/2025 09:13

Tại kỳ điều hành ngày 7-8, giá xăng bán lẻ có thể tăng đến 3% so với kỳ điều hành trước đó nếu liên bộ Tài chính - Công Thương không trích lập, hay chi sử dụng Quỹ bình ổ...

Chia sẻ trải nghiêm: Trên tay DJI Osmo 360: đơn giản là DJI làm tốt hơn

Chuyên mục UH Plus
05/08/2025 08:42

Trên tay DJI Osmo 360: đơn giản là DJI làm tốt hơn

Đang có livestream thử gập mở Z Fold 7 200 ngàn lần: đã được nửa đường

Chuyên mục UH Plus
05/08/2025 08:38

Đang có livestream thử gập mở Z Fold 7 200 ngàn lần: đã được nửa đường

'Vòm nhiệt' là gì và vì sao nó khiến nắng nóng khắc nghiệt hơn?

Chuyên mục UH Plus
05/08/2025 08:23

Hiện tượng “vòm nhiệt” khiến khí nóng bị mắc kẹt và ngày càng dữ dội. Từ Tây Ban Nha đến Hà Lan, nền nhiệt vượt ngưỡng 40°C và nguy cơ cháy rừng tăng vọt.

Trải nghiệm cá nhân: Đo Điểm Hiệu Năng: Samsung Galaxy Z Fold7

Chuyên mục UH Plus
04/08/2025 08:52

Đo Điểm Hiệu Năng: Samsung Galaxy Z Fold7