Anh em cùng xem nhé: Tổng hợp các thuật ngữ AI thường gặp

27/05/2025 21:53
Tổng hợp các thuật ngữ AI thường gặp

Agent là gì, khác Agentic chỗ nào, rồi AI với Chatbot AI khác biệt ra sao? Training dataset là cái gì mà người ta hay nhắc tới cùng với LLM, rồi đã có model xong lại còn có multimodal là sao,…. Là những câu hỏi mà mình hay gặp các bạn đặt ra khi vô tình đọc ở đâu đó trong các nội dung nói về AI, về mô hình ngôn ngữ lớn, machine learning,… Trong bài viết này, mình xin tổng hợp lại các thuật ngữ AI một cách đơn giản và ngắn gọn nhất cho bạn nào lỡ quên có thể theo dõi ha.


Agents: hệ thống AI có thể tự động hoàn thành các tác vụ theo ý muốn của người dùng.


Agentic: một bước tiến xa hơn của agent. Nó sẽ là một tập hợp những agent để tự động thích nghi, biết sử dụng công cụ,… tự nói chuyện với nhau để thực hiện nhiều nhiệm vụ một cách linh hoạt.


AR - Augmented Reality: hình ảnh do máy tính tạo ra "nằm trên" hình ảnh của thế giới ngoài đời thật.


AlphaQubit: một bộ decoder (giải mã) có khả năng nhận diện chính xác lỗi tính toán lượng tử.


Alignment - Định hướng: Một quy trình xây dựng các model AI bằng cách mã hóa các giá trị và đạo đức của con người.


Chatbot: Phần mềm được thiết kế để mô phỏng một cuộc hội thoại online. Thí dụ ChatGPT, Gemini Chatbot,…


Computer Vision: một nhánh AI cho phép máy tính "nhìn" và hiểu hình ảnh, video.


Datasets (hoặc training sets): Một lượng lớn dữ liệu đầu vào (có thể là văn bản, hình ảnh, video, số liệu) đưa vào trong model AI.


Deep Learning: Một cách tiếp cận của Machine Learning, sử dụng cấu trúc mô phỏng lại hoạt động của mạng nơ ron thần kinh trong não người để giải quyết vấn đề.


Distillation - chưng cất: Tạo ra một phiên bản nhỏ hơn của một LLM có sẵn, model này sẽ có ít tham số hơn nên sẽ giúp sinh ra câu trả lời nhanh hơn.


Encoder: Một hệ thống machine learning biến đổi dữ liệu đầu vào.


Feedback loop: Một trạng thái mà khi đó, những dự đoán của model gây ảnh hưởng lên tập dữ liệu huấn luyện ở model đó hoặc một model khác.


Foundation Model: các model AI tạo sinh được huấn luyện trên lượng cực lớn dữ liệu "nền tảng" để dạy chúng các đặc điểm và tính chất ẩn chứa trong dữ liệu đó.


Generative Adversarial Network (GAN): Một hệ thống với 2 thành phần A và B, A sẽ tạo ra dữ liệu giả để cố gắng đánh lừa B tưởng dữ liệu đó là thật. Thông qua kiểu huấn luyện liên tục như thế này, A sẽ cải thiện khả năng tạo ra dữ liệu giống thật, trong khi B sẽ được tăng cường khả năng đánh giá.


Generative AI - AI tạo sinh: Một dạng Ai sử dụng các model foundation để tạo ra những nội dung mới như văn bản, hình ảnh, âm thanh hoặc video. Bằng cách học tập đặc điểm và tính chất ẩn chứa bên dưới tập dữ liệu huấn luyện, model sẽ tạo ra các đầu ra bằng cách lắp ghép những gì nó đã học được từ dữ liệu huấn luyện.


GPT (Generative Pre-trained Transformer): Một nhóm mô hình ngôn ngữ lớn được phát triển bởi OpenAI. Nhóm này là các model decoder.


Hallucianation - ảo giác AI: Những dữ liệu, thông tin do GenAI tạo ra trông rất hợp lý nhưng không có thật.


Integration: Quá trình tích hợp công nghệ và các tính năng AI vào những hệ thống, ứng dụng hoặc workflow sẵn có để tăng cường khả năng, hiệu quả và quá trình ra quyết định.


JAX: một ngôn ngữ cho phép bạn viết code tính toán số học (giống NumPy) nhưng nó sẽ tự động biến code đó thành phiên bản siêu nhanh, có khả năng tính đạo hàm và chạy hiệu quả trên các phần cứng mạnh mẽ như GPU/TPU.


Keras: một thư viện mã nguồn mở thuộc framework phát triển các model machine learning viết bằng Python bởi Google và được tích hợp vào trong TensorFlow.


Large Language Model (LLM): một dạng AI, giống như GPT hay Gemini, được huấn luyện dựa trên hàng tỷ văn bản và nhiều nội dung khác để được dùng nhằm xử lý các tác vụ.


Machine Learning: Một chương trình hoặc hệ thống huấn luyện một model từ dữ liệu đầu vào. Các model đã huấn luyện có thể tạo ra những dự đoán từ những dữ liệu lấy từ nguồn tương tự như dữ liệu huấn luyện, nhưng các dữ liệu này model chưa từng thấy.


Multimodal - đa phương thức hoặc đa kiểu dữ liệu: các hệ thống có khả năng hiểu và xử lý thông tin từ nhiều loại dữ liệu khác nhau ( cả văn bản, hình ảnh, video, âm thanh,… ) cùng một lúc, giống như cách con người cảm nhận thế giới.


Neural network: một hệ thống machine learning được thiết kế bằng cách mô phỏng một cách dơn giản hóa não người, sử dụng nhiều lớp chứa các node liên kết đan xen nhau.


Offline inference - suy luận local: Một chuỗi những dự đoán có thể được cache lại để truy cập mà không cần mạng.


Personalisatuon: biến đổi các câu trả lời hay dự đoán của AI duwajwj vào dữ liệu và thói quen sử dụng của người dùng.


prOmpt: Một câu hỏi hoặc câu lệnh đưa vào cho LLM để kích hoạt quá trình tạo ra phản hồi.


RAG - Retrieval augmented generation: Một kỹ thuật giúp cải thiện độ chính xác của các phản hồi của LLM bằng cách cung cấp thêm cho các LLM đã dược huấn luyện các thông tin trích xuất từ những nguồn, văn bản tin cậy đã kiểm chứng bởi con người.


Tokens: Để Ai xử lý văn bản, nó phải bẻ văn bản nhỏ ra thành những đơn vị gọi là token.


Tensor Processing Unit: các nhân xử lý được thiết kế để chạy các workload machine learning.


Transformer: một kiến trúc manjhg nơ ron để xử lý dữ liệu tuần tự bằng cách hiểu ngữ cảnh của nó. Đây là kiến trúc được các nhà nghiên cứu Google giới thiệu hồi năm 2017 và chính là một trong những cội nguồn quan trọng nhất của GenAI mà chúng ta biết bây giờ.


Unsupervised machine learning - học không giám sát: một model được thiết kế để tìm ra đặc tính của một tập dữ liệu không được gắn nhãn trước.


XLA: một trình biên dịch machine learning mã nguồn mở, còn được gọi là Accelerarated Linear Algebra - Tăng tốc đại số tuyến tính, được thiết kế để tối ưu hóa các model AI.


Zero-shot learning: trạng thái các model suy luận ra một dự đoán để hoàn thành một tác vụ mà nó chưa được huấn luyện trước đó.


Tin xem thêm

Siêu máy tính dự đoán bảng xếp hạng Premier League: Vị trí gây sốc của MU

Chuyên mục UH Vip
29/10/2025 07:58

Siêu máy tính dự đoán bảng xếp hạng Premier League cuối cùng khi Arsenal dễ dàng giành chức vô địch và Manchester United biết số phận của mình.

Xiaomi bắt đầu triển khai cập nhật Xiaomi HyperOS 3, anh em triển nha

Chuyên mục UH Vip
28/10/2025 10:05

Xiaomi bắt đầu triển khai cập nhật Xiaomi HyperOS 3

FIFA quan tâm đặc biệt đến bóng đá Việt Nam

Chuyên mục UH Vip
28/10/2025 10:02

Thủ tướng Chính phủ Phạm Minh Chính có cuộc gặp gỡ và làm việc với Chủ tịch FIFA Gianni Infantino tại Hội nghị Cấp cao ASEAN tại Malaysia, đánh dấu một bước phát triển mớ...

Nếu anh em yêu thích sự thực dụng của Steve Jobs, hãy sử dụng New Balance

Chuyên mục UH Vip
27/10/2025 15:22

Nếu anh em yêu thích sự thực dụng của Steve Jobs, hãy sử dụng New Balance

Cựu Chánh án tòa tối cao điều tra 7 cầu thủ nhập tịch Malaysia

Chuyên mục UH Vip
27/10/2025 15:19

Liên đoàn bóng đá Malaysia (FAM) vừa bổ nhiệm cựu Chánh án tòa án tối cao, Tun Md Raus Sharif, làm Chủ tịch Ủy ban điều tra độc lập nhằm xem xét vụ bê bối liên quan đến h...

LIFEHACKR Ultra Bottle: Bình nước thông minh 4in1, nhưng đắt quá anh em ạ..

Chuyên mục UH Vip
26/10/2025 10:47

LIFEHACKR Ultra Bottle: Bình nước thông minh 4in1, tự làm sạch bằng UV-C và ngăn chứa thuốc

Liverpool thua sốc, MU vào Top 4 Premier League

Chuyên mục UH Vip
26/10/2025 10:44

Thi đấu thăng hoa, MU giành chiến thắng 4-2 trước Brighton trên sân nhà Old Trafford ở vòng 9 Premier League. Với việc Liverpool thua sốc, MU tạm thời chen chân vào Top 4...

Anh em Coin thủ bung lụa nha: Tổng thống Trump ân xá cho Changpeng Zhao

Chuyên mục UH Vip
25/10/2025 09:05

Tổng thống Trump ân xá cho nhà sáng lập Binance, Changpeng Zhao

Đội bét bảng Serie A gây bất ngờ lớn

Chuyên mục UH Vip
25/10/2025 09:01

Trong trận đấu đầy kịch tính tại vòng 8 của Serie A, Pisa đã xuất sắc cầm hòa AC Milan với tỷ số 2-2 ngay trên sân San Siro.