Tình cờ mình thấy một số clip trên mạng share video kêu người xem check xem cái nào là AI, cái nào là thật. Đó là những video có người đứng nói bình thường, tuy nhiên có các vật thể chuyển động ngay trong khung hình luôn nhưng lại là do AI tạo ra. Thắc mắc là tại sao làm ra được video giống như vậy. Mình vọc thử thì ra video kết quả bên dưới. Nhân tiện chia sẻ cho bạn nào muốn nghịch thử cách làm luôn nha.
Đầu tiên mời các bạn coi một số cảnh mình làm được.
Một video gốc của bạn này nữa
Thực chất cách làm không khó, hiện tại đã có sẵn đầy đủ các công cụ miễn phí mà bạn có thể làm được giống vậy. Công cụ ở đây mình xài là:- Photoshop: Dùng để generative ra các vật thể AI muốn bỏ thêm vào trong khung hình.
- Google Flow: sử dụng model tạo video Veo2 để làm cho các vật thể đó chuyển động,
- Công cụ dựng phim: ở đây mình xài Davinci nhưng Premiere hay Capcut thì cũng làm được tương tự nha.
Đầu tiên, mình sẽ quay một đoạn video gốc. Mình định hình trước là vật thể AI sẽ nằm ở vị trí nào trong khung hình, chừa chỗ đó ra. Mình sẽ cố gắng đứng và không di chuyển nhiều để dễ mask khi dựng video. Ý tưởng là sẽ ghép con ngựa vào để giống như đang cưỡi nó. Các bạn để ý thì mình sẽ chọn tư thế ngồi giống như đang cưỡi con ngựa vậy.
![[IMG]](https://photo2.tinhte.vn/data/attachment-files/2025/08/8817648_Screenshot-2025-08-22-192220.jpg)
Sau khi có video gốc, thí dụ ở đây mình đang ngồi trên một con đồ chơi. Mình sẽ bỏ nó vào ứng dụng tạo video, cắt dầu cắt đuôi cho chuẩn sẵn. Sau đó mình chọn frame hình đầu tiên, xuất ra 1 file hình tĩnh (các bạn screenshot cũng được luôn) tạm đặt tên nó là Still1. Tiếp theo mình play tới khoảng 4-5 giây, tới đúng chỗ mà mình quyết định "tiết lộ" cái đó là AI, mình tiếp tục xuất ra một frame hình hiện tại nữa, đặt tên là still2.

Bây giờ mình bỏ 2 file hình still1 và still2 vào Photoshop. Sử dụng lasso tools để khoanh vùng khu vực muốn tạo vật thể AI vào. Ở đây mình sẽ chọn toàn bộ vùng con thú đồ chơi để che đi luôn. Sau đó bấm Generate Fill và gõ đơn giản là A horse. Chọn cái ưng ý, che hết đi các phần lộ ra chỗ ngồi gốc của mình (chỗ này nếu còn lộ, các bạn có thể zoom layer con ngựa mới tạo lên, xóa các phần rìa xung quanh con ngựa là xong)

Tiếp theo mình sẽ bấm Cmd/Ctrl+J để duplicate layer con ngựa ra, kéo đè nó lên layer Still2. Bây giờ mình sẽ chỉnh vị trí layer con ngựa sao cho thay đổi chút, thí dụ như dịch chuyển lên chút, nghiêng đầu xíu qua trái. Tới đây, mình sẽ tạm tắt 2 layer still2 và con ngựa still2 ra, export ra bức ảnh đầu tiên là đang cưỡi ngựa cảnh 1. Tương tự vậy bật 2 layer vừa tắt lên và export ra tiếp ảnh đang cưỡi ngựa cảnh 2 như bên trên.
Bây giờ mình chuyển sang công cụ Google Flow (bạn nào lỡ quên thì link nó ở Labs.google/fx/vi/tools) Mình sẽ chọn tạo một video mới, bạn nào chưa quen có thể coi lại cách tạo video với Flow ở bài bài viết bên dưới thêm ha.
Hướng dẫn tạo video bằng AI Google Veo: phân biệt các tài khoản, prOmpt tạo video, các lưu ý
Google đã chính thức cho người dùng xài thử Veo 3 - model tạo video có cả hình ảnh lẫn âm thanh thoại với chất lượng đầu ra rất cao, độ phân giải lên tới 1080, độ dài tùy ý, các cảnh quay không chỉ ít lỗi mà còn rất tự nhiên, đồng bộ thoại với...

Bây giờ ở khung nhập prOmpt, mình sẽ nhập prOmpt như bên dưới, chọn model Veo2 Fast (hiện mới có model này mới cho tạo ảnh từ 2 hình đầu và cuối). Tiếp theo mình upload ảnh cảnh cưỡi ngựa cảnh 1 và cảnh 2 đã tạo bên dưới lên.

Nhấn tạo, đợi cỡ 2 phút là xong. Mình đã có video đang cưỡi ngựa.

Bây giờ mình mang video vừa tạo bởi Flow bỏ vào trong ứng dụng dựng video, cho nó đè lên video gốc, sau đó cắt ngắn video lại cho vừa với frame đầu và frame cuối hồi bước 2 đã chụp lại. Ở đây sẽ tùy tình huống mà bạn chọn cách phù hợp để tách con ngựa ra. Có nhiều cách cắt để tạo mask, nếu đơn giản như video hồ nước thì chỉ cần mask chọn cái vùng hồ nước, xóa phần bên trên là xong.
Tình huống con ngựa này thì nó quay đầu lung tung hết nên mình sẽ dùng Magic Mask của Davinci để track chuyển động con ngựa và mask. Kết quả cuối cùng, mặt mình vẫn nói chuyện, con ngựa thì chuyển động, cho cảm giác giống như là đang cưỡi ngựa được vài giây ha. Ở cuối cảnh AI, mình chỉ cần cho một hiệu ứng transistion vào để nó tiêu biến đi, lộ ra video thật là xong.
Tới đây thì coi như là đã hoàn tất toàn bộ cách làm. Lúc này tùy vào ý tưởng của các bạn mà video nó sẽ đơn giản hay phức tạp. Nếu phức tạp, các bạn chỉ cần chọn vùng khi tạo ảnh bằng Photoshop AI kỹ xíu, rồi mask kỹ xíu khi dựng video là xong. Bạn nào làm thử nhớ up video lên khoe với các bạn khác nha.
Các prOmpt mình dùng trong bài này để kêu Flow tạo video. Bản chất là đừng có cho Veo nó cho người mình chuyển động nhiều quá là ổn.
A static, unmoving shot. Locked off camera. No movement. No frame motion. The man slowly go ahead. The bond have natural movement and motion of water surface. No unnatural actions. No severe motion. No lighting changes. No speed up time.
A static, unmoving shot. Locked off camera. No movement. No frame motion. The man standing still and talking. The dog walking slowly from lower right of the frame to the left mid side. No unnatural actions. No severe motion. No lighting changes. No speed up time.
A static, unmoving shot. Locked off camera. No movement. No frame motion. The woman sits on the horse and speaks into her microphone. The horse stands relatively still while staying in the same position. Natural movement and motion. No unnatural actions. No severe motion. No lighting changes. No sped up time.