Tài liệu hướng dẫn Veo 3 toàn tập + Prompt cho sản phẩm dùng luôn!!!

Tài liệu này sẽ giúp bạn hiểu hơn về mô hình AI tạo video đỉnh nhất thế giới ở thời điểm hiện tại. Từ việc hiểu hơn bạn sẽ tiết kiệm thời gian, công sức và đặc biệt là tiền bạc, khi mà cái giá phải trả cho công cụ là không hề rẻ tý nào.

Ok bắt đầu nha!!

Giới thiệu về Veo 3

Veo 3 là mô hình tạo video mới nhất của Google, mang đến chất lượng hình ảnh được cải thiện đáng kể, khả năng tuân thủ lời nhắc tốt hơn và tính năng đồng tạo

Nội dung yêu cầu trả phí!

Bạn cần có thẻ thành viên trọn đời để có thể bắt đầu xem tài liệu / ebook / video này!

Mua ngay Nếu bạn mua trước đó nhưng không thể truy cập? Hãy nhắn cho tôi!

Giới thiệu về Veo 3

Veo 3 là mô hình tạo video mới nhất của Google, mang đến chất lượng hình ảnh được cải thiện đáng kể, khả năng tuân thủ lời nhắc tốt hơn và tính năng đồng tạo âm thanh.

Các tính năng chính của Veo 3 bao gồm:

Biến văn bản thành Video (Text to Video): Tạo video từ văn bản với khả năng tích hợp cả lời nói và âm thanh môi trường.
Biến khung hình đầu tiên thành Video (Frames to Video: First): Chuyển đổi một khung hình đầu tiên thành video hoàn chỉnh, đi kèm với âm thanh môi trường.

‼️

Lưu ý cực kỳ quan trọng:
Hiện tại, Veo 3 chưa tương thích với các tính năng như:
- Khung hình đầu tiên + khung hình cuối cùng (Frames to Video: First + Last)
- Điều khiển máy ảnh (Camera Control)
- Mở rộng, làm video dài hơn (Extend)
- Khả năng tạo video từ các thành phần (Ingredients to Video)

Do đó khi bạn muốn sử dụng các tính năng này, hệ thống sẽ tự động chuyển bạn trở lại các mô hình Veo 2. Mà video tạo bởi Veo 2 sẽ ko có âm thanh.

Có những cách nào để có thể trải nghiệm Veo 3?

Hiện tại, nếu bạn không phải lập trình viên thì về cơ bản có 2 phương pháp chính để bạn có thể trải nghiệm và tận dụng sức mạnh của Veo 3:

Sử dụng thông qua Gemini: Thông qua giao diện tích hợp của Gemini, bạn có thể tương tác trực tiếp với Veo 3 để tạo video. Gemini đóng vai trò là cầu nối giúp bạn nhập lời nhắc, tinh chỉnh ý tưởng và nhận về các sản phẩm video được tạo bởi Veo 3. Điều này cho phép bạn khai thác khả năng của Veo 3 trong một môi trường trò chuyện và sáng tạo linh hoạt.

Sử dụng thông qua Flow: Flow là công cụ làm phim AI được thiết kế đặc biệt để khai thác tối đa các mô hình tiên tiến của Google DeepMind, bao gồm cả Veo 3, Imagen và Gemini. Flow cung cấp một quy trình làm việc trực quan và mạnh mẽ để tạo ra các clip điện ảnh và kết nối chúng thành những câu chuyện mạch lạc.

Text to Video: Biến đổi ý tưởng văn bản của bạn thành video hoàn chỉnh, bao gồm cả lời nói và âm thanh môi trường tự động được tạo.
First Frame to Video: Bắt đầu từ một khung hình đầu tiên, Veo 3 sẽ tự động mở rộng và tạo ra phần còn lại của video, đồng thời bổ sung âm thanh môi trường phù hợp.

Flow

Google Lab’s AI video generation tool, powered by Google DeepMind’s latest model: Veo 2

💡

Bạn hoàn toàn không phải lo lắng về máy tính có cần phải khỏe hay không? Vì chỉ cần máy tính vào được mạng là bạn có thể làm được video AI rồi nhé!!

Ngoài ra, có một số bạn hỏi là dùng điện thoại có được không? Câu trả lời là được nhưng sẽ phức tạp hơn rất nhiều lần. Bạn cứ xem hướng dẫn dưới đây là sẽ rõ!!

Ai cần tài khoản Flow để dùng tạo video Veo 3 mà chưa tìm được nơi mua thì nhắn mình, mình sẽ chỉ cho vài chỗ.

Nên nhớ mua tài khoản trên mạng luôn có rủi ro, không phải lúc nào cũng được như ý muốn. Anh chị nên cẩn trọng trước khi giao dịch. Kể cả nơi mình giới thiệu.

Nếu anh chị em muốn an toàn nhất thì xem HD đăng ký để trải nghiệm của mình ở đây (nó sẽ ko được nhiều như mua tài khoản Flow):

💡

Liên kết chỉ dành cho anh chị em đã đăng ký buổi học!!

Nếu chưa đăng ký hãy đăng ký ở link này: https://hub.bachdyon.com/dashboard/#/nc/form/4d8c7b9d-6753-480c-886b-54b7cdde2a03

Khi nào nên dùng Gemini và khi nào nên dùng Flow?

Cả Gemini và Flow đều là những "công cụ" chưa hoàn hảo của Google khi đem ra so sánh với ChatGPT và Sora. Lưu ý đây là so sánh của mình khi trải nghiệm sử dụng 2 công cụ chứ không phải 2 mô hình.

Lý do chính có thể thông cảm được cho Google đó là 2 công cụ đều rất mới và họ có thể cải thiện dần điều đó theo thời gian. Tuy nhiên nếu bạn muốn dùng Veo 3 - mô hình độc quyền cho đến thời điểm hiện tại của Google thì đây là một số lưu ý:

Flow không hỗ trợ tiếng Việt, bạn phải đổi sang tiếng Anh, Gemini thì hỗ trợ cả 2 ngôn ngữ.
Vì Flow chỉ hỗ trợ tiếng Anh nên nếu prompt của bạn là những đoạn hội thoại 2 người + có trao đổi bằng tiếng Việt thì sẽ bị Flow từ chối. Nếu bạn cần những đoạn dài hơi như vậy thì nên dùng Gemini.

💡

Hoặc thử giải pháp khác đó là viết prompt bằng tiếng Anh, đảm bảo tỷ trọng từ tiếng Anh lên khoảng 90%, chỉ 10% là từ tiếng Việt.

Gemini ở bản Google AI PRO sẽ chỉ được tạo khoảng 8-10 video trong 24h, nếu bạn tạo chạm đến ngưỡng này thì nó sẽ dừng việc trải nghiệm lại trong 12 - 24h kế tiếp.
Khi dùng Gemini hoặc Flow sẽ có tỷ lệ nhất định bị lỗi, cách duy nhất là kiểm tra prompt và thử lại.
- 1-2% video bị lỗi chân tay, cử chỉ.
- 5% khi quá tải nó sẽ tự động chuyển về Veo 2.
- 10% bạn đang dùng Veo 3 nhưng không ra tiếng, thực tế do website bị lỗi, bạn cần tải lại trang và bấm nghe lại, hoặc thử tải video về máy để nghe xem có âm thanh hay không.
- 10% chúng ta chọn tính năng không tương thích với Veo 3, nó sẽ tự nhảy về Veo 3. Xem bảng tính năng ko tương thích và lưu ý ở đầu bài viết.
- 40% mặc dù chúng ta đã đề cập lời nói tiếng Việt hoặc lời thoại tiếng Việt... nhưng Gemini và Flow vẫn trả kết quả nhân vật nói tiếng Anh. Có thể đây là một tính năng của Google để chặn người dùng bên ngoài Hoa Kỳ sử dụng mô hình của họ trong giai đoạn thử nghiệm (giả thiết của mình).
  
  Có 2 giải pháp tạm thời:
  - 1 là thử lại với prompt khác, thử thay thế từ ngữ xem kết quả có thay đổi hay không.
  - 2 là thử chuyển prompt sang tiếng Anh, giữ nguyên nội dung lời thoại bằng tiếng Việt.

💡

Một số trường hợp từ chối tạo video:
- Dùng Prompt hoàn toàn là tiếng Việt trên Flow.
- Mô tả cảnh bạo lực máu me, dạy dỗ con cái không đúng quy chuẩn.
- Mô tả cảnh 18+, sex...

Các tính năng khác nhau trong Flow, nên được dùng thế nào cho chuẩn?

Đây là bảng tương thích và không tương thích của các tính năng, bạn sẽ cần ghi nhớ nó để sau này đỡ bị nhầm và không được đúng như kỳ vọng:

Khả năng	Fast (Veo 2)	Quality (Veo 2)	Highest Quality (Veo 3)
Text to Video - Từ văn bản sang video	✅	✅	✅ (w/ SFX, Speech)
Frames to Video: First - Tạo video từ các khung hình: Khung hình đầu tiên	✅	✅	✅ (w/ SFX)
Frames to Video: First + Last - Tạo video từ các khung hình: Khung hình đầu tiên + Khung hình cuối cùng	✅	❌	❌
Camera Control* - Điều khiển camera	✅	❌	❌
Extend - Kéo dài video	✅	❌	❌
Jump To - Chuyển đến một cảnh mới	✅**	✅	✅
Ingredients to Video - Tạo video từ các thành phần	❌	✅	❌

Ok. Bây giờ đi vào mục chính đó là 3 tính năng mà nhiều người hay sử dụng nhất.

Từ văn bản sang video tương thích với Veo 3, bạn có thể dùng nó đa mục đích, có thể tạo giọng nói và hiệu ứng cùng lúc, nhưng nó sẽ không thể cố định nhân vật cho bạn.
Tạo video từ các khung hình chỉ có thể sử dụng First Frame (ảnh đầu tiên) với Veo 3, nó sẽ không có giọng nói và chỉ có sound Effect. Thông thường bạn nên dùng nó để tạo các cảnh quay không có lời thoại, ví dụ như mẫu thời trang, mẫu thiết kế nhà ở..... nói chung là không cần có giọng nói trong đó.
Tạo video từ các thành phần chỉ tương thích với Veo 2 Quality, không tương thích với Veo 3 nên kết quả tạo ra sẽ câm như hến (chẳng có âm thanh gì cả). Nhưng đổi lại bạn có thể thả ảnh của các nhân vật, ảnh bối cảnh, ảnh đồ vật và nó sẽ tạo cảnh quay có tất cả những thứ đó theo mô tả của bạn -> thích hợp để làm video đồng nhất nhân vật.

Một số prompt mẫu cho bạn tham khảo