Thứ năm, 10/07/2025 10:24

Công cụ AI tạo video từ văn bản Veo 3 chính thức khả dụng tại Việt Nam

Google vừa chính thức triển khai công cụ tạo video bằng trí tuệ nhân tạo (AI) mang tên Veo 3 tại Việt Nam, thông qua nền tảng Gemini. Đây là một bước tiến quan trọng trong việc phổ cập công nghệ AI sáng tạo nội dung tại khu vực Đông Nam Á, đặc biệt trong bối cảnh nhu cầu sản xuất video ngày càng cao trên các nền tảng mạng xã hội, giáo dục và truyền thông số. 

Google vừa chính thức triển khai công cụ tạo video bằng trí tuệ nhân tạo (AI) mang tên Veo 3 tại Việt Nam (ảnh: Google I/O).

Veo 3 là thế hệ thứ ba của dòng mô hình tạo video từ văn bản do Google DeepMind phát triển. Được giới thiệu lần đầu tại sự kiện Google I/O vào tháng 05/2025, Veo 3 gây chú ý nhờ khả năng tạo ra các đoạn video có chất lượng hình ảnh cao, chuyển động mượt mà, tích hợp đồng bộ giữa hình ảnh, âm thanh và lời thoại. Không giống các phiên bản trước, Veo 3 cho phép tạo video lên đến 8 giây, với khả năng xử lý bối cảnh, ánh sáng, vật lý và hiệu ứng chuyển động một cách tương đối chính xác, gần đạt chất lượng điện ảnh. Một điểm nhấn đáng kể là Veo 3 có thể xử lý cả dữ liệu hình ảnh và văn bản đầu vào, kết hợp với các mô hình ngôn ngữ lớn (LLM) để tạo ra video theo kịch bản có nội dung, có nhân vật, thậm chí phản ánh được cảm xúc hoặc phong cách điện ảnh theo yêu cầu. Công nghệ này mở ra cơ hội lớn trong các lĩnh vực quảng cáo, giáo dục, sản xuất nội dung số và điện ảnh độc lập.

Trước thời điểm Google chính thức mở tính năng tại Việt Nam vào ngày 03/07/2025, nhiều người dùng trong nước đã biết đến Veo 3 qua các đoạn video demo được chia sẻ trên Twitter, Reddit hoặc YouTube. Một số cá nhân và nhóm sáng tạo nội dung đã sử dụng VPN để chuyển vùng tài khoản sang Mỹ, Canada hoặc Singapore để trải nghiệm thử công cụ này, đồng thời phải nhập lệnh bằng tiếng Anh để AI hiểu và xử lý tốt hơn. Điều này tạo ra một thị trường dịch vụ “ngầm”, nơi các nhóm cung cấp dịch vụ tạo video theo yêu cầu bằng Veo 3 với mức giá dao động từ 200.000 đến 800.000 đồng mỗi video, tùy độ phức tạp của nội dung. Tuy nhiên, với việc công cụ chính thức khả dụng tại Việt Nam, người dùng giờ đây có thể dễ dàng truy cập Veo 3 thông qua ứng dụng Gemini nếu đang sử dụng gói trả phí như Gemini Advanced hoặc Gemini Ultra.

Theo thông tin từ Google, tất cả video được tạo ra từ Veo 3 sẽ được gắn watermark và nhúng mã nhận dạng kỹ thuật số SynthID - một công nghệ do DeepMind phát triển nhằm xác định nội dung do AI tạo ra nhưng không ảnh hưởng đến chất lượng hình ảnh. Đây là nỗ lực nhằm đảm bảo tính minh bạch, chống gian lận và ngăn chặn nguy cơ phát tán thông tin giả. Đồng thời, người dùng cũng được cung cấp công cụ để kiểm tra nguồn gốc video và phản hồi về chất lượng thông qua các nút "Thích" hoặc "Không thích" trực tiếp trong ứng dụng. Mô hình Veo 3 hiện đang được huấn luyện trên một tập dữ liệu khổng lồ gồm hàng triệu video và văn bản được cấp phép, đồng thời sử dụng các kỹ thuật học đa phương thức để hiểu mối quan hệ giữa hình ảnh - ngôn ngữ - âm thanh. Google cho biết, họ đặc biệt chú trọng đến yếu tố đạo đức và độ chính xác nội dung, do lo ngại việc công cụ này có thể bị lạm dụng để tạo ra deepfake, thông tin sai lệch hoặc nội dung nhạy cảm mang tính xuyên tạc. Trên thực tế, một số tổ chức truyền thông quốc tế như TIME đã cảnh báo Veo 3 có thể bị sử dụng để tạo video giả về biểu tình, bầu cử hoặc xung đột chính trị nếu không có biện pháp kiểm soát chặt chẽ. Do đó, Google đã tích hợp thêm cơ chế kiểm duyệt, đồng thời phát hành công cụ SynthID Detector giúp xác minh nguồn gốc video được tạo bằng AI.

Sự xuất hiện chính thức của Veo 3 tại thị trường Việt Nam mở ra cơ hội lớn cho các nhà sáng tạo nội dung cá nhân, các agency truyền thông và doanh nghiệp công nghệ. Trong lĩnh vực giáo dục, công cụ này có thể hỗ trợ xây dựng video minh họa bài giảng, thí nghiệm ảo hoặc mô phỏng tình huống chỉ bằng vài dòng mô tả ngắn gọn. Trong lĩnh vực quảng cáo và truyền thông, Veo 3 giúp rút ngắn đáng kể thời gian sản xuất video ý tưởng, hỗ trợ quá trình pitching và thử nghiệm kịch bản nhanh chóng. Các nhóm nghiên cứu văn hóa, lịch sử hoặc bảo tồn di sản số cũng có thể sử dụng công cụ này để tạo hoạt cảnh minh họa từ tư liệu văn bản, hình ảnh tĩnh. Người dùng tại Việt Nam có thể truy cập Veo 3 qua ứng dụng Gemini trên điện thoại hoặc nền tảng web. Ngoài ra, các doanh nghiệp hoặc nhà phát triển có thể tích hợp mô hình này thông qua dịch vụ Google Cloud Vertex AI. Hiện đang có chương trình miễn phí 90 ngày với mức tín dụng $300 cho người mới đăng ký. Theo đánh giá từ các chuyên gia công nghệ, Veo 3 đang là một trong những công cụ AI tạo video tiên tiến nhất hiện nay, vượt trội hơn so với các mô hình như Runway Gen-3 hay Sora của OpenAI ở khả năng tích hợp âm thanh đồng bộ và tạo chuyển động vật thể mượt mà.

Dù vậy, để khai thác hiệu quả Veo 3 tại Việt Nam, vẫn cần sự chuẩn bị kỹ về hạ tầng kỹ thuật, đào tạo kỹ năng viết prompt (lệnh đầu vào), cũng như khung pháp lý rõ ràng về nội dung do AI tạo ra. Với sự phát triển nhanh chóng của công nghệ AI sáng tạo, việc cập nhật, phổ biến kiến thức và nâng cao nhận thức cộng đồng là yếu tố then chốt để đảm bảo AI được sử dụng đúng mục đích và đóng góp tích cực cho đời sống kinh tế - xã hội.

NMK

 

Đánh giá

X
(Di chuột vào ngôi sao để chọn điểm)