Google Veo 3 tạo cơn sốt với khả năng tạo video AI chân thực
Tại một quán cà phê nhỏ ở TP HCM, Hoàng Bảo, một nhà sáng tạo nội dung, đang ngồi trước chiếc máy tính của mình, chăm chú vào màn hình. Anh vừa hoàn thành một đoạn video ngắn hoàn toàn bằng AI, không cần xuất hiện trong video, không cần ghi âm gì, chỉ cần một vài câu lệnh đơn giản. “Veo 3 đang giúp tôi tạo những đoạn phim mà trước đây có nằm mơ cũng không nghĩ tới được,” anh chia sẻ.

Với những tiến bộ vượt bậc trong công nghệ, Google Veo 3 đã và đang tạo nên một “cơn sốt” toàn cầu. Công cụ này không chỉ tạo ra video từ các câu lệnh (prompt) mà còn kết hợp âm thanh vào các đoạn phim, tạo ra một trải nghiệm gần như giống thật, điều mà trước đây rất ít công cụ AI có thể làm được. Google công bố Veo 3 tại Google I/O 2025 vào cuối tháng 5, và chỉ sau vài ngày, công cụ này đã nhận được sự quan tâm mạnh mẽ từ cộng đồng sáng tạo trên toàn thế giới, từ Việt Nam đến Mỹ, và nhanh chóng lan tỏa trên các nền tảng xã hội.
Tạo video dễ dàng và nhanh chóng
Với Veo 3, người dùng có thể tạo video dài 8 giây chỉ với vài câu lệnh, kết hợp với hình ảnh, âm thanh và video để tạo ra một sản phẩm hoàn chỉnh. Điều đặc biệt ở Veo 3 là khả năng kết hợp âm thanh sống động, từ lời thoại nhân vật đến âm thanh động vật, khiến các video trở nên sinh động và tự nhiên hơn rất nhiều so với các công cụ trước đây chỉ cho phép tạo video với nhạc nền.
Hoàng Bảo cho biết anh đã sử dụng Veo 3 để tạo nhiều video ngắn bằng câu lệnh đơn giản, nhanh chóng ghép lại thành những đoạn phim hoàn chỉnh theo kịch bản đã định. “Khẩu hình miệng tiếng Việt gần như khớp hoàn toàn với nhân vật, điều mà các công cụ trước đó chưa làm được hoặc làm chưa tốt,” Bảo nhận xét. Tuy nhiên, anh cũng chỉ ra rằng Veo 3 vẫn có một số hạn chế, như khả năng hiển thị chữ tiếng Việt chưa tốt.
Tối ưu hóa cho người dùng và khả năng đa ngôn ngữ
Bảo Quyên, nhân viên marketing tại một công ty thiết bị di động ở TP HCM, cũng đang sử dụng Veo 3 để quảng bá sản phẩm mới. “Công cụ dễ sử dụng, tương thích và hiểu tiếng Việt tốt nên việc tạo video rất nhanh chóng,” chị chia sẻ. Mặc dù mọi người đều biết đó là video AI, nhưng các bài đăng sử dụng Veo 3 vẫn nhận được lượng tương tác lớn hơn so với những nội dung hình ảnh trước đây.
Mặc dù Veo 3 thu hút người dùng nhờ khả năng tạo video tự nhiên và hỗ trợ nhiều ngôn ngữ, trong đó có tiếng Việt, nhưng vẫn có những vấn đề liên quan đến việc tiếp cận công cụ. Hoàng Sơn, quản trị viên một nhóm hơn 100.000 thành viên về AI trên Facebook, chia sẻ rằng Veo 3 chủ yếu dành cho người dùng ở Mỹ. “Để sử dụng Veo 3 ở Việt Nam, người dùng phải ‘lách’ bằng cách sử dụng VPN, điều này không phải ai cũng biết,” anh nói. Thêm vào đó, tốc độ sử dụng công cụ này còn khá chậm và việc tạo prompt bằng tiếng Việt thường xuyên gặp lỗi hơn so với tiếng Anh.
Chi phí và khả năng tiếp cận
Để sử dụng Veo 3, người dùng cần đăng ký gói Google AI Ultra với mức phí 249,99 USD (6,5 triệu đồng) mỗi tháng, giảm giá 50% cho 3 tháng đầu tiên, còn 124,99 USD (3,25 triệu đồng). Người dùng sẽ nhận được 12.500 token, và mỗi video dài 8 giây sẽ tiêu tốn khoảng 100 token. Mặc dù giá cả có phần cao, nhưng những gì mà công cụ này mang lại vẫn làm nhiều người hài lòng.
Cơn sốt toàn cầu
Không chỉ tại Việt Nam, Veo 3 cũng gây “sốt” trên toàn cầu. Trên các nền tảng như X, YouTube, Instagram và Reddit, người dùng chia sẻ video với sự phấn khích và ngạc nhiên. Nhiều video do người dùng tạo ra đã nhận được hàng trăm nghìn đến hàng triệu lượt xem, chứng tỏ sức hút mạnh mẽ của công nghệ này.
Mashable nhận định về Veo 3: “Chúng tôi chưa từng thấy thứ gì giống Veo 3 trước đây. Thật ấn tượng. Thật đáng sợ. Và nó sẽ ngày càng tốt hơn nữa ở những phiên bản tiếp theo.” Những ưu điểm vượt trội của Veo 3 so với các mô hình khác, chẳng hạn như Sora của OpenAI, là khả năng tạo video nhanh, có âm thanh rõ ràng và hội thoại khớp từng chi tiết, duy trì tính nhất quán của nhân vật khi ghép nhiều đoạn phim lại với nhau.
Những lo ngại về việc lạm dụng AI
Tuy nhiên, sự phát triển nhanh chóng của Veo 3 cũng mang đến những lo ngại về việc AI có thể “cướp” công việc của con người, đặc biệt trong các lĩnh vực như đồ họa và dựng phim. Với khả năng tạo ra những video dễ dàng và nhanh chóng, AI có thể dẫn đến sự gia tăng của nội dung “rác” hoặc bị lợi dụng để tạo ra deepfake, qua đó lừa đảo hoặc lan truyền thông tin sai lệch.
Để đối phó với điều này, Google đã triển khai công nghệ SynthID, gắn nhãn cho tất cả nội dung tạo ra từ AI, nhằm giúp nhận diện và xác định rõ nguồn gốc của các video. Công ty cũng cung cấp hướng dẫn an toàn để “giúp mọi người tạo và xác định nội dung AI một cách có trách nhiệm.”
Veo 3 của Google đang mở ra một chương mới trong việc sáng tạo nội dung bằng AI. Dù còn những vấn đề cần giải quyết, nhưng với khả năng tạo video chân thực, nhanh chóng và có âm thanh, công cụ này đã tạo ra một làn sóng lớn trong cộng đồng sáng tạo. Dù vậy, người dùng cần phải cẩn trọng khi áp dụng công nghệ này, để tránh những hậu quả không mong muốn liên quan đến bảo mật và tính xác thực của thông tin.