Veo 3.1 AI视频生成模型

https://deepmind.google/models/veo/

-s后自动跳转...

网站介绍

产品概述

Veo 3.1 是 Google DeepMind 在 2025 年 10 月推出的最新一代 AI 视频生成模型，作为 Veo 系列的最新版本，它代表了当前技术完成度最高的视频生成模型之一。与 OpenAI 的 Sora 2、字节跳动的 Kling 3.0 等竞品相比，Veo 3.1 最突出的优势是接近广播级的画面质感、原生音画同步以及更明显的电影化审美。

核心特性

原生音频生成

Veo 3.1 最具突破性的能力之一是原生音频生成。与先生成无声画面再单独补音频的方案不同，Veo 3.1 会直接生成与画面动作相匹配的声音轨道，包括环境声、基础拟音，以及与场景上下文相符的音效。这为创作者提供了真正的"视听同步叙事"能力。

导演级控制功能

Ingredients to Video：可同时导入最多 4 张参考图像，精准控制角色、风格、场景与光影，显著提升角色一致性
Frames to Video：输入首尾帧，AI 自动生成中间镜头，实现自然过渡或艺术化转场
Extend：基于上一个片段的最后一秒，生成连贯续拍，实现分钟级长镜头效果
Insert & Remove：视频级"修图"功能，可添加或删除画面中的元素，AI 自动匹配阴影与光线

技术规格

分辨率：原生支持 720p 和 1080p，提供 4K 超分能力
帧率：支持 24-60 FPS，默认 24 FPS
视频时长：4-8 秒单段视频
画幅比例：支持 16:9、9:16 等常见比例

性能优势

在 MovieGenBench 等基准测试中，Veo 3.1 在整体偏好、文本对齐、视觉质量、音频-视频对齐等多个维度均表现最佳。生成速度比 Sora 2 快 30%-40%，时序一致性评分可达 8.8/10。

应用场景

影视制作：广告公司、影视制作团队用 Veo 3.1 做前期预演，快速测试机位、灯光和画面构图
社交媒体：得益于对 9:16 竖屏的支持，非常适合 TikTok 和 Instagram Reels 等场景
品牌营销：将静态产品图变成动态展示视频，在没有传统拍摄预算的情况下做出专业展示效果
教育内容：教育工作者和课程创作者可以把文字说明和参考图转成更直观的视频演示素材

接入方式

Veo 3.1 通过 Google AI 生态提供服务：

Google AI Studio：提供免费试用和付费订阅计划
Gemini API：企业和开发者可在应用中直接调用
Vertex AI：Google Cloud 的 AI 平台集成
Flow 创作平台：Google 的 AI 视频创作平台，提供完整的编辑工作流

合作伙伴

Google DeepMind 已与导演 Darren Aronofsky 的 Primordial Soup 工作室建立合作伙伴关系，共同探索将实拍镜头与 Veo 生成视频整合的新电影制作技术，已制作三部短片。

评论区

加载中...