人工智能

清华团队发布视频大模型Vidu 可生成16 秒、1080P 视频

字号+作者: 来源:站长之家 2024-04-28 09:35 评论(创建话题) 收藏成功收藏本文

站长之家(ChinaZ.com)4月28日 消息:生数科技与清华大学在中关村论坛未来人工智能先锋论坛上共同发布了中国首个长时长、高一致性、高动态性视频大模型—'...

站长之家(ChinaZ.com)4月28日 消息:生数科技与清华大学在中关村论坛未来人工智能先锋论坛上共同发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。这款模型是国内首个达到Sora级别的视频大模型,标志着中国在视频生成技术领域的重要进展。hvg品论天涯网

image.pnghvg品论天涯网

Vidu的主要特点和技术创新包括:hvg品论天涯网

模型结构: Vidu采用了创新性的U-ViT架构,该架构融合了Diffusion(扩散)与Transformer技术。hvg品论天涯网

视频生成能力: Vidu能够一键生成长达16秒、分辨率高达1080P的高清视频内容,满足长视频内容的生成需求。hvg品论天涯网

实际应用演示: 官方资料中的一个视频示例展示了“画室中的一艘船驶向镜头”的场景,船和海浪的逼真效果体现了Vidu的强大生成能力。hvg品论天涯网

高级功能: Vidu不仅能够模拟真实物理世界,还具备丰富的想象力,支持多镜头生成和高时空一致性,为视频创作提供了更多可能性。hvg品论天涯网

技术先进性:hvg品论天涯网

全球首创: Vidu的U-ViT架构是全球首个将Diffusion与Transformer融合的架构,早于其他类似模型使用的技术。hvg品论天涯网

开源成就:2023年3月,团队开源了基于U-ViT架构的多模态扩散模型UniDiffuser,这是全球首个此类模型,验证了U-ViT架构的大规模可扩展性。hvg品论天涯网

产品入口:https://top.aibase.com/tool/viduhvg品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]