你的位置：鑫荣化工 > 科技创新 > 中国首个Sora级模型 Vidu 发布：生成最长16秒、最高 1080P 视频

中国首个Sora级模型 Vidu 发布：生成最长16秒、最高 1080P 视频

时间：2024-04-29 03:24 点击：175 次

IT之家 4 月 27 日消息，生数科技今天出席中关村论坛未来人工智能先锋论坛，携手清华大学正式发布中国首个长时长、高一致性、高动态性视频大模型 ——Vidu，被媒体和业内人士认为是国内首个 Sora 级别的视频大模型。 根据官方描述，Vidu 模型融合 Diffusion 与 Transformer，开创性创建了 U-ViT，支持一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。<img data-reference="image" src="https://img-s-msn-com.akamaized.net/tenant/amp/entityid/AA1nKHOA">官方宣传资料中演示了“画室中的一艘船驶向镜头”、其海浪、船的效果非常逼真。<img data-reference="image" src="https://img-s-msn-com.akamaized.net/tenant/amp/entityid/AA1nKpzi">官方表示 Vidu 不仅能够模拟真实物理世界，威尼斯人网址还拥有丰富想象力，威尼斯人网址具备多镜头生成、时空一致性高等特点。Vidu 是自 Sora 发布之后，威尼斯人网址全球率先取得重大突破的视频大模型，威尼斯人网址性能全面对标国际顶尖水平，威尼斯人网址和记AG并在加速迭代提升中。Vidu 的快速突破源自于团队在贝叶斯机器学习和多模态大模型的长期积累和多项原创性成果。其核心技术 U-ViT 架构由团队于 2022 年 9 月提出，早于 Sora 采用的 DiT 架构，是全球首个 Diffusion 与 Transformer 融合的架构。2023 年 3 月，团队开源了全球首个基于 U-ViT 融合架构的多模态扩散模型 UniDiffuser，率先完成了 U-ViT 架构的大规模可扩展性验证。<img data-reference="image" src="https://img-s-msn-com.akamaized.net/tenant/amp/entityid/AA1nKFUe"><img data-reference="image" src="https://img-s-msn-com.akamaized.net/tenant/amp/entityid/AA1nKpzt"><img data-reference="image" src="https://img-s-msn-com.akamaized.net/tenant/amp/entityid/AA1nKDpO"><img data-reference="image" src="https://img-s-msn-com.akamaized.net/tenant/amp/entityid/AA1nKAV3">IT之家附上参考地址

备考前期，大家要把较多的时间、精力放在英语和数学上，只有把基础打扎实了，后期各个题型才能应对自如、取得高分；不仅如此，还能在备考后期为专业课、政治等需要背诵的科目匀出更多的复习时间。

•