一张图+一段音频即可生成视频 字节最新数字人模型即将上线 近期,即梦AI在官方社交媒体上发布了一条新功能上线预告片。视频显示,采用了全新的多模态视频生成模型OmniHuman,用户仅需输入一张图片和一段音频,就可以生成一条生动的AI视频,有望大幅提升AI短片的制作效率和质量。OmniHuman技术主页信息显示,该模型为字节跳动自研的闭源模型,可支持肖像、半身以及全身等不同尺寸的图片输入,并根据输入的音频,在视频中让人物生成与之匹配的动作,包括演讲、唱歌、 新闻 2025年02月11日 0 点赞 0 评论 28 浏览
一张图和一段音频就能生成视频,即梦多模态视频生成功能内测在即 新京报贝壳财经讯(记者 白金蕾)2月7日,即梦AI(人工智能)在官方社交媒体上发布了一条新功能上线预告片。视频显示,采用了全新的多模态视频生成模型OmniHuman(字节跳动旗下多模态模型),用户仅需输入一张图片和一段音频,就可以生成一条生动AI视频,这有望大幅提升AI短片的制作效率和质量。即梦AI相关负责人透露,该模型目前已具备较好的表现,但在生成影视真实级别的视频上仍存在一定的提升空间。由其支 新闻 2025年02月11日 0 点赞 0 评论 25 浏览