梦还会

首页

梦还会

近期，即梦AI在官方社交媒体上发布了一条新功能上线预告片。视频显示，采用了全新的多模态视频生成模型OmniHuman，用户仅需输入一张图片和一段音频，就可以生成一条生动的AI视频，有望大幅提升AI短片的制作效率和质量。OmniHuman技术主页信息显示，该模型为字节跳动自研的闭源模型，可支持肖像、半身以及全身等不同尺寸的图片输入，并根据输入的音频，在视频中让人物生成与之匹配的动作，包括演讲、唱歌、

新闻 2025年02月11日 0 点赞 0 评论 28 浏览

一张图和一段音频就能生成视频，即梦多模态视频生成功能内测在即

新京报贝壳财经讯（记者白金蕾）2月7日，即梦AI（人工智能）在官方社交媒体上发布了一条新功能上线预告片。视频显示，采用了全新的多模态视频生成模型OmniHuman（字节跳动旗下多模态模型），用户仅需输入一张图片和一段音频，就可以生成一条生动AI视频，这有望大幅提升AI短片的制作效率和质量。即梦AI相关负责人透露，该模型目前已具备较好的表现，但在生成影视真实级别的视频上仍存在一定的提升空间。由其支

新闻 2025年02月11日 0 点赞 0 评论 25 浏览

梦还会

首页

梦还会

列表

默认

浏览次数

发布日期

一张图+一段音频即可生成视频字节最新数字人模型即将上线

一张图和一段音频就能生成视频，即梦多模态视频生成功能内测在即

梦还会 首页 梦还会

列表 默认 浏览次数 发布日期

一张图+一段音频即可生成视频 字节最新数字人模型即将上线

一张图和一段音频就能生成视频，即梦多模态视频生成功能内测在即

梦还会

首页

梦还会

列表

默认

浏览次数

发布日期

一张图+一段音频即可生成视频字节最新数字人模型即将上线