关闭广告

字节跳动OmniHuman:静态照片秒变生动视频

科技行者2025-08-27 00:00:01459人阅读


音乐、说话、手势、表情——只需一张照片和一段音频,就能让静态的人物照片瞬间活起来。这听起来像是科幻电影里的情节,但现在已经成为现实。ByteDance的研究团队在2025年6月发表了一项名为"OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models"的重要研究成果,该研究由字节跳动的林高杰、姜建文、杨佳琦、郑泽荣、梁超等研究人员共同完成,已发表在arXiv平台(论文编号:arXiv:2502.01061v3),有兴趣深入了解的读者可以通过https://omnihuman-lab.github.io/访问项目详情。

这项研究解决了一个普通人都能理解的问题:如何让静态照片中的人物"动起来"。以前,制作一个人物说话或唱歌的视频需要复杂的设备和专业技术,现在只需要一张照片和想要的音频内容,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

罗马诺:切尔西接近聘请前利物浦球探总监戴夫-法洛斯

懂球帝 浏览 298 10-20

以官员称美国通报以色列 将否决联合国安理会加沙决议

环球网资讯 浏览 4346 06-05

NotebookLM能生成PPT了,还带演讲配音

量子位 浏览 3812 08-10

王思聪带懒懒看演唱会,舞台前对美女猛拍照

鑫鑫说说 浏览 222 12-02

重新定义边界,吉利全域安全进入 2.0 时代

网易汽车 浏览 243 12-14

威利-格林:非常期待普尔的表现 他已经准备好完成生涯再一次飞跃

直播吧 浏览 328 09-21

李昊:扑救就是一个小部分,最重要的是大家整体的防守

懂球帝 浏览 342 09-10

罗永浩直播放话:让西贝享受西门子待遇

中国基金报 浏览 330 09-15

林诗栋蒯曼横扫晋级决赛!蒯曼大谈技战术,林诗栋喊话决赛展低调

篮球资讯达人 浏览 436 08-22

200亿家居龙头,创始人遗孀走到台前

21财闻汇 浏览 391 09-11

华为:HarmonyOS 5终端设备数量突破2000万台

大象新闻 浏览 315 09-29

美俄元首会晤结束 军事专家:普京打"历史牌"一箭三雕

看看新闻Knews 浏览 536 08-17

快手全员发开工红包:正式员工366元

三言科技 浏览 172 02-24

埃奇库姆:讨厌大学篮球 那里内线总杵着俩中锋 我根本没操作空间

直播吧 浏览 6080 07-29

又到每年假装自己是汤唯的时候了

时尚COSMO 浏览 260 10-15

俄一夜间击落249架乌克兰无人机

北青网-北京青年报 浏览 200 11-26

"航站楼"搬进高铁站 空铁联运"一张网"正加速成型

环球网资讯 浏览 428 08-24

美国政府未偿国债首次突破30万亿美元,自2018年以来翻一番

华尔街见闻官方 浏览 271 12-05

即将加盟那不勒斯,瓦尼亚是上赛季意甲扑救次数最多的门将

懂球帝 浏览 5761 07-26

寒武纪涨停 距贵州茅台股价仅差近200元

YOUNG财经 浏览 422 08-23

足球报:广州豹已经接收到五六十份应聘总监的资料

懂球帝 浏览 2725 07-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11