VLOGGER

VLOGGER

About

VLOGGER是一种从单张人物输入图像生成文本和音频驱动的讲话人类视频的方法,它建立在最近生成扩散模型的成功基础上。我们的方法包括1)一个随机的人类到3D运动扩散模型,以及2)一个新颖的基于扩散的架构,通过时间和空间控制增强文本到图像模型。这种方法能够生成长度可变的高质量视频,并且通过对人类面部和身体的高级表达方式轻松可控。与以前的工作不同,我们的方法不需要为每个人训练,也不依赖于人脸检测和裁剪,生成完整的图像(而不仅仅是面部或嘴唇),并考虑到正确合成交流人类所需的广泛场景(例如可见的躯干或多样性主体身份)。

Categories

AI 视频生成AI 语音生成github视频视频生成人体合成文本到视频音频到视频

Tags

免费使用正常访问无需登录

Other

收录日期:2025-11-23 15:59:23

相关推荐

一站式编程工具导航

一站式编程工具导航平台,收录最新、最全的开发资源。深度覆盖Python、Java、C++、C#、Web前端等主流编程语言,提供高效检索与下载服务,致力于成为程序员的首选工具站。

Contacts

备案号:

粤ICP备2024207953号

© Copyright 2024 - 2025 prog.quicknavig.com. All rights reserved.