MorphCut
About
该产品提供了一种新颖的框架,用于平滑跳切,特别是在对话视频中。它利用视频中主体的外观,通过 DensePose 关键点和面部标志驱动的中级表示来融合其他源帧中的信息。为了实现运动,它在切割周围的端帧之间插值关键点和标志。然后使用图像转换网络从关键点和源帧合成像素。由于关键点可能包含错误,因此提出了一种跨模态注意机制,以选择和为每个关键点挑选最合适的源。通过利用这种中级表示,我们的方法可以比强视频插值基准获得更强的结果。我们在对话视频的各种跳切上展示了我们的方法,例如切除填充词、暂停,甚至随机切割。我们的实验表明,即使在对话头部旋转或剧烈移动的挑战性情况下,我们也可以实现无缝过渡。
Categories
AI 视频生成github视频视频处理跳切平滑DensePose面部标志视频插值
Tags
免费使用正常访问无需登录
Other
收录日期:2025-11-23 15:59:44
相关推荐
- 拍我AI一站式生成有趣AI视频、创意AI图片和专属AI智能体。海量AI模板一键套用,让视频、图片创作零门槛。释放无限想象力,即刻拍出你的AI大作!
- 商汤如影商汤日日新 SenseNova 大模型体系提供多种大模型及能力,助力各行业智能化创新,以大算力引领通用人工智能发展。
- AIMIX智剪AIMIX智剪是一款集短视频批量剪辑、字幕生成、配音合成等多项功能于一体的短视频内容生产工具。它可以实现智能语音识别、视频脚本设计、快速混剪、字幕制作、配音合成等,大幅提高短视频内容制作效率。关键优势是内容原创性强、支持批量生产、简单易用。定位于需要大量原创短视频内容的个人或机构用户。
萌动AI全球首个二次元/动漫专用 AI 创作工具
绘蛙AI视频绘蛙推出的AI图生视频工具- TTSMaker马克配音免费的在线文本转语音神器
Designs AI免费AI设计。使用生成型 AI 创建图像、视频等。利用人工智能的力量提升您的社交媒体营销水平。
SekoTalk商汤科技推出的AI对口型工具
Pixfun一站式动画故事AI视频生成平台- Hailuo AIHailuo AI Video Generator 是一款利用人工智能技术,根据文本提示自动生成视频内容的工具。它通过深度学习算法,将用户的文字描述转化为视觉图像,极大地简化了视频制作流程,提高了创作效率。该产品适用于需要快速生成视频内容的个人和企业,特别是在广告、社交媒体内容制作和电影预览等领域。
- WanWan是阿里巴巴通义实验室开发的先进视觉生成模型,具备强大的视频生成能力。它能够根据文本、图像及其他控制信号生成视频。Wan2.1系列模型现已完全开源。其主要优点包括卓越的复杂运动生成能力,能够生成逼真的视频,涵盖广泛的身体动作、复杂旋转、动态场景转换和流畅的镜头运动;精准的物理模拟,生成符合真实物理规律的视频;电影质感的画面,提供丰富的纹理和多样化的风格化效果;可控的编辑功能,支持使用图像或视频参考进行精确编辑。该模型的开源为视频生成领域带来了新的可能性,降低了使用门槛,推动了相关技术的发展。
TavusAI数字人克隆和AI视频实时对话工具
LensGoLensGo 是一个免费的 AI 驱动的图像和视频制作工具,最适合定制化视频制作。它能帮助用户制作个性化的 AI 视频。- GoEnhance AIGoEnhance AI是一款基于人工智能的图像和视频增强工具。它可以实现视频到视频、图像增强和超分辨率scaling等功能。GoEnhance AI采用了最先进的深度学习算法,可以增强和上采样图像到极致的细节和高分辨率。它简单易用,功能强大,是创作者、设计师等用户释放创意的绝佳工具。
Morph StudioMorph Studio是一款领先的文字转视频AI平台,通过智能算法,将用户输入的文字转化为精美视频。其优势在于快速、高效地实现用户的创意想法,为创作者提供了全新的表现方式。定价灵活多样,适合个人用户和企业用户。定位于提升视频创作效率,让创意更快实现。
Fliki高效帮用户创建视频,具有文本转语音功能
Viva免费的AI视频生成和图像创作平台
EbSynthAI将真人视频转化为油画风动画
TypeframesAI快速生成高质量的产品介绍视频
JoyPixAI数字人创作工具,支持声音克隆
热门工具
- 拍我AI一站式生成有趣AI视频、创意AI图片和专属AI智能体。海量AI模板一键套用,让视频、图片创作零门槛。释放无限想象力,即刻拍出你的AI大作!
- 百炼阿里云大模型服务平台,提供AI模型训练、部署、推理一站式服务,支持多种大模型框架,助力企业快速构建AI应用。
腾讯元器腾讯混元大模型团队推出的智能体开放平台,开发者可以通过插件、知识库、工作流等方式快速、低门槛打造高质量的智能体。- SkidHomework - AI开源作业帮AI驱动家庭作业批改解答工具,支持拍照上传以及PDF文件,无需下载浏览器直接运行
WellSaidAI文本转语音工具
Artbreeder在线AI图像合成创意工具
BeatBotSplash的AI音乐生成器
Gemini CLIGemini CLI 是一个开源 AI 代理,可将 Gemini 的强大功能直接带入您的终端。它提供了对 Gemini 的轻量级访问,为您提供从提示到我们模型的最直接路径。- FastGPT企业级AI Agent搭建平台,可以基于LLM大语言模型搭建AI知识库问答系统,提供开箱即用的AI Agent工具集及大模型。
- AiderAI pair programming in your terminal
一站式编程工具导航平台,收录最新、最全的开发资源。深度覆盖Python、Java、C++、C#、Web前端等主流编程语言,提供高效检索与下载服务,致力于成为程序员的首选工具站。

















