技术突破!快手可灵多模态AI数字人实现从“对口型”到“会表演”,分钟级长视频生成能力领先
2025-09-15

多
多模态AI
正面
查看报告
快手可灵团队推出全新数字人功能并开启公测,同步发布技术报告Kling—Avatar与项目主页。该技术核心为多模态大语言模型赋能的两阶段生成框架,通过多模态导演模块解析音频、图像、文字指令生成故事线,产出蓝图视频后级联生成子段视频,实现分钟级长视频中数字人的自然表演,解决口型同步、身份一致性等问题。实验对比显示其在总体效果、口型同步等多维度领先OmniHuman—1、HeyGen等现有产品,团队还将持续探索高分辨率等前沿方向。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
