技术突破！快手可灵多模态AI数字人实现从“对口型”到“会表演”，分钟级长视频生成能力领先

2025-09-15

快手可灵团队推出全新数字人功能并开启公测，同步发布技术报告Kling—Avatar与项目主页。该技术核心为多模态大语言模型赋能的两阶段生成框架，通过多模态导演模块解析音频、图像、文字指令生成故事线，产出蓝图视频后级联生成子段视频，实现分钟级长视频中数字人的自然表演，解决口型同步、身份一致性等问题。实验对比显示其在总体效果、口型同步等多维度领先OmniHuman—1、HeyGen等现有产品，团队还将持续探索高分辨率等前沿方向。

查看完整舆情解析

重要提示和声明

本页面内容由AI提炼生成，无法确保完全真实准确，不代表希财网官方立场，不构成投资建议。如需阅读详细说明，请点击此处

技术突破！快手可灵多模态AI数字人实现从“对口型”到“会表演”，分钟级长视频生成能力领先

理财有风险，投资需谨慎