字节跳动OmniHuman—1.5重磅发布:虚拟人装上“思考大脑”,技术突破或打开应用新空间
2025-09-05

虚
虚拟数字人
弱中性
查看报告
8月底,字节跳动数字人团队推出虚拟人生成框架OmniHuman—1.5,相比前作实现多项技术突破:首次引入诺贝尔奖得主卡尼曼的“双系统理论”,通过多模态大语言模型(MLLM)驱动“思考大脑”,使虚拟人具备逻辑推理能力(如按指令顺序执行动作、规划动作序列),支持长视频生成、多人互动(双人对唱、运镜效果)及细腻情感表达(倾听状态切换、情绪与内容匹配)。技术上采用“伪最终帧”解决身份一致性与动作多样性矛盾,通过“对称融合”“两阶段预热”解决模态冲突。该版本即将上线即梦AI,可应用于人机交互、影视制作、虚拟社交等领域,推动虚拟人从“反应式”向“思考式”进化。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
