李飞飞团队开源RAGEN框架,攻克AI智能体训练'回声陷阱'难题
2025-04-28
DeepSeek前研究员王子涵与李飞飞等团队合作发布开源框架RAGEN,旨在提升AI智能体在真实场景中的稳定性和推理能力。该框架通过StarPO强化学习算法解决训练中的'回声陷阱'问题,已在多个测试环境中验证效果,并开源代码。研究指出当前AI智能体多处于实验阶段,需优化奖励机制和扩展性以应对企业级应用挑战。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
