360开源FG-CLIP模型突破多模态细粒度对齐,重塑AI视觉理解能力
2025-04-29
360人工智能研究院推出FG-CLIP模型,通过长文本深度理解和细粒度视觉比对技术,解决了传统CLIP模型在图像局部细节识别上的'视觉近视'问题。该模型在图文检索、细粒度识别等12项任务中表现优于现有方法,并将全面开源模型与数据。FG-CLIP创新性地采用两阶段训练策略,结合区域对比学习与难负样本生成,显著提升多模态模型对图像局部特征和复杂文本的精准匹配能力。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
