希财 > 舆情宝 > 舆情详情页

多模态AI技术再突破:OpenVision 2极简框架效率提升2倍,10亿参数模型开源赋能行业

2025-09-15
多模态AI
正面
查看报告
加州大学圣克鲁兹分校、苹果公司及加州大学伯克利分校合作研发的OpenVision 2实现多模态AI技术突破:通过移除对比学习与文本编码器,仅保留「图像→描述」生成目标,简化训练框架;在TextVQA、OCR等多模态基准任务上性能媲美CLIP/SigLIP,部分细粒度任务更优;训练效率显著提升(时间缩短1.5-2倍、显存占用减少近半),成功扩展至10亿参数规模,并开源25+预训练模型及完整代码数据,为多模态AI社区提供高效、可扩展的技术方案。
查看完整舆情解析
重要提示和声明
本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
本页面内容由AI基于全网用户讨论及市场动态提炼生成,仅供希财网用户作一般性的参考阅读使用,不构成投资建议。
本页面提及的观点不代表希财网官方立场,亦不代表本公司对其中任何行业或相关公司的判断:本页面如提及任何投资标的,亦仅基于一般举例和参考目的,不应被视为投资建议。
AI仍处于早期发展阶段,在技术上尚不成熟,且用户讨论具有UGC属性,本公司无法保证AI提炼生成内容完全真实准确。若涉及对你或其他相关方可能产生重大影响的情形,建议你采取合理必要措施对AI提炼、生成的内容进行核实,并咨询相关专业机构和专业人士,本页面内容不应成为你进一步作为或不作为的依据。
投资有风险,决策需谨慎。在任何情况下,本公司不对任何人因使用本页面的任何内容所导致的损失承担任何责任。
扫码体验舆情宝小程序 99%的用户都在用