创科广场｜内地研视觉运算平台促进AI生态构建

2022-03-01 15:33

商汤科技在全球视觉运算研究最尖端的人工智能（AI）初创，2018年香港中文大学-商汤科技联合实验室（MMLab）推出了开源计画OpenMMLab，而2020年商汤再宣布OpenMMLab升级。

开源有助创新，中国成立上海人工智能实验室，并由商汤创办人汤晓鸥担任主任，推动上海的AI产业。

最近，上海人工智能实验室与商汤科技、中文大学、上海交通大学，再共同发布通用的视觉开源平台OpenGVLab，向学术界和产业界开放超高效预训练模型，以及千万级精标注、十万级标签量的公开数据集，有助开发人员改善各类下游视觉运算模型的训练。

OpenGVLab开放业内首个针对通用视觉模型评测基准，以便开发人员对不同通用视觉模型的性能，进行横向评估和优化。

OpenGVLab开源平台已在网上公开，供研究人员使用，以后将开放网上推理功能，供感兴趣人士体验。

解决只完成单一任务的难题

「开源是一项意义非凡的工作，人工智能发展离不开全球研究人员十馀年来开源共建。」上海人工智能实验室负责人表示：「希望通过发布OpenGVLab开源平台，帮助业界更好地探索和应用通用视觉AI技术，促进体系化解决AI发展中数据、泛化、认知和安全等瓶颈。」

上述通用视觉开源平台OpenGVLab，基于通用视觉技术体系「书生」（INTERN）建立，去年11月「书生」由上海人工智能实验室与商汤、中文大学、上海交通大学共同推出，以解决目前大部分的AI模型，只能完成单一任务的难题。

上述技术的论文《INTERN︰A New Learning Paradigm Towards General Vision》亦在arXiv平台上发表。

OpenGVLab可助开发人员降低通用视觉模型的开发门槛，用更低成本开发用于成百上千种视觉任务、视觉场景的算法模型，并解决长尾需求，推动AI的大规模应用。

上海人工智能实验室表示，OpenGVLab开源预训练模型，性能极高，覆盖分类、目标检测、语义分割、深度估计等四大视觉运算，准确率和数据使用效率，有大幅提升。研究人员可降低下游数据的采集成本，以极少的数据量，就可训练多场景、多任务AI模型。

OpenGVLab还提供多种不同参数量、不同计算量的预训练模型，以满足不同场景的应用需求。模型库中列出的多个模型，ImageNet微调结果和推理资源、速度等方面，相比之前的公开模型，均有不同程度的性能提升。

去年7月，上海人工智能实验室发布开源平台体系OpenXLab，涵盖新一代OpenMMLab和决策AI平台OpenDILab。

此次与商汤科技及各大学联合发布通用视觉开源平台OpenGVLab，为推动通用的视觉运算发展再奠定基础，完善了OpenXLab开源体系，促进人工智能基础研究和生态构建。

關鍵字

创科广场｜NFT题材百花齐放活动结合綫上綫下

创科广场｜亚太区初创潜力惊人业务多元备受注目

创科广场｜内地研视觉运算平台促进AI生态构建

最新回应

订阅星岛日报

联络我们

广告表格及价目表