中大研新通用视觉技术「书生」

2021-11-26 03:50

中大联同上海人工智能实验室、商汤科技及上海交通大学共同发布新通用视觉技术体系「书生」。受访者提供

人工智能（AI）应用层面愈来愈广泛。中文大学联同人工智能实验室、商汤科技及上海交通大学，研发名为「书生」（INTERN）的新一代通用视觉技术系统，可改善现时人工智能视觉领域中，AI模型在任务和场景通用性、数据学习效率方面的瓶颈问题，业界可以极低成本获取下游资料，快速验证多个新场景等。有关技术已于论文发布平台arXiv发布。

可同时完成多项任务

新系统名为「书生」，寓意系统拥有如书生般的特质，通过持续学习，举一反三。目前的AI模型只擅长处理一项任务，在新场景、数据学习、新任务的通用性有限，面对不同任务需求，须独立开发模型。但「书生」系统则可同时完成多项任务，应用于多样化的场景，包括自动驾驶、智慧制造、智慧城市等。技术测试结果显示，一个「书生」基础模型可全面覆盖分类、目标检测、语义分割、深度估计四大视觉核心任务。

相比现时最先进的开源模型CLIP，「书生」在准确性和数据使用效率方面均大幅提升。例如应用同样的下游场景，「书生」在上述四大任务的平均错误率，降低9.4%至47.3%不等；另外，在数据使用效率方面的提升尤为突出，例如只需要十分之一的下游资料，便能准确识别花卉的种类，比CLIP以完整下游资料进行分析的准确度更高。中大指，利用这个新系统，业界可以极低成本获取下游资料，快速验证多个新场景，体现了产学研合作在通用视觉领域的全新探索，为走向通用人工智能迈出坚实一步。

原文刊《星岛日报》教育版

關鍵字

「泰」精采旅程未出发先规划旅游局推出香港专属网页

理工新地标校门红砖柱廊设计

中大研新通用视觉技术「书生」

最新回应

订阅星岛日报

联络我们

广告表格及价目表