性能比肩OpenAI 中国DeepSeek爆红
2025-01-27 00:00
近年来美国对中国晶片产业的出口管制不断升级,两国科技战如火如荼。中国初创公司「深度求索」(DeepSeek)近日推出一款廉价计算机大模型,可比肩美国AI(人工智能)公司龙头OpenAI最新模型的超高性能,挑战美国在该领域的霸主之位。由于训练成本远低于同级产品,该模型受到矽谷及多间西方媒体的高度关注,有经济学者质疑美国禁止AI晶片输华无用。内地官媒指,这证明大模型创新并非须依赖最先进的硬件。
本月20日,中国对冲基金幻方量化旗下AI子公司「深度求索」公布了新一代开源大模型DeepSeek-R1(下称R1),该模型号称在数学、代码、自然语言推理等任务上,性能可比肩OpenAI最新的o1大模型正式版。在某国外大模型排名榜上,该模型基准测试排名现已升至全类别大模型第3,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型分类中与OpenAI的o1模型并列第一。目前DeepSeek在美区下载热度飙升,在苹果App Store的免费排行榜中排名第4。
开放代码 免费使用
由于训练成本极其低廉,该模型也被业界戏称为「AI界的拼多多」。行业网站ChinaZ.com披露,R1研发成本为600万美元,使用了约2000块英伟达生产的专用晶片,而美国大公司的AI系统需使用多达1.6万块晶片。内媒引述深度求索的技术报告称,R1训练成本是o1的1/30。
这款突破性的开源模型一经面世即引发各界关注。微软CEO纳德拉指出,DeepSeek的新模型推理计算效率极高,令人印象深刻,「我们应该非常严肃地看待中国AI的发展」。美媒《纽约时报》也发文称赞,R1以极低成本和少量晶片实现了与OpenAI等巨头相媲美的性能,挑战了「唯有科技巨头才能研发尖端AI」的行业共识。英媒《金融时报》则称,人们开始质疑AI行业数千亿美元资本支出的效用,投资者甚至认为美股晶片股股价将面临挑战。
近年来美国拜登政府屡次以国家安全为由颁布禁令,限制向中国输送高性能晶片,然而中国公司依然开发出新颖模型。官媒《经济日报》昨日发文指,DeepSeek的成功证明了大模型创新不一定要依赖最先进的硬件,而是可以靠聪明的工程设计和高效的训练方法。
關鍵字
最新回应