性能比肩OpenAI 中国DeepSeek爆红

2025-01-27 00:00

近年来美国对中国晶片产业的出口管制不断升级，两国科技战如火如荼。中国初创公司「深度求索」（DeepSeek）近日推出一款廉价计算机大模型，可比肩美国AI（人工智能）公司龙头OpenAI最新模型的超高性能，挑战美国在该领域的霸主之位。由于训练成本远低于同级产品，该模型受到矽谷及多间西方媒体的高度关注，有经济学者质疑美国禁止AI晶片输华无用。内地官媒指，这证明大模型创新并非须依赖最先进的硬件。
本月20日，中国对冲基金幻方量化旗下AI子公司「深度求索」公布了新一代开源大模型DeepSeek-R1（下称R1），该模型号称在数学、代码、自然语言推理等任务上，性能可比肩OpenAI最新的o1大模型正式版。在某国外大模型排名榜上，该模型基准测试排名现已升至全类别大模型第3，与OpenAI的ChatGPT-4o最新版并列，并在风格控制类模型分类中与OpenAI的o1模型并列第一。目前DeepSeek在美区下载热度飙升，在苹果App Store的免费排行榜中排名第4。
开放代码免费使用

除性能领先外，R1在开源程度上也远超竞争对手o1。据悉它不仅开放代码，允许任何人免费使用、修改及商业化，还允许使用者用它训练自己的模型，彻底打破了以往大型语言模型被少数公司垄断的局面。Meta AI首席科学家Yann LeCun直言，DeepSeek的成功得益于开放生态，其创新是基于前人成果的持续反覆运算，显示了开源模型正在超越闭源系统。

由于训练成本极其低廉，该模型也被业界戏称为「AI界的拼多多」。行业网站ChinaZ.com披露，R1研发成本为600万美元，使用了约2000块英伟达生产的专用晶片，而美国大公司的AI系统需使用多达1.6万块晶片。内媒引述深度求索的技术报告称，R1训练成本是o1的1/30。

这款突破性的开源模型一经面世即引发各界关注。微软CEO纳德拉指出，DeepSeek的新模型推理计算效率极高，令人印象深刻，「我们应该非常严肃地看待中国AI的发展」。美媒《纽约时报》也发文称赞，R1以极低成本和少量晶片实现了与OpenAI等巨头相媲美的性能，挑战了「唯有科技巨头才能研发尖端AI」的行业共识。英媒《金融时报》则称，人们开始质疑AI行业数千亿美元资本支出的效用，投资者甚至认为美股晶片股股价将面临挑战。

近年来美国拜登政府屡次以国家安全为由颁布禁令，限制向中国输送高性能晶片，然而中国公司依然开发出新颖模型。官媒《经济日报》昨日发文指，DeepSeek的成功证明了大模型创新不一定要依赖最先进的硬件，而是可以靠聪明的工程设计和高效的训练方法。

關鍵字

深圳去年增长5.8% 进出口拉动

创始人梁文锋毕业浙大李强座上宾

性能比肩OpenAI 中国DeepSeek爆红

最新回应

相關新聞

西安大学生疑被卖入诈骗园区

陈梦夺冠遭网暴官方严打饭圈造谣

网信办拟规管网红经纪公司

前司法部长夫妇实控34家公司搞权钱交易

订阅星岛日报

联络我们

广告表格及价目表