性能比肩OpenAI 中國DeepSeek爆紅

2025-01-27 00:00

近年來美國對中國晶片產業的出口管制不斷升級，兩國科技戰如火如荼。中國初創公司「深度求索」（DeepSeek）近日推出一款廉價計算機大模型，可比肩美國AI（人工智能）公司龍頭OpenAI最新模型的超高性能，挑戰美國在該領域的霸主之位。由於訓練成本遠低於同級產品，該模型受到矽谷及多間西方媒體的高度關注，有經濟學者質疑美國禁止AI晶片輸華無用。內地官媒指，這證明大模型創新並非須依賴最先進的硬件。
本月20日，中國對沖基金幻方量化旗下AI子公司「深度求索」公布了新一代開源大模型DeepSeek-R1（下稱R1），該模型號稱在數學、代碼、自然語言推理等任務上，性能可比肩OpenAI最新的o1大模型正式版。在某國外大模型排名榜上，該模型基準測試排名現已升至全類別大模型第3，與OpenAI的ChatGPT-4o最新版並列，並在風格控制類模型分類中與OpenAI的o1模型並列第一。目前DeepSeek在美區下載熱度飆升，在蘋果App Store的免費排行榜中排名第4。
開放代碼免費使用

除性能領先外，R1在開源程度上也遠超競爭對手o1。據悉它不僅開放代碼，允許任何人免費使用、修改及商業化，還允許使用者用它訓練自己的模型，徹底打破了以往大型語言模型被少數公司壟斷的局面。Meta AI首席科學家Yann LeCun直言，DeepSeek的成功得益於開放生態，其創新是基於前人成果的持續反覆運算，顯示了開源模型正在超越閉源系統。

由於訓練成本極其低廉，該模型也被業界戲稱為「AI界的拼多多」。行業網站ChinaZ.com披露，R1研發成本為600萬美元，使用了約2000塊英偉達生產的專用晶片，而美國大公司的AI系統需使用多達1.6萬塊晶片。內媒引述深度求索的技術報告稱，R1訓練成本是o1的1/30。

這款突破性的開源模型一經面世即引發各界關注。微軟CEO納德拉指出，DeepSeek的新模型推理計算效率極高，令人印象深刻，「我們應該非常嚴肅地看待中國AI的發展」。美媒《紐約時報》也發文稱讚，R1以極低成本和少量晶片實現了與OpenAI等巨頭相媲美的性能，挑戰了「唯有科技巨頭才能研發尖端AI」的行業共識。英媒《金融時報》則稱，人們開始質疑AI行業數千億美元資本支出的效用，投資者甚至認為美股晶片股股價將面臨挑戰。

近年來美國拜登政府屢次以國家安全為由頒布禁令，限制向中國輸送高性能晶片，然而中國公司依然開發出新穎模型。官媒《經濟日報》昨日發文指，DeepSeek的成功證明了大模型創新不一定要依賴最先進的硬件，而是可以靠聰明的工程設計和高效的訓練方法。

關鍵字

深圳去年增長5.8% 進出口拉動

創始人梁文鋒畢業浙大李強座上賓

性能比肩OpenAI 中國DeepSeek爆紅

最新回應

相關新聞

西安大學生疑被賣入詐騙園區

陳夢奪冠遭網暴官方嚴打飯圈造謠

網信辦擬規管網紅經紀公司

前司法部長夫婦實控34家公司搞權錢交易

訂閱星島日報

聯絡我們

廣告表格及價目表