性能比肩OpenAI 中國DeepSeek爆紅

2025-01-27 00:00

Deepseek公司推出全新高性能大模型。
Deepseek公司推出全新高性能大模型。

近年來美國對中國晶片產業的出口管制不斷升級,兩國科技戰如火如荼。中國初創公司「深度求索」(DeepSeek)近日推出一款廉價計算機大模型,可比肩美國AI(人工智能)公司龍頭OpenAI最新模型的超高性能,挑戰美國在該領域的霸主之位。由於訓練成本遠低於同級產品,該模型受到矽谷及多間西方媒體的高度關注,有經濟學者質疑美國禁止AI晶片輸華無用。內地官媒指,這證明大模型創新並非須依賴最先進的硬件。
本月20日,中國對沖基金幻方量化旗下AI子公司「深度求索」公布了新一代開源大模型DeepSeek-R1(下稱R1),該模型號稱在數學、代碼、自然語言推理等任務上,性能可比肩OpenAI最新的o1大模型正式版。在某國外大模型排名榜上,該模型基準測試排名現已升至全類別大模型第3,與OpenAI的ChatGPT-4o最新版並列,並在風格控制類模型分類中與OpenAI的o1模型並列第一。目前DeepSeek在美區下載熱度飆升,在蘋果App Store的免費排行榜中排名第4。
開放代碼  免費使用

除性能領先外,R1在開源程度上也遠超競爭對手o1。據悉它不僅開放代碼,允許任何人免費使用、修改及商業化,還允許使用者用它訓練自己的模型,徹底打破了以往大型語言模型被少數公司壟斷的局面。Meta AI首席科學家Yann LeCun直言,DeepSeek的成功得益於開放生態,其創新是基於前人成果的持續反覆運算,顯示了開源模型正在超越閉源系統。

由於訓練成本極其低廉,該模型也被業界戲稱為「AI界的拼多多」。行業網站ChinaZ.com披露,R1研發成本為600萬美元,使用了約2000塊英偉達生產的專用晶片,而美國大公司的AI系統需使用多達1.6萬塊晶片。內媒引述深度求索的技術報告稱,R1訓練成本是o1的1/30。

這款突破性的開源模型一經面世即引發各界關注。微軟CEO納德拉指出,DeepSeek的新模型推理計算效率極高,令人印象深刻,「我們應該非常嚴肅地看待中國AI的發展」。美媒《紐約時報》也發文稱讚,R1以極低成本和少量晶片實現了與OpenAI等巨頭相媲美的性能,挑戰了「唯有科技巨頭才能研發尖端AI」的行業共識。英媒《金融時報》則稱,人們開始質疑AI行業數千億美元資本支出的效用,投資者甚至認為美股晶片股股價將面臨挑戰。

近年來美國拜登政府屢次以國家安全為由頒布禁令,限制向中國輸送高性能晶片,然而中國公司依然開發出新穎模型。官媒《經濟日報》昨日發文指,DeepSeek的成功證明了大模型創新不一定要依賴最先進的硬件,而是可以靠聰明的工程設計和高效的訓練方法。

關鍵字

最新回應

相關新聞

You are currently at: 187235123.xyz
Skip This Ads
close ad
close ad