性能比肩OpenAI 中國DeepSeek爆紅
2025-01-27 00:00
近年來美國對中國晶片產業的出口管制不斷升級,兩國科技戰如火如荼。中國初創公司「深度求索」(DeepSeek)近日推出一款廉價計算機大模型,可比肩美國AI(人工智能)公司龍頭OpenAI最新模型的超高性能,挑戰美國在該領域的霸主之位。由於訓練成本遠低於同級產品,該模型受到矽谷及多間西方媒體的高度關注,有經濟學者質疑美國禁止AI晶片輸華無用。內地官媒指,這證明大模型創新並非須依賴最先進的硬件。
本月20日,中國對沖基金幻方量化旗下AI子公司「深度求索」公布了新一代開源大模型DeepSeek-R1(下稱R1),該模型號稱在數學、代碼、自然語言推理等任務上,性能可比肩OpenAI最新的o1大模型正式版。在某國外大模型排名榜上,該模型基準測試排名現已升至全類別大模型第3,與OpenAI的ChatGPT-4o最新版並列,並在風格控制類模型分類中與OpenAI的o1模型並列第一。目前DeepSeek在美區下載熱度飆升,在蘋果App Store的免費排行榜中排名第4。
開放代碼 免費使用
由於訓練成本極其低廉,該模型也被業界戲稱為「AI界的拼多多」。行業網站ChinaZ.com披露,R1研發成本為600萬美元,使用了約2000塊英偉達生產的專用晶片,而美國大公司的AI系統需使用多達1.6萬塊晶片。內媒引述深度求索的技術報告稱,R1訓練成本是o1的1/30。
這款突破性的開源模型一經面世即引發各界關注。微軟CEO納德拉指出,DeepSeek的新模型推理計算效率極高,令人印象深刻,「我們應該非常嚴肅地看待中國AI的發展」。美媒《紐約時報》也發文稱讚,R1以極低成本和少量晶片實現了與OpenAI等巨頭相媲美的性能,挑戰了「唯有科技巨頭才能研發尖端AI」的行業共識。英媒《金融時報》則稱,人們開始質疑AI行業數千億美元資本支出的效用,投資者甚至認為美股晶片股股價將面臨挑戰。
近年來美國拜登政府屢次以國家安全為由頒布禁令,限制向中國輸送高性能晶片,然而中國公司依然開發出新穎模型。官媒《經濟日報》昨日發文指,DeepSeek的成功證明了大模型創新不一定要依賴最先進的硬件,而是可以靠聰明的工程設計和高效的訓練方法。
關鍵字
最新回應