DeepSeek衝擊美股和人工智能商業模式,或反映中美AI差距縮小|Whatsnew

Deep Seek崛起,科技界稱讚, AI股一時大跌,特朗普敲警鐘,創辦人成中國總理諮詢對象。
2025年1月28日,北京的一部智慧型手機的螢幕上顯示 DeepSeek 的頁面。攝:Andy Wong/AP/達志影像

新春快樂!端傳媒新聞不停歇,你正在閱讀的即時新聞能夠免費呈現,全因有會員訂閱的支持,邀請你今天就成為其中一員。新春限時特惠:暢讀會員首年只要 8 折,即可暢讀全站深度內容;尊享會員首年 65 折,還贈送《華爾街日報》全語種會籍。立即登入訂閱會員,支持華語獨立新聞。

1月27日,美國主要科技股市出現大幅拋售,開盤縮水超1萬億美元,納斯達克指數收跌3.07%。多家AI科技龍頭公司均錄得史上最高跌幅之一,英偉達股價更重創16.86%,市值蒸發5890億美元,是該AI龍頭公司自COVID-19疫情初期2020年3月16日以來的最差表現。

雖然其後華爾街再度企穩,英偉達更在次日收復不少股價,但這場股市震盪,讓中國AI模型「DeepSeek」成為了全球焦點。普遍認為其性能達到世界先進水平,而開發成本則遠低於美國的AI巨頭,因而引發對整個AI產業盈利模式和預期的質疑。

引起熱議的是DeepSeek新近發佈的兩款人工智能模型。2024年12月,DeepSeek發佈V3模型評測成績超越Qwen2.5-72B阿里自研大模型)和Llama 3.1-405BMeta自研大模型)等開源模型,並能與GPT-4oClaude 3.5-SonnetAnthropic自研大模型)等閉源模型相抗衡。

在V3的突破基礎上,2025年1月20日,DeepSeek又發布並開源了DeepSeek-R1模型。在多方測評中,該模型在數學、編程和自然語言推理方面與加州OpenAI領先的O1模型匹敵。根據一項熱門排名,DeepSeek的AI模型已跻身全球前十。隨後,市場對DeepSeek的評價一路走高,其更在蘋果App Store登頂,在美國地區免費應用程式下載排行榜,壓過了最熱門的ChatGPT。

DeepSeek不但性能表現令人驚嘆,其低成本和高效訓練模式也引人重視。DeepSeek此前曾表示,V3模型的訓練基於2048塊英偉達H800型GPU(針對中國大陸市場的低配版GPU)集群上運行55天完成,訓練耗資557.6萬美元,成本效益令人驚訝。

雖然R-1模型的訓練時間仍未有詳盡披露,但「DeepSeek用遠低於ChatGPT的成本達到相同效果」的說法已經開始廣為流傳。

在科技界,DeepSeek引起算法和訓練效能的比較,以及延伸討論開源是否比閉環更鼓勵創新。在政治層面,DeepSeek顛覆中美技術競賽的認知,輿論一方面關注中國人工智能發展是否已「彎道超車」,另一方面亦關注美國科技封鎖政策是否失效,甚至倒逼中國在人工智能更加進取和靈活發展。

然而最重要的衝擊反映在資本市場層面,DeepSeek以開源、低價的定位挑戰人工智能相關股票高企的前提,即訓練大模型需要大量投入,包括堆疊算力和芯片。有分析稱,DeepSeek在次先進的AI芯片上以更低成本的方式訓練出有效的模型,令市場對英偉達一飛衝天的估值產生疑慮。

但DeepSeek是否會令美國AI熱潮出現「擠泡沫」的趨勢,目前仍然言之尚早。

另據英國《金融時報》報導,ChatGPT的開發者OpenAI在1月29日表示,其有證據顯示DeepSeek用ChatGPT模型幫助訓練。報導引述業界人士,指這種被稱為「蒸餾」的做法在小型AI公司訓練模型時「非常常見」,但或使其捲入知識產權爭端。

2025年1月27日,美國紐約納斯達克指數,不少科技股因應 DeepSeek發布最新的AI系統 DeepSeek-V3而股價大幅下跌。攝:Yuki Iwamura/Bloomberg via Getty Images

AI投資基金背景,DeepSeek上年掀降價戰

許多媒體稱DeepSeek為不知名公司,但DeepSeek及其創始人梁文鋒在中國國內並非寂寂無名。

據報道,梁文鋒1985年出生於廣東省湛江市,就讀於浙江大學電子信息工程專業,後獲得信息與通信工程碩士學位。

在2015年,梁文鋒成立了DeepSeek的母公司杭州幻方科技有限公司,致力於通過數學和人工智能進行量化投資。2021年,幻方的資產管理規模突破千億大關,被稱為中國量化私募領域的「四大天王」之一。但同年,因為業績波動,幻方量化關閉全部募集通道,並在12月底致歉投資者,稱「幻方業績的回撤達到歷史最大值,我們對此深感愧疚」。

2023年7月,梁文鋒創辦深度求索DeepSeek,據指團隊成員多為中國名牌大學畢業生。2024年5月,DeepSeek發布DeepSeek-V2模型,因其模型架構與平價一躍成名,價格僅為GPT-4 Turbo的百分之一,開啟了中國大陸的大模型價格戰。其後,智譜 AI、字節、阿里、百度、騰訊等主要大模型廠商迅速跟進,模型API調用價格一再壓低,甚至免費。

集中開源和研究,真實算力儲備成謎

綜合傳媒報道和分析,DeepSeek在中國人工智能業界的位置獨特,沒有急於商業化AI模型,更集中於研究和技術,以及開源和公開。

有業內人士表示,DeepSeek「有相對充裕的卡,沒有融資壓力,前面幾年只做模型不做產品,讓DeepSeek和其他國內大模型公司相比顯得更加單純、聚焦,能夠在工程技術和算法上有所突破。」

梁文鋒曾在少有的公開採訪中表示,過去多年中國公司習慣了拿別人的技術創新做應用變現,Deepseek的出發點不是趁機賺一筆,而是走到技術的前沿,去推動整個生態發展。梁文鋒強調,「中國AI和美國真實的gap(差距)是原創和模仿之差。如果這個不改變,中國永遠只能是追隨者,所以有些探索也是逃不掉的。」

與很多科技公司不同,Deepseek還選擇了開源模式,通過分享其底層代碼和訓練方法,促進其他研究者的合作與創新。主導Meta AI研究的首席科學家楊立昆(Yann Le Cun)認為,DeepSeek不是中國AI超越美國,而是開源模型超越專有模型。

亦有一些聲音認為,在美國對芯片算力的限制下,中國開發的AI就算當前能夠趕上,長期也可能因為芯片限制而面臨困境,因此開源也是儘快擴大影響力,在世界AI產業中佔領更多市場的策略。

DeepSeek的爆紅,源於有限资源的高效利用,但外界亦關注其芯片存量。在2024年的一個訪問中,梁文鋒表示,「我們面臨的問題從來不是錢,而是高階晶片被禁運。」

據報,DeepSeek是中國科技巨企業中唯一一家儲備萬張英偉達A100芯片的公司。而美國人工智能數據公司Scale AI創始人Alexandr Wang則,DeepSeek擁有大約5萬塊英偉達H100芯片,但因美國出口管制措施,他們不能公開談論。惟相關說法未獲得證實。

英偉達回應指,DeepSeek是AI領域的一項卓越進步,展示了如何利用測試時間縮放(Test Time Scaling)技術、廣泛可用的模型以及完全符合出口管制的計算資源來創建新型號。

特朗普稱讚,梁對總理稱芯片是限制

在中美AI競賽之際,Deepseek的崛起尤其令人關注。在1月26日,美國風險投資家Marc Andreessen在X上發帖表示,DeepSeek的R1模型是人工智能的「史普尼克時刻」,即是20世紀50年代末標前蘇聯衛星發射,開啟太空競賽的時刻。

在1月27日,美國總統特朗普稱,DeepSeek「為業界敲響警鐘,美國須極度專注應對競爭。」特朗普又稱讚,DeepSeek取得突破是一件好事,因為不必花費大量金錢來發展大模型。

早前,特朗普與軟銀和OpenAI等機構共同宣布投資5000億美元的「星門計畫」,旨在建設新一代AI基礎設施,鞏固美國在AI領域的領導地位。

在中國,DeepSeek創辦人梁文鋒在1月20日下午成為中國總理李強的座上賓,參加了中國國務院總理座談會。該會議是國務院就《政府工作報告(徵求意見稿)》的座談會,與會者是專家、企業家和教科文衛體等領域代表。

據報梁文鋒對李強表示,儘管中國企業正努力追趕,但美方限制先進芯片出口中國仍是瓶頸。

DeepSeek如日中天,中國是否在「彎道超車」引人熱議。對此,清華大學計算機系副教授劉知遠表示,「AGI新技術還在加速演進,未來發展路徑尚不明確。我們仍在追趕階段,已經不是望塵莫及,但也只能說是望其項背」,「在別人已經探索出來的路上跟隨快跑是相對容易的,接下來我們要面對一團未來迷霧。」

另外,DeepSeek亦引起美國安全方面的討論。一部分批評認為,在六四事件、台灣問題等方面,DeepSeek顯示出了中國政府的嚴格審查。還有一部分聲音則擔憂其開源特點會令中國對全球AI產業擁有巨大的影響力。

在接受CNBC訪問時,美國AI初創公司Perplexity首席執行官Aravind Srinivas表示,DeepSeek是非常創新的產物,反映出中國相關領域的技術成就,也以開源的姿態開始逼迫美國AI公司提高效率、改變思路。但他認為「如果整個美國AI生態系統都依賴於中國的開源模型,那將是非常危險的......人們曾質疑是否應該信任扎克伯格(祖克柏),但現在的問題是,我們是否應該信任中國?」他指DeepSeek雖開源,但或許也有一天「許可證會改變」。

讀者評論 0

會員專屬評論功能升級中,稍後上線。加入會員可閱讀全站內容,享受更多會員福利。
目前沒有評論