橫空出世的DeepSeek 令美絕望的中國震撼 文:悠然

昨晚(1月27日)英偉達開市後大跌15%,所有科技類股票都一瀉千里,原因只有一個,中國的開源AI DeepSeek用落後的芯片,1%的成本實現了與所有市面上大模型同等的效力。

美股圖
美股圖

在過去48小時內,我幾乎都在X上瀏覽各種關於DeepSeek的消息,在英語世界,基本上是壓倒性正面評價,還有一些是雖在撥冷水但卻反見DeepSeek的強大,如CNBC訪問了Scale AI的創辦人Alexandr Wang,王先生說:「按照我的理解,DeepSeek至少有5萬張英偉達H100顯卡,只不過因爲制裁的原因,不方便說而已。」但他的所謂「理解」卻沒有任何證據,要知道5萬張H100顯卡總價就至少15億美元,約一百多億人民幣。一個小小的DeepSeek公司,能拿出這麼多錢嗎?就算有錢,美國是禁運H100的,中國大陸根本沒貨,DeepSeek也很難買到。

Alexandr Wang
Alexandr Wang

如根據DeepSeek自己的說法,訓練模型只用了2048張H800顯卡(H800也是H100的閹割版),H800價格也只有H100(3萬美元)的三分之一,正因爲用了低配的硬件,才體現了Deep Seek的創新價值。

在DeepSeek出現之前,訓練頂級AI大模型的成本極其高昂。如走在最前的OpenAI等美國巨頭,需要擁有數萬個H100顯卡的大型數據中心。每塊最便宜也要3萬美元,總價要十幾億美元,而且耗電量驚人,需要一整座發電廠提供電力,他們僅在訓練模型上,就要花費數億美元。

Deep Seek突然出現,且只花 500 萬美元就能做同樣的事,在許多任務上,甚至擊敗了 GPT-4 和 Claude。

DeepSeek是怎麼做到的?我在看完一大堆論文並勉強明白後,大約過程是這樣:傳統模型是所有1.8萬億參數始終處於活動狀態,而DeepSeek的6,710億個參數中,一次只激活370億。這就像擁有一支龐大的團隊,但只召集每個任務真正需要的專家。

結果訓練成本是數億美元對500萬美元;100000塊GPU對2000塊GPU。

更使美國人絕望的,是DeepSeek是開源的,近乎免費。任何人都可以使用,代碼也是公開的。

DeepSeek打破了「只有大型科技公司才能涉足人工智能」的神話。你不再需要價值數十億美元的數據中心,而是幾塊遊戲顯卡,就可以做到。

大家更要留意,DeepSeek不是一個國家項目,而是一個市場行爲,DeepSeek顯示的是,中國的普通人,憑藉自身的聰明才智,和有限的物質條件(因爲美國的制約,他們得不到最先進的硬件資源),就可以真正發揮智慧,直接衝上去和佔據壓倒性硬件優勢的OpenAI一較高下,這應該是整件事中最叫人震憾的。

這個時候,不禁令我想到拜登政府的「小院高牆」,妄圖以禁用人工智能芯片來拖慢中國,全成了做夢了!

還有谷歌、Meta等美國大公司,數百億美元投進去,還不如最多千萬美元成本的DeepSeek,這些美國大公司突然發現,AI技術沒有任何護城河!

事實上,我一再說一個道理:金融戰-炒概念圈錢,中國遠不如美國;但實業戰-辦應用生產,美國也遠不如中國。不管美國搞出多新奇的東西,最後面弄出最好的技術、最成熟的應用和最賺錢的產業,全在中國!

美國人想把AI大模型圈起來賺租金的,想用高端芯片「擁兵自重」的,想控制AI技術讓美國再次偉大的,想接着炒概念圈錢的,這次都會破產的。

中國一個小團隊,以百分之一不到的成本,戳破了美國泡沫,而且這還是一個開始,我看越往後這種「中國震撼」就越多。

所以,美國股市上和AI相關的股票必然大跌,一個中國公司,使美股失去兩萬億美元市值。這個過年煙花,是我見過最亮眼的。

筆者和DeepSeek 對談
筆者和DeepSeek 對談

文:悠 然

學研社成員、傳媒人、經濟人,從事媒體編、寫、評、教工作達二十年,擅長發掘繁雜時事問題背後的故事,並把過多的好奇投入到中國近代史研究中,現爲自由撰稿人。

*作者文章觀點,不代表堅料網立場

最新文章