DeepSeek因為對美股的“暴擊”迅速站上市場暴風眼,這只“來自東方的神秘力量”引發(fā)海內外空前的高度關注。DeepSeek的爆火,不僅是中國AI技術的里程碑,更是全球AI行業(yè)的一次“范式革命”。
這種關注是把雙刃劍。在這個過程中,DeepSeek迅速經歷自身宕機到被攻擊的諸多事件。但這并沒有妨礙其最新開源模型的發(fā)布。
除夕,DeepSeek發(fā)布分別名為Janus-Pro等開源多模態(tài)AI模型,文生圖測試優(yōu)于OpenAI。有科技圈人士表示,這“絕對是AI行業(yè)最難眠的一夜了”。
從宕機到被攻擊
DeepSeek的輿情熱度崛起,幾乎是一夜之間。從力壓ChatGPT,登頂美區(qū)App Store 免費榜,到國內 App Store 免費榜,均樣位居第一。
熱度是把雙刃劍。昨晚至今日,DeepSeek連續(xù)發(fā)布聲明稱:近期 DeepSeek 線上服務受到大規(guī)模惡意攻擊,注冊可能繁忙,請稍等重試。已注冊用戶可以正常登錄,感謝理解和支持。
就在一日前,新模型發(fā)布后的訪問量激增,一度讓DeepSeek閃崩,但問題都在數分鐘內得到解決。AI界上一次出現宕機情況,還是月之暗面的Kimi出圈爆火之時。
DeepSeek爆火的原因,在于其能與OpenAI“掰手腕”。
當DeepSeek-V3和R1橫空出世,全球AI界仿佛被投下了一顆“技術核彈”。推出后不久,R1就憑借其性價比、開源及推理能力的提升等方面獲得了廣泛關注。DeepSeek表示,最新的AI模型可以與OpenAI的ChatGPT媲美,且開發(fā)成本遠低于競爭產品。海外AI界評論,這是大模型行業(yè)的最大“黑馬”,在外網被不少人稱為“神秘的東方力量”。
這股力量在資本市場掀起巨浪。當地時間1月27日,美國股市開盤即大幅下跌,科技板塊尤為慘重。尤其是英偉達,1月27日美股收盤,英偉達股價暴跌17%。
對此,英偉達方面回應稱:“DeepSeek是一項卓越的人工智能進展,也是測試時擴展的絕佳范例。DeepSeek的研究展示了如何運用該技術,借助廣泛可用的模型以及完全符合出口管制規(guī)定的算力,創(chuàng)建新模型。推理過程需要大量英偉達GPU和高性能網絡。如今我們有三條擴展定律:持續(xù)適用的預訓練和后訓練定律,以及新的測試時擴展定律?!?/p>
根據初步統(tǒng)計,隨著英偉達股價的暴跌,黃仁勛的身家大幅縮水210億美元。
此外,還有報道表示,美國總統(tǒng)特朗普在佛羅里達州邁阿密舉行的共和黨會議上表示,中國人工智能初創(chuàng)公司DeepSeek的崛起應當為美國企業(yè)敲響“警鐘”,美國公司“需要專注于競爭以贏得勝利。”
又推新模型
1月28日凌晨,人工智能社區(qū)Hugging Face顯示,DeepSeek剛剛發(fā)布了開源多模態(tài)人工智能模型Janus-Pro,擁有10億和70億參數規(guī)模。其中Janus-Pro-7B在GenEval和DPG-Bench基準測試中擊敗了OpenAI的DALL-E 3和Stable Diffusion。
這個模型既能讓AI讀圖(基于SigLIP-L),又能讓AI生圖(借鑒LlamaGen),分1.5B和7B兩個大小。對比來看,GPT-4o的圖片生成多模態(tài)模型至今沒開放。
主流市場分析認為,作為中國人工智能初創(chuàng)公司的DeepSeek,其最新突破動搖了美國科技行業(yè)的“無敵”地位。
那么,DeepSeek究竟厲害在哪?低成本、高性能、開源是外界提到的高頻詞。
實際上,在推出后不久,R1就憑借其開源的性質、大幅下降的售價和訓練成本獲得了廣泛關注。作為一款開源模型,R1在數學、代碼、自然語言推理等任務上的性能能夠比肩OpenAI o1模型正式版,并采用MIT許可協議,支持免費商用、任意修改和衍生開發(fā)等。
同時,R1的預訓練費用只有557.6萬美元,在2048塊英偉達H800 GPU(針對中國市場的低配版GPU)集群上運行55天完成。
這是個什么概念?557.6萬美元,僅是OpenAIGPT-4o模型訓練成本的不到十分之一。因此,這有望引發(fā)行業(yè)重估大模型成本——有一種分析認為,大模型和算力這兩個親兄弟,有望從此分道揚鑣。
據統(tǒng)計,2024年1—8月,微軟、Meta、谷歌、亞馬遜總計向AI數據中心投入1250億美元,包括AI資本支出、總數據中心運營成本,現金運營費用、軟件、折舊和電費也納入統(tǒng)計。預計2024年美國四大科技巨頭全年投入約2180億美元。而隨著DeepSeek的發(fā)布,會否引發(fā)市場對科技巨頭越來越多AI投入的質疑,值得關注。
量化基金轉型“AI拼多多”
在國內7家頭部的大模型創(chuàng)業(yè)公司當中,DeepSeek可以說是最不顯山不露水的一家。另一方面,雖然市場是從最近才開始突然關注DeepSeek,但是它卻是中國AI界的老面孔。
最受關注的事件之一,就是去年引爆的“大模型價格戰(zhàn)”。
去年5月,字節(jié)跳動宣布旗下豆包主力模型,輸入價格為0.0008元/千Tokens。6天后,阿里巴巴宣布通義千問主力模型大幅降價,主力模型Qwen-Long,API輸入價格從0.02元/千tokens降至0.0005元/千tokens,直降97%。此后,百度跳過降價,直接宣布,旗下大模型文心一言的兩款入門級產品ERNIE Speed和ERNIE Lite免費。大模型價格戰(zhàn)戰(zhàn)火點燃。
雖然市場普遍關注大廠,但實際上,DeepSeek與智譜AI的入門級大模型降價得更早。去年5月7日DeepSeek就曾宣布將旗下大模型DeepSeek-V2的價格降到了每百萬token輸入1元、輸出2元(32K上下文)。
對此,幻方創(chuàng)始人梁文鋒曾回應稱,“大廠的模型成本比DeepSeek高很多,所以DeepSeek沒想到會有人虧錢做這件事,最后就變成了互聯網時代的燒錢補貼的邏輯?!?/p>
再往前回溯,DeepSeek被視為量化基金轉型人工智能的典型代表。
在DeepSeek背后是量化私募巨頭幻方,也是大廠外唯一一家儲備上萬張英偉達 A100芯片的公司。幻方總部位于杭州,專注于利用數學、統(tǒng)計學和計算機技術進行金融市場的量化分析和交易。相當一段時間內,還曾受到負面輿情的困擾。
此后,DeepSeek-V2發(fā)布,主流判斷認為,幻方量化轉型為人工智能先驅,其超低價格甚至引發(fā)了國內大模型的價格戰(zhàn),DeepSeek也被迅速冠以“AI界拼多多”之稱。
無論是DeepSeek的橫空出世,還是后來的價格戰(zhàn)戰(zhàn)火點燃,AI界人士普遍認為,這反映出百度和阿里巴巴等科技巨頭,盡管在生成式人工智能領域已處于領先地位,但仍需要面對著來自新玩家的激烈競爭。
從目前來看,這種轉型不僅仍在推進,而且在這一年多時間里,DeepSeek進展迅速。
更多故事或啟幕
“投身于探索 AGI 的本質,不做中庸的事,帶著好奇心,用最長期的眼光去回答最大的問題”,這是DeepSeek官方微信號寫下的簡介。
對于DeepSeek大火,e公司記者嘗試聯系通義千問、文心一言、騰訊等大廠,均表示“未有回應?!庇行﹦t對記者回復,會及時關注。
出圈后的DeepSeek,目前依然低調。
從產業(yè)生態(tài)來看,不少大模型廠商都已開啟投放買量,以期早日實現商業(yè)化變化。不過,記者的通過多種方式試圖聯系DeepSeek,但都未成功。多信源透露,其至今尚未有公關團隊。
不過這反而增加了市場討論的熱情。從昨天開始,各科技群中,關于DeepSeek的討論不絕于耳。有人問:“今年春晚,(DeepSeek)會不會露下臉?
業(yè)內普遍認為,DeepSeek的進展顯示出,美國的領先優(yōu)勢正在縮小,各國應該采取合作方式建設先進AI,而不是在AI領域進行“軍備競賽”。
不過也有觀點認為,客觀來看,雖然DeepSeek勢頭驚人,但其技術目前仍落后于OpenAI和谷歌。爆火出圈后,DeepSeek未來可能將面臨更多的壓力和挑戰(zhàn)。
但不可否認的是,衍生影響仍將蔓延。有AI界人士接受e公司記者采訪時預判,不止是中國,世界上很多AI公司本來因為大模型訓練的高昂成本,已經放棄了自研大模型?,F在看到DeepSeek的成功,未來有望繼續(xù)研究起來。
從這個意義來看,DeepSeek的爆火,不僅是中國AI技術的里程碑,更是全球AI行業(yè)的一次“范式革命”。
從更廣闊的視野來看,DeepSeek代表了中國“硬核技術創(chuàng)新”的一種敘事。而除了DeepSeek之外,市場還在關注更多類似的中國科技硬核力量。隨著DeepSeek的爆火,包括人形機器人公司宇樹科技等,也都在被市場寄予更多期待。