熱度突然飆升!
這個(gè)周末,無論是科技界,還是投資界,突然又都在談?wù)揇eepSeek。本周,中國人工智能公司DeepSeek發(fā)布其R1模型(DeepSeek R1),硅谷一片緊張。在第三方基準(zhǔn)測(cè)試中,其表現(xiàn)優(yōu)于OpenAI、Meta和Anthropic等美國領(lǐng)先人工智能公司。
從其性能上看,DeepSeek的確非常優(yōu)秀。據(jù)券商中國記者親測(cè),單論文學(xué)素養(yǎng)、文字組織能力,已經(jīng)是秒殺一眾文字工作者的存在。一種職業(yè)危機(jī)感油然而生。而從其閱讀總結(jié)能力、數(shù)理邏輯處理能力來看,亦堪稱卓越。
關(guān)鍵是,該款大模型的成本優(yōu)勢(shì)極為明顯。因此,市場(chǎng)亦將英偉達(dá)周五的大跌歸因于DeepSeek的火爆。市場(chǎng)認(rèn)為,DeepSeek R1的成功可能削弱了市場(chǎng)對(duì)英偉達(dá)AI芯片需求的預(yù)期。
DeepSeek的沖擊
我國人工智能研究人員實(shí)現(xiàn)了許多人認(rèn)為遙不可及的目標(biāo):一個(gè)免費(fèi)的開源人工智能模型,其性能可以匹敵甚至超過OpenAI最先進(jìn)的推理系統(tǒng)。更令人驚奇的是他們?nèi)绾巫龅竭@一點(diǎn):讓人工智能通過反復(fù)試驗(yàn)自學(xué),就像人類學(xué)習(xí)一樣。
春節(jié)之前的這一周,我國人工智能公司DeepSeek發(fā)布其R1模型,硅谷一片緊張。在第三方基準(zhǔn)測(cè)試中,其表現(xiàn)優(yōu)于OpenAI、Meta和Anthropic等美國領(lǐng)先人工智能公司。
性能數(shù)據(jù)令人印象深刻。在AIME2024數(shù)學(xué)基準(zhǔn)測(cè)試中,DeepSeekR1的成功率達(dá)到79.8%,超越了OpenAI的o1推理模型。在標(biāo)準(zhǔn)化編碼測(cè)試中,它表現(xiàn)出“專家級(jí)”的性能,在Codeforces上獲得了2029Elo評(píng)級(jí),并超越了96.3%的人類競(jìng)爭對(duì)手。
但DeepSeek R1真正與眾不同之處在于它的成本——或者說成本很低。該模型每百萬個(gè)token的查詢成本僅為0.14美元,而OpenAI的成本為7.50美元,便宜了98%。與專有模型不同,DeepSeek R1的代碼和訓(xùn)練方法在MIT許可下完全開源,這意味著任何人都可以獲取、使用和修改該模型,而不受限制。
它展示的卓越推理能力,正在“突破開源AI的界限”的特點(diǎn),讓硅谷措手不及,并輕而易舉地成為了這一周科技界最受關(guān)注的熱點(diǎn)。風(fēng)頭甚至蓋過了達(dá)沃斯經(jīng)濟(jì)論壇、TikTok的不確定性以及特朗普總統(tǒng)上任。
扎克伯格急了
針對(duì)人工智能差距快速縮小,Meta創(chuàng)始人兼CEO扎克伯格呼吁美國政府加緊封鎖。他表示,DeepSeek很先進(jìn),中美AI差距非常小。
扎克伯格近日表示,我們應(yīng)該希望美國的模型能贏,中國正在全力沖刺。如果將來有一個(gè)開源模型能被全世界廣泛使用,我們希望它是一個(gè)美國模型。
如果美國政府能夠更多地支持美國公司,而不是在每個(gè)環(huán)節(jié)都拖后腿,那就更好了。美國科技行業(yè)現(xiàn)在確實(shí)是領(lǐng)先的,所以政府偶爾添點(diǎn)麻煩,美國科技行業(yè)也許依然能保持領(lǐng)先。但我覺得政府很容易把這種領(lǐng)先地位當(dāng)成理所當(dāng)然的事。實(shí)際上,這是一場(chǎng)差距很小的競(jìng)爭,我們需要支持。政府不能成為阻礙我們實(shí)現(xiàn)目標(biāo)的力量,而是該幫助我們。DeepSeek發(fā)布幾天后,Meta計(jì)劃在2025年投入超過600億美元,加大對(duì)人工智能的投入。
但對(duì)于Meta的首席人工智能科學(xué)家Yann LeCun來說,DeepSeek成功的最大收獲不是來自中國競(jìng)爭對(duì)手的加劇威脅,而是保持人工智能模型開源的價(jià)值,以便任何人都能受益。LeCun在社交媒體Threads上的一篇文章中表示,并不是中國的人工智能“超越了美國”,而是“開源模型正在超越專有模型”。
DeepSeek R1本身是開源的,Meta的Llama也是如此。OpenAI最初是一家開源人工智能公司,其使命是創(chuàng)造造福全人類的技術(shù),但最近已轉(zhuǎn)向閉源。LeCun表示DeepSeek“受益于開放研究和開源”。“他們想出了新的辦法,并在其他人的工作基礎(chǔ)上加以實(shí)現(xiàn)。由于他們的工作成果已發(fā)表并開源,因此每個(gè)人都可以從中受益?!盠eCun說“這就是開放研究和開源的力量。”
支持開源的人認(rèn)為,開源讓技術(shù)得以快速、民主地發(fā)展,因?yàn)槿魏稳硕伎梢孕薷暮椭匦掳l(fā)布代碼。另一方面,支持閉源模式的人則認(rèn)為閉源模式更安全,因?yàn)榇a是保密的。OpenAI首席執(zhí)行官Sam Altman在去年11月Reddit的AMA上表示,閉源方法為他的公司提供了“一種更容易達(dá)到安全門檻的方法”。不過,他補(bǔ)充說,“希望我們將來能開源更多的東西。”
英偉達(dá)受沖擊?
另一類著急的人可能是英偉達(dá)的多頭。周五收盤,英偉達(dá)股價(jià)大跌超3%,盤后繼續(xù)跌0.42%。
市場(chǎng)認(rèn)為,DeepSeek R1的成功可能削弱了市場(chǎng)對(duì)英偉達(dá)AI芯片需求的預(yù)期。因?yàn)镈eepSeek似乎以極低的成本構(gòu)建了一個(gè)突破性的人工智能模型,并且無需使用尖端芯片。這讓人質(zhì)疑投入芯片行業(yè)的數(shù)千億美元資本支出的實(shí)際效用。
DeepSeek僅用2048顆英偉達(dá)H800GPU和560萬美元,就訓(xùn)練出6710億參數(shù)的開源大模型,這只是OpenAI和谷歌訓(xùn)練同等類型模型花費(fèi)的一小部分。加州大學(xué)伯克利分校人工智能政策研究員里特維克·古普塔表示,DeepSeek最近發(fā)布的模型表明,“沒有阻礙人們獲取人工智能能力的壕溝”。他說:“訓(xùn)練模型第一人必須花費(fèi)大量資源才能實(shí)現(xiàn)目的,但跟進(jìn)者可用更少的費(fèi)用且以更快的速度實(shí)現(xiàn)目的?!?/p>
另一方面,蘋果研究員Awni Hannun提到,人們可以在Apple Mac上本地運(yùn)行該模型的量化版本。傳統(tǒng)上,由于與英偉達(dá)的CUDA軟件不兼容,蘋果設(shè)備在AI方面一直較弱,但這種情況似乎正在改變。例如,AI研究員Alex Cheema在利用8臺(tái)Apple Mac Mini設(shè)備共同運(yùn)行后能夠運(yùn)行完整模型,這仍然比運(yùn)行目前最強(qiáng)大的AI模型所需的服務(wù)器便宜。也就是說,用戶可以在Apple Mac上運(yùn)行更輕量的DeepSeek R1版本,并且獲得良好的準(zhǔn)確度和效率。