DeepSeek引發(fā)的沖擊波仍在持續(xù):不僅多個平臺宣布接入DeepSeek,各個行業(yè)也密集搭上這趟“快車”。盡管DeepSeek通過優(yōu)化算法顯著降低算力需求,但因其高性價比助推AI普及,使得算力需求反而呈現(xiàn)指數(shù)級膨脹。對于國內(nèi)算力產(chǎn)業(yè)而言,DeepSeek的創(chuàng)新帶來了一個可以和英偉達(dá)在生態(tài)上平起平坐的機(jī)會,國產(chǎn)算力迎來一波新發(fā)展機(jī)遇。
DeepSeek持續(xù)“擴(kuò)圈”
一石激起千層浪。短短一個月時間,從科技大廠到政務(wù)部門、從汽車企業(yè)到手機(jī)廠商,各行各業(yè)都在積極擁抱DeepSeek。
2月16日,百度搜索和文心智能體平臺宣布將全面接入DeepSeek。搜索用戶可免費(fèi)使用DeepSeek和文心大模型深度搜索功能,文心智能體平臺的開發(fā)者也將隨時調(diào)用DeepSeek模型創(chuàng)建并調(diào)優(yōu)智能體。
百度并非第一家接入DeepSeek的搜索平臺。近日,部分微信用戶發(fā)現(xiàn),微信搜索已經(jīng)上線“AI搜索”功能,并接入DeepSeek-R1提供的“深度思考”服務(wù)。騰訊方面表示,微信搜一搜在調(diào)用混元大模型豐富AI搜索的同時,已正式灰度測試接入DeepSeek。被灰度到的用戶,可在對話框頂部搜索入口,看到“AI搜索”字樣,點擊進(jìn)入后,可免費(fèi)使用DeepSeek-R1滿血版模型,獲得更多元化的搜索體驗。
同在2月16日,深圳市宣布,基于政務(wù)云環(huán)境面向全市各區(qū)各部門正式提供DeepSeek模型應(yīng)用服務(wù),實現(xiàn)了基于DeepSeek的人工智能政務(wù)應(yīng)用一體化賦能升級。而此前,廣州、呼和浩特、贛州、無錫等地政務(wù)部門也已宣布部署應(yīng)用DeepSeek,推動政務(wù)服務(wù)智能化,涵蓋公文寫作、民意速辦、城市治理等領(lǐng)域,提升政務(wù)處理質(zhì)效,助力智慧城市建設(shè)。
互聯(lián)網(wǎng)頭部應(yīng)用和政務(wù)服務(wù)平臺的接入表明,DeepSeek已經(jīng)觸達(dá)了最廣泛的用戶群體。數(shù)據(jù)顯示,隨著訪問使用量急速上升,DeepSeek已經(jīng)成為目前最快突破3000萬日活躍用戶量的應(yīng)用程序。
不僅如此,包括華為、阿里、百度、騰訊、京東等在內(nèi)的多家云平臺早已宣布接入DeepSeek大模型,吉利、嵐圖、智己、長城、廣汽、長安、奇瑞等約20家車企宣布DeepSeek“上車”,DeepSeek應(yīng)用已覆蓋電信、云計算、金融、汽車、手機(jī)等多領(lǐng)域。
業(yè)界人士認(rèn)為,DeepSeek的快速出圈在于打破了大模型領(lǐng)域“越強(qiáng)越貴”的成本詛咒,以高性價比、高效率實現(xiàn)了大模型的低成本工業(yè)化,而且在通過底層架構(gòu)創(chuàng)新降低成本的同時,以開源策略構(gòu)建生態(tài)護(hù)城河,提供了突破算力限制的可行路徑,也宣告了自ChatGPT引發(fā)新一波人工智能熱潮以來,全球大模型行業(yè)“暴力堆算力”時代的終結(jié),推動了從基礎(chǔ)研究到商業(yè)應(yīng)用的人工智能全產(chǎn)業(yè)鏈變革。
算力需求仍將增長
DeepSeek以更低的成本和算力需求實現(xiàn)了世界一流的模型性能,打破了全球人工智能產(chǎn)業(yè)“堆算力”的路徑依賴,同時也在考問產(chǎn)業(yè)發(fā)展方向:未來是否仍有必要大規(guī)模投資算力?
正如經(jīng)濟(jì)學(xué)家杰文斯所言,技術(shù)進(jìn)步雖然提高了資源的使用效率,但需求的增加常常會導(dǎo)致總消耗量反而增加。業(yè)界專家認(rèn)為,這個在第一次工業(yè)革命時提出的“杰文斯悖論”將同樣應(yīng)驗在大模型時代:瓦特改良的蒸汽機(jī)讓煤炭燃燒更加高效,但結(jié)果卻是煤炭需求飆升,如今DeepSeek將大模型推理成本壓縮了97%,全球的算力需求卻將因其高性價比反而呈現(xiàn)指數(shù)級膨脹。
國際數(shù)據(jù)公司IDC聯(lián)合浪潮信息日前發(fā)布的《2025年中國人工智能計算力發(fā)展評估報告》提出,DeepSeek通過其先進(jìn)的算法優(yōu)化和高效的模型性能,激發(fā)了新的應(yīng)用場景的需求,顯著拉動了數(shù)據(jù)中心、端側(cè)及邊緣計算的應(yīng)用發(fā)展。
天風(fēng)證券研報認(rèn)為,DeepSeek通過技術(shù)創(chuàng)新,降低硬件依賴,縮短訓(xùn)練時間,大幅削減投資、開發(fā)與運(yùn)營成本,讓更多下游應(yīng)用公司有機(jī)會涉足大模型業(yè)務(wù)。同時,開源理念也打破了技術(shù)壁壘,讓開發(fā)者能輕松獲取資源,針對自身業(yè)務(wù)定制開發(fā),助力大模型在各行業(yè)落地。
事實表明,DeepSeek比以往任何一款大模型產(chǎn)品都更快進(jìn)入普通消費(fèi)者的手機(jī)端,也比其他大模型更快落地到開發(fā)者或者企業(yè)端。業(yè)界人士表示,一方面,DeepSeek的高濃度技術(shù)創(chuàng)新,充分發(fā)揮了硬件有效算力,說明穩(wěn)定可靠的算力底座仍是模型創(chuàng)新的關(guān)鍵;另一方面,很多中小企業(yè)都能用得起這樣的大模型,訓(xùn)練成本的下降可能會暫時減少對算力的需求,但大模型變得更加經(jīng)濟(jì),會使原本因為模型成本太高而不打算使用大模型的企業(yè)加入進(jìn)來,從而增加了算力需求。
向來嗅覺敏銳的資本市場聞風(fēng)而動。早在蛇年春節(jié)前,DeepSeek引發(fā)的上漲行情就開始發(fā)酵,算力全產(chǎn)業(yè)鏈迎來一波上漲行情,多家券商研報提醒投資者關(guān)注“算力短缺”帶來的產(chǎn)業(yè)鏈機(jī)遇。
算力產(chǎn)業(yè)專家表示,未來大模型將呈現(xiàn)“技術(shù)摸高+工程創(chuàng)新”并行發(fā)展趨勢,算力需求仍將持續(xù)增長。其中,“技術(shù)摸高”是指人工智能頭部企業(yè)將堅定投入預(yù)訓(xùn)練基礎(chǔ)模型創(chuàng)新,關(guān)注高效、穩(wěn)定、開放的算力底座,極致性能、穩(wěn)定可靠的算力集群,以及深度開放的算力平臺和生態(tài);“工程創(chuàng)新”是指DeepSeek這類新范式降低了后訓(xùn)練和模型蒸餾的門檻,企業(yè)更關(guān)注便捷、易用、高性價比的算力平臺,兼顧成本與性能的蒸餾、微調(diào)方案,以及便捷的部署和敏捷業(yè)務(wù)上線。
國產(chǎn)算力迎新機(jī)遇
面向DeepSeek熱潮帶來的應(yīng)用需求,國內(nèi)算力產(chǎn)業(yè)積極投入DeepSeek系列模型適配,進(jìn)一步強(qiáng)化面向大模型的國產(chǎn)軟硬件支撐能力,加速推動軟硬件協(xié)同創(chuàng)新。
2月4日,DeepSeek系列大模型正式上線昇騰社區(qū),開發(fā)者可一鍵獲取DeepSeek系列模型,并支持昇騰硬件平臺上開箱即用。
事實上,作為面向“端、邊、云”的全場景AI基礎(chǔ)設(shè)施,昇騰早在DeepSeek模型發(fā)布之初就已深度參與其中。2024年12月26日,DeepSeek-V3發(fā)布即支持昇騰,用戶可在昇騰硬件和MindIE推理引擎上實現(xiàn)高效推理。今年春節(jié)以來,多家企業(yè)相繼官宣基于昇騰成功上線DeepSeek相關(guān)服務(wù)。
三家基礎(chǔ)電信企業(yè)悉數(shù)全面接入DeepSeek開源大模型:移動云基于昇騰生態(tài)全版本、全尺寸、全功能支持DeepSeek系列產(chǎn)品,全面上線13個中國移動智算中心;電信天翼云“息壤”智算平臺從昇騰硬件、推理引擎到模型服務(wù)支持DeepSeek-R1滿血版至輕量化蒸餾模型靈活部署;聯(lián)通云基于聯(lián)合創(chuàng)新和自研加速引擎,構(gòu)建昇騰智算底座,與DeepSeek-R1模型深度對接。
此外,AI基礎(chǔ)設(shè)施企業(yè)潞晨科技推出了基于昇騰算力的DeepSeek R1系列推理API及云鏡像服務(wù),硅基流動上線了基于華為云、昇騰云服務(wù)的DeepSeek-V3、DeepSeek-R1;算力系統(tǒng)軟件服務(wù)商清程極智也完成了昇騰DeepSeek-R1滿血版適配……據(jù)介紹,當(dāng)前已有超過30家軟硬件企業(yè)基于昇騰推出DeepSeek一體機(jī)方案,超過80家企業(yè)基于昇騰上線DeepSeek,昇騰已助力20余省市AICC(公共算力服務(wù)平臺)啟動部署DeepSeek系列模型,全國超70%區(qū)域可獲取服務(wù)。
據(jù)悉,在訓(xùn)練方面,昇騰是目前國內(nèi)業(yè)界唯一從預(yù)訓(xùn)練到微調(diào)以及強(qiáng)化學(xué)習(xí)能力全流程適配的DeepSeek的AI訓(xùn)練平臺;昇思MindSpore支持DeepSeek-V3預(yù)訓(xùn)練、微調(diào)、推理全流程開箱即用、實現(xiàn)天級復(fù)現(xiàn)。在推理方面,DeepSeek小專家創(chuàng)新架構(gòu),帶來通信耗時及專家負(fù)載不均挑戰(zhàn),昇騰雙機(jī)并行推理+專家負(fù)載均衡,助力DeepSeek模型推理吞吐性能提升超30%。此外,昇騰提供AI開發(fā)全流程服務(wù),幫助企業(yè)周級部署DeepSeek,實現(xiàn)快速上線。
業(yè)界人士認(rèn)為,對于國內(nèi)算力產(chǎn)業(yè)而言,現(xiàn)在出現(xiàn)了一個巨大的可以和英偉達(dá)在生態(tài)上平起平坐的機(jī)會。此前,全球算力生態(tài)的錨點在英偉達(dá)的CUDA體系,如今DeepSeek繞過這一錨點,所有廠商站在了同一起跑線上,國內(nèi)算力產(chǎn)業(yè)迎來了新的發(fā)展機(jī)遇。誰能在此時基于更新的生態(tài)錨點快速構(gòu)建出新的支持能力,支持好客戶,支持好伙伴,支持好開發(fā)者,誰就可能迎來新發(fā)展甚至是更高速的發(fā)展。