DeepSeek,繼續(xù)在全球刷屏!
2月1日,#DeepSeek在美商標被梁文鋒校友搶注#的話題沖上微博熱搜。據(jù)新華每日電訊援引TC報道,一家總部位于美國特拉華州的名稱為Delson Group的公司申請了DeepSeek商標。報道稱,Delson Group的首席執(zhí)行官兼創(chuàng)始人名為Willie Lu,后者與DeepSeek創(chuàng)始人梁文鋒畢業(yè)于同一所大學——浙江大學。
另外,據(jù)華為云官方公眾號2月1日消息,DeepSeek-R1開源后引發(fā)全球用戶和開發(fā)者關(guān)注。經(jīng)過硅基流動和華為云團隊連日攻堅,現(xiàn)在,雙方聯(lián)合首發(fā)并上線基于華為云昇騰云服務(wù)的DeepSeekR1/V3推理服務(wù)。
值得關(guān)注的是,最近幾天,DeepSeek的熱度居高不下。日前,英偉達、微軟、亞馬遜等AI巨頭紛紛宣布,已接入DeepSeek。此外,或許是迫于DeepSeek帶來的壓力,OpenAI緊急上線新一代推理模型o3-mini,并首次向ChatGPT免費用戶開放推理模型。
國泰君安指出,DeepSeek-R1以MIT License完全開源模型權(quán)重,并允許商用模型蒸餾,為開發(fā)者提供了二次創(chuàng)新的自由空間。這一策略推動中國首次在通用大模型開源領(lǐng)域占據(jù)技術(shù)制高點,增強全球AI 話語權(quán)。同時,開源生態(tài)可能加速行業(yè)技術(shù)路線趨同,通用大模型因同質(zhì)化加劇競爭,只有擁有真正領(lǐng)先技術(shù)的企業(yè)才能在這種趨勢中留存。因此,此次國產(chǎn)開源模型的突破有望重塑全球AIGC技術(shù)路線及產(chǎn)業(yè)格局。
在美商標被梁文鋒校友搶注
據(jù)新華每日電訊援引TC報道稱,近日,中國人工智能公司 DeepSeek成為大規(guī)模網(wǎng)絡(luò)攻擊的目標?,F(xiàn)在,該公司似乎又面臨新的麻煩:美國商標糾紛。另一家公司申請了DeepSeek商標:一家總部位于特拉華州的公司,名稱為Delson Group Inc.
Delson Group 聲稱,它自2020年初以來一直在銷售DeepSeek品牌的 AI 產(chǎn)品。其首席執(zhí)行官兼創(chuàng)始人名為 Willie Lu。Willie Lu與 DeepSeek 創(chuàng)始人梁文鋒畢業(yè)于同一所大學——浙江大學。
DeepSeek,全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,成立于2023年7月17日,是一家創(chuàng)新型科技公司,專注于開發(fā)先進的大語言模型(LLM)和相關(guān)技術(shù)。
DeepSeek在2024年12月26日推出V3(對標GPT4o),因其顯著的性能,用戶迅速開始增長,同時在1月20日發(fā)布R1(對標GPT-o1)后,進一步出圈。根據(jù)點點數(shù)據(jù),從DeepSeek在美國下載排名從1月22日的201名,迅速在1月27日登頂?shù)谝幻桓鶕?jù)七麥數(shù)據(jù),截至1月30日,DeepSeek在168個國家位居下載榜第一名。
1月24日,著名投資公司A16z的創(chuàng)始人馬克·安德森發(fā)文稱,Deepseek-R1是他見過的最令人驚嘆、最令人印象深刻的突破之一,而且還是開源的,它是給世界的一份禮物。最具煽動性的評價來自ScaleAI創(chuàng)始人亞歷山大·王(AlexandrWang)。他說:過去十年來,美國可能一直在AI競賽中領(lǐng)先于中國,但DeepSeek的AI大模型發(fā)布可能會“改變一切”。
AI巨頭紛紛接入DeepSeek
1月31日,英偉達(NVIDIA)宣布,NVIDIA NIM已經(jīng)可以使用DeepSeek-R1。英偉達官網(wǎng)當天發(fā)布文章指出,DeepSeek-R1是具備最先進推理能力的開放模型,比起直接提供響應(yīng),像DeepSeek-R1這樣的推理模型,會對查詢進行多次推理處理,使用連鎖思維、共識和搜尋方法來生成最佳答案。
上述文章寫道,為了幫助開發(fā)者安全地試驗這些功能,并構(gòu)建自己的專門代理,DeepSeek-R1模型現(xiàn)已作為NVIDIA NIM微服務(wù)預(yù)覽版上線使用。
報道稱,DeepSeek先前橫空出世重創(chuàng)美國科技股,一度影響英偉達股價重挫17%,引發(fā)討論。英偉達先前也發(fā)聲,指DeepSeek的進步,代表了英偉達芯片對于內(nèi)地市場的可用性,而未來,DeepSeek會需要更多英偉達芯片滿足服務(wù)的需求。
另據(jù)參考消息援引臺灣東森新聞網(wǎng)報道,近日,與OpenAI是密切合作伙伴的微軟宣布,目前已將DeepSeek-R1正式納入Azure AI Foundry,成為該企業(yè)級AI服務(wù)平臺的一部分。
微軟作為OpenAI的最大股東,長期資助OpenAI之余,還深度整合其AI技術(shù),因此將DeepSeek-R1正式納入的消息曝光后,外界十分關(guān)注微軟為何在OpenAI對DeepSeek進行調(diào)查的同時,仍決定將R1模型納入其AI服務(wù)。
微軟強調(diào),DeepSeek-R1模型已通過“嚴格的紅隊測試與安全評估”,并經(jīng)歷“模型行為自動化檢測與廣泛的安全審查,以降低潛在風險”。
微軟也在聲明中提到,后續(xù)微軟仍會持續(xù)評估DeepSeek-R1模型,并可能進行一定程度的調(diào)整與優(yōu)化,以提升其準確度及審查機制。
1月31日,亞馬遜云科技也宣布,客戶現(xiàn)已可以在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1模型。此外,客戶還可以通過Amazon EC2、Amazon SageMaker AI,使用Amazon Trainium和Amazon Inferentia部署DeepSeek-R1-Distill。
OpenAI首次向免費用戶開放推理模型
DeepSeek的爆火,使得全球在AI領(lǐng)域的競爭進一步白熱化。當?shù)貢r間1月31日,OpenAI正式上線競品推理模型o3-mini,并首次向免費用戶開放推理模型。
OpenAI介紹稱,o3-mini支持開發(fā)者調(diào)整“AI推理努力程度”分為低、中、高三個級別。這種靈活性使得o3-mini可以在面對難題時“更努力思考”,而需要效率時優(yōu)先考慮回應(yīng)速度。
據(jù)OpenAI披露,在2024年美國數(shù)學邀請賽(AIME 2024)的測試中,低推理努力的o3-mini準確率(60%)與o1-mini差不多,但速率更快;而在中等努力下,o3-mini準確率能夠提升到79.6%,與o1模型相當。在最高努力水平時,o3-mini的準確率則能進一步提升至87.3%。在博士級科學問題(GPQA Diamond)方面,三種努力程度模型的準確率分別為70.6%、76.8%和79.7%。開發(fā)者可根據(jù)場景需求,靈活選擇低、中、高三級推理強度,使模型在應(yīng)對復(fù)雜挑戰(zhàn)時能“深度思考”,或在需要快速響應(yīng)時優(yōu)先保證速度。
ChatGPT Plus、Team及Pro用戶即日(1月31日)可體驗o3-mini,企業(yè)用戶將在一周后獲得訪問權(quán)限。即日(1月31日)起,免費版用戶也可通過消息編輯器選擇“推理”模式或重新生成回復(fù)來試用o3-mini,這是ChatGPT首次向免費用戶開放推理模型。
在OpenAI發(fā)布新模型o3-mini后,麻省理工知名AI研究科學家、著名科技播客主持人評價該模型稱,OpenAI的o3-mini是個不錯的模型,DeepSeek的R1性能和它差不多,但價格更便宜,且能展示推理過程。更好的模型會不斷出現(xiàn)(很期待o3 Pro 面世),但 “DeepSeek 時刻” 意義非凡。5年后人們?nèi)詴懹涍@一偉大時刻,是科技史上的關(guān)鍵節(jié)點,部分原因是其地緣政治影響,當然還有諸多其他緣由。
機構(gòu):DeepSeek重構(gòu)大模型生態(tài)
DeepSeek日前發(fā)布其最新開源模型DeepSeek-R1,用較低的成本達到了接近于OpenAI開發(fā)的GPT-o1的性能。這一進展破解了全球人工智能產(chǎn)業(yè)長期以來“堆算力”的路徑依賴,其影響還波及了資本市場。
從定價看,DeepSeek-R1不僅開源,API(接口)價格還明顯低于GPT-o1。DeepSeek-R1輸入(緩存命中)、輸出定價分別為每百萬tokens 1元、6元,低于GPT-o1的55元、438元,具備性價比優(yōu)勢。
國際投行摩根士丹利表示,“更大(的模型)不再等于更聰明”,DeepSeek通過顯著提高數(shù)據(jù)質(zhì)量和改進模型架構(gòu),展示了一條與之前大模型不同的高效訓練途徑。摩根士丹利說,DeepSeek的模型現(xiàn)在低成本優(yōu)勢突出,與國際知名大模型相比,其成本大約低了一個數(shù)量級。
國泰君安指出,DeepSeek-R1以開源、高性能及低成本API對標OpenAI o1。其蒸餾模型的優(yōu)異表現(xiàn)將支持消費電子、智能駕駛等終端AI的部署,開源策略將重整通用模型競爭格局,大模型的商業(yè)化落地將在DeepSeek 的低價API支持下加速,未來垂類應(yīng)用也有望加速創(chuàng)新迭代。該券商表示,R1在后訓練階段通過大規(guī)模強化學習技術(shù),在極少標注數(shù)據(jù)下提升推理能力,驗證了算法優(yōu)化的高效性。這一技術(shù)突破打破了海外企業(yè)在復(fù)雜任務(wù)上的技術(shù)壟斷,為中國大模型技術(shù)參與全球競爭提供了實證支撐。
長江證券也表示,國產(chǎn)模型推理能力對齊業(yè)界領(lǐng)先水平,看好推理算力與應(yīng)用側(cè)受益。一方面,國產(chǎn)推理模型持續(xù)迭代,推理側(cè)的scaling up將帶來推理算力需求的顯著提升;另一方面,通過利用DeepSeek-R1整理的80萬個樣本進行微調(diào),小型模型推理能力顯著提升,或加速垂類模型應(yīng)用落地進程。