佛山顺德区夜场KTV公司招聘男模/外场模特-教育委員-+Q:-:4397301:-:底薪5000-10000以上,可日结/周结/月结,详情咨询了解:-:{DeepSeek“開源周”進(jìn)一步推動(dòng)大模型普惠破圈。大模型“開源潮”起,要想繼續(xù)留在這張“牌桌”上比拼,AI企業(yè)未來的發(fā)力點(diǎn)在哪? ―――――――――― 過去的一周,DeepSeek帶動(dòng)的AI(人工智能)大模型“開源潮”熱度空前。 2月24日,國內(nèi)AI企業(yè)深度求索(DeepSeek)啟動(dòng)“開源周”,計(jì)劃在一周內(nèi),每天開源1個(gè)代碼庫,以完全透明的方式與全球開發(fā)者分享他們的研究進(jìn)展。3月1日,DeepSeek發(fā)布《DeepSeek-V3/R1推理系統(tǒng)概覽》技術(shù)文章,首次公布模型推理系統(tǒng)優(yōu)化細(xì)節(jié),DeepSeek“開源周”就此收官。 5天時(shí)間,5個(gè)核心代碼庫,一名AI大模型開發(fā)者向中青報(bào)?中青網(wǎng)記者介紹,DeepSeek此次開源的代碼庫,基本覆蓋了AI大模型開發(fā)的關(guān)鍵核心環(huán)節(jié),比如硬件性能高效利用、數(shù)據(jù)處理提速等,有利于降低技術(shù)門檻和成本。對此,DeepSeek方面也表示:“希望分享的每一行代碼都會(huì)變成強(qiáng)有力的勢能,加速行業(yè)發(fā)展進(jìn)程! 所謂開源,原指在計(jì)算機(jī)軟件開發(fā)過程中,源代碼可以被訪問或獲取,感興趣的人都能查看、修改和分發(fā)其中的代碼。但在中國工程院院士、之江實(shí)驗(yàn)室主任王堅(jiān)看來,人工智能時(shí)代,開源不能僅用開放源代碼來表達(dá),其創(chuàng)新的特點(diǎn)應(yīng)是“Open Resource”,即開放資源!伴_源是對社會(huì)的貢獻(xiàn),是對全世界的貢獻(xiàn)!蓖鯃(jiān)說。 開源助推大模型破圈 以2月24日DeepSeek向公眾開源的FlashMLA代碼庫為例。據(jù)了解,MLA(多頭潛在注意力機(jī)制)可以顯著減少AI大模型訓(xùn)練和推理過程中的內(nèi)存占用。FlashMLA則是針對Hopper GPU(一種英偉達(dá)GPU架構(gòu))開發(fā)的高效MLA解碼內(nèi)核,主要解決大模型處理不同長度文本的問題。 “就像統(tǒng)一尺寸的快遞箱子,小了要舍棄商品,大了會(huì)浪費(fèi)空間!笨焖悸胙芯吭涸洪L、原商湯智能產(chǎn)業(yè)研究院創(chuàng)始院長田豐對記者解釋說,F(xiàn)lashMLA就像可隨意伸縮的快遞箱子,通過精準(zhǔn)分配GPU資源,處理可變長度文本序列,實(shí)現(xiàn)了MLA的高效解碼。 除FlashMLA之外,DeepSeek“開源周”開放的DeepEP、DeepGEMM等均是AI大模型開發(fā)中會(huì)用到的關(guān)鍵技術(shù)。“開源就意味著企業(yè)把自己的研發(fā)成果免費(fèi)提供給全球開發(fā)者,開發(fā)者們在不同環(huán)境試用或迭代的過程中,會(huì)主動(dòng)找到開源模型的不足并進(jìn)行完善,進(jìn)而推動(dòng)技術(shù)的快速迭代更新!痹谔镓S看來,這就是模型開源的重要價(jià)值所在。 DeepSeek成立至今,開源是其一貫堅(jiān)持的策略。今年年初,開源模型DeepSeek-R1橫空出世,一時(shí)間,DeepSeek“接入潮”涌動(dòng),“開源”功不可沒。如今,DeepSeek通過“開源周”主動(dòng)開放核心代碼庫,擴(kuò)大開源程度,田豐認(rèn)為,這將有力助推AI大模型實(shí)現(xiàn)模型、算力、應(yīng)用3個(gè)層面的普惠“破圈”。 田豐提到,在模型方面,DeepSeek打破了一直以來少數(shù)國際巨頭對頂尖大模型的技術(shù)壟斷,使得開發(fā)者能夠像拼樂高一樣,按需組裝大模型的核心代碼;在算力方面,DeepSeek通過軟件優(yōu)化彌補(bǔ)了硬件上的差距,讓全球開發(fā)者都可以用個(gè)人級(jí)算力搞科研創(chuàng)新。在應(yīng)用方面,田豐預(yù)計(jì),基于開源的DeepSeek系列模型,市場上近期可能涌現(xiàn)出上百個(gè)行業(yè)應(yīng)用大模型,或?qū)⒏采w農(nóng)業(yè)、工業(yè)、服務(wù)業(yè)等。 長江證券2月25日發(fā)布的研報(bào)認(rèn)為,此次DeepSeek開源代碼庫,或?qū)@降本增效這一核心,通過開源模式與低成本路徑,改變此前“大力出奇跡”,即堆算力、堆數(shù)據(jù)的AI開發(fā)邏輯,加速技術(shù)普惠化。同時(shí),DeepSeek繼續(xù)其開源策略,也將進(jìn)一步加速AI技術(shù)平權(quán),并在其基礎(chǔ)上催生大量垂類應(yīng)用,進(jìn)一步帶動(dòng)算力需求爆發(fā)。 在AI界有這樣一個(gè)說法:2023年Meta開源大模型LLaMA為全球開發(fā)者帶來ChatGPT水平的智能,2025年DeepSeek-R1的開源為大家?guī)砹薕penAI o1水平的智能。如今,開源策略已成為DeepSeek擴(kuò)大影響力的重要途徑。 截至2月24日,DeepSeek-R1在國際知名開源社區(qū)Hugging Face上已獲得上萬點(diǎn)贊,成為該平臺(tái)150萬個(gè)公開模型中最受歡迎的開源大模型之一。公開信息顯示,目前,已有多個(gè)團(tuán)隊(duì)成功復(fù)現(xiàn)了DeepSeek的核心模型,比如Hugging Face的Open-R1、香港科技大學(xué)的simpleRL-reason等。 “開源模型之間的競爭在于開放程度,眾人拾柴火焰高!碧镓S提到,他身邊就有不少人自己在家里部署了DeepSeek系列模型,并積極地在模型上面創(chuàng)新,訓(xùn)練行業(yè)模型。田豐認(rèn)為,圍繞DeepSeek的開源社區(qū)生態(tài)已經(jīng)逐漸建立起來,其擴(kuò)張的速度取決于社區(qū)內(nèi)開發(fā)者的數(shù)量!爸灰覀儓(jiān)持開源,足夠開放,絕對會(huì)有越來越多的全球開發(fā)者參與進(jìn)來,為DeekSeek社區(qū)作貢獻(xiàn)!彼f。 真正的“護(hù)城河”在哪里 值得一提的是,今年1月DeepSeek火爆出圈以來,越來越多的AI廠商開始擁抱開源。今年2月,字節(jié)跳動(dòng)、昆侖萬維、百度文心一言等均推出開源模型。2月25日,阿里云旗下視覺生成基座模型萬相2.1(Wan)正式開源,阿里云自此實(shí)現(xiàn)了全模態(tài)、全尺寸大模型的開源。 “AI以及整個(gè)計(jì)算機(jī)科學(xué)的底層推動(dòng)邏輯,始終是建立在開源精神之上的!鼻迦A大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系長聘副教授、面壁智能創(chuàng)始人劉知遠(yuǎn)對記者說,通過開源,所有開發(fā)者都可以基于已有的、可信賴的技術(shù)基石,快速迭代、創(chuàng)新,“未來,開源會(huì)更深入、更廣泛地應(yīng)用”。 在國內(nèi),AI大模型開源似乎已成趨勢,但從全球來看,這種趨勢尚未統(tǒng)一。比如OpenAI依然堅(jiān)持走閉源路線,Google則采取混合策略,其核心模型Gemini為閉源產(chǎn)品,Gemma等小型模型則為開源。 記者在采訪中了解到,對AI企業(yè)來說,閉源模式有利于形成技術(shù)壁壘,通過控制代碼的使用和分發(fā),能夠?yàn)槠髽I(yè)提供穩(wěn)定的收入來源。反過來,則可能會(huì)影響其核心競爭力,這也是投資圈對AI模型開源存在的憂慮之一。 “開源的代碼或模型只是基礎(chǔ),真正的競爭力往往體現(xiàn)在如何將其打磨、優(yōu)化,并應(yīng)用到大規(guī)模、復(fù)雜的實(shí)際場景中!鼻迦A大學(xué)計(jì)算機(jī)系助理研究員、面壁智能首席研究員韓旭認(rèn)為,單點(diǎn)技術(shù)的開源不會(huì)削弱其核心優(yōu)勢,反而可能豐富整個(gè)行業(yè)的生態(tài),“真正的護(hù)城河依然掌握在那些能夠整合、優(yōu)化,并持續(xù)推進(jìn)技術(shù)演進(jìn)的企業(yè)手中”。 大模型“開源潮”涌起,要想繼續(xù)留在這張“牌桌”上比拼,AI企業(yè)未來的發(fā)力點(diǎn)在哪?田豐指出,一方面,要進(jìn)一步提高開源模型的推理能力、計(jì)算性能,降低部署門檻。他以DeepSeek-V3為例說,部署該模型的“滿血版”依然有一定的算力要求,如果模型部署門檻能進(jìn)一步降低,將會(huì)有更多的開發(fā)者擁抱DeepSeek,也會(huì)帶動(dòng)更大范圍的硬件智能+物聯(lián)網(wǎng)、軟件智能+應(yīng)用生態(tài)鏈的升級(jí)。 另一方面,在開源底層基礎(chǔ)模型之外,芯片、數(shù)據(jù)、應(yīng)用等層面的軟硬件協(xié)同創(chuàng)新也很關(guān)鍵!皣a(chǎn)GPU、存儲(chǔ)系統(tǒng)如何與AI技術(shù)深度適配,數(shù)據(jù)處理模塊如何更高效地支持模型運(yùn)行等,在模型之上,還有大量生態(tài)需要中國甚至全球的開發(fā)者去補(bǔ)足!碧镓S說,這是開源生態(tài)構(gòu)建的重要內(nèi)容,也是眾多企業(yè)應(yīng)該抓住的機(jī)會(huì)。 中青報(bào)?中青網(wǎng)記者 賈驥業(yè) 來源:中國青年報(bào)}
主辦單位:北京市教育委員會(huì)
承辦單位:北京市數(shù)字教育中心
政府網(wǎng)站標(biāo)識(shí)碼:1100000152
京公網(wǎng)安備 11040202430147號(hào)
京ICP備20014478號(hào)-1