大连旅顺口区夜场KTV公司招聘男模/外场模特-教育委員-+Q:-:4397301:-:底薪5000-10000以上,可日结/周结/月结,详情咨询了解:-:{DeepSeek“開(kāi)源周”進(jìn)一步推動(dòng)大模型普惠破圈。大模型“開(kāi)源潮”起,要想繼續(xù)留在這張“牌桌”上比拼,AI企業(yè)未來(lái)的發(fā)力點(diǎn)在哪? ―――――――――― 過(guò)去的一周,DeepSeek帶動(dòng)的AI(人工智能)大模型“開(kāi)源潮”熱度空前。 2月24日,國(guó)內(nèi)AI企業(yè)深度求索(DeepSeek)啟動(dòng)“開(kāi)源周”,計(jì)劃在一周內(nèi),每天開(kāi)源1個(gè)代碼庫(kù),以完全透明的方式與全球開(kāi)發(fā)者分享他們的研究進(jìn)展。3月1日,DeepSeek發(fā)布《DeepSeek-V3/R1推理系統(tǒng)概覽》技術(shù)文章,首次公布模型推理系統(tǒng)優(yōu)化細(xì)節(jié),DeepSeek“開(kāi)源周”就此收官。 5天時(shí)間,5個(gè)核心代碼庫(kù),一名AI大模型開(kāi)發(fā)者向中青報(bào)?中青網(wǎng)記者介紹,DeepSeek此次開(kāi)源的代碼庫(kù),基本覆蓋了AI大模型開(kāi)發(fā)的關(guān)鍵核心環(huán)節(jié),比如硬件性能高效利用、數(shù)據(jù)處理提速等,有利于降低技術(shù)門檻和成本。對(duì)此,DeepSeek方面也表示:“希望分享的每一行代碼都會(huì)變成強(qiáng)有力的勢(shì)能,加速行業(yè)發(fā)展進(jìn)程! 所謂開(kāi)源,原指在計(jì)算機(jī)軟件開(kāi)發(fā)過(guò)程中,源代碼可以被訪問(wèn)或獲取,感興趣的人都能查看、修改和分發(fā)其中的代碼。但在中國(guó)工程院院士、之江實(shí)驗(yàn)室主任王堅(jiān)看來(lái),人工智能時(shí)代,開(kāi)源不能僅用開(kāi)放源代碼來(lái)表達(dá),其創(chuàng)新的特點(diǎn)應(yīng)是“Open Resource”,即開(kāi)放資源!伴_(kāi)源是對(duì)社會(huì)的貢獻(xiàn),是對(duì)全世界的貢獻(xiàn)。”王堅(jiān)說(shuō)。 開(kāi)源助推大模型破圈 以2月24日DeepSeek向公眾開(kāi)源的FlashMLA代碼庫(kù)為例。據(jù)了解,MLA(多頭潛在注意力機(jī)制)可以顯著減少AI大模型訓(xùn)練和推理過(guò)程中的內(nèi)存占用。FlashMLA則是針對(duì)Hopper GPU(一種英偉達(dá)GPU架構(gòu))開(kāi)發(fā)的高效MLA解碼內(nèi)核,主要解決大模型處理不同長(zhǎng)度文本的問(wèn)題。 “就像統(tǒng)一尺寸的快遞箱子,小了要舍棄商品,大了會(huì)浪費(fèi)空間!笨焖悸胙芯吭涸洪L(zhǎng)、原商湯智能產(chǎn)業(yè)研究院創(chuàng)始院長(zhǎng)田豐對(duì)記者解釋說(shuō),F(xiàn)lashMLA就像可隨意伸縮的快遞箱子,通過(guò)精準(zhǔn)分配GPU資源,處理可變長(zhǎng)度文本序列,實(shí)現(xiàn)了MLA的高效解碼。 除FlashMLA之外,DeepSeek“開(kāi)源周”開(kāi)放的DeepEP、DeepGEMM等均是AI大模型開(kāi)發(fā)中會(huì)用到的關(guān)鍵技術(shù)!伴_(kāi)源就意味著企業(yè)把自己的研發(fā)成果免費(fèi)提供給全球開(kāi)發(fā)者,開(kāi)發(fā)者們?cè)诓煌h(huán)境試用或迭代的過(guò)程中,會(huì)主動(dòng)找到開(kāi)源模型的不足并進(jìn)行完善,進(jìn)而推動(dòng)技術(shù)的快速迭代更新!痹谔镓S看來(lái),這就是模型開(kāi)源的重要價(jià)值所在。 DeepSeek成立至今,開(kāi)源是其一貫堅(jiān)持的策略。今年年初,開(kāi)源模型DeepSeek-R1橫空出世,一時(shí)間,DeepSeek“接入潮”涌動(dòng),“開(kāi)源”功不可沒(méi)。如今,DeepSeek通過(guò)“開(kāi)源周”主動(dòng)開(kāi)放核心代碼庫(kù),擴(kuò)大開(kāi)源程度,田豐認(rèn)為,這將有力助推AI大模型實(shí)現(xiàn)模型、算力、應(yīng)用3個(gè)層面的普惠“破圈”。 田豐提到,在模型方面,DeepSeek打破了一直以來(lái)少數(shù)國(guó)際巨頭對(duì)頂尖大模型的技術(shù)壟斷,使得開(kāi)發(fā)者能夠像拼樂(lè)高一樣,按需組裝大模型的核心代碼;在算力方面,DeepSeek通過(guò)軟件優(yōu)化彌補(bǔ)了硬件上的差距,讓全球開(kāi)發(fā)者都可以用個(gè)人級(jí)算力搞科研創(chuàng)新。在應(yīng)用方面,田豐預(yù)計(jì),基于開(kāi)源的DeepSeek系列模型,市場(chǎng)上近期可能涌現(xiàn)出上百個(gè)行業(yè)應(yīng)用大模型,或?qū)⒏采w農(nóng)業(yè)、工業(yè)、服務(wù)業(yè)等。 長(zhǎng)江證券2月25日發(fā)布的研報(bào)認(rèn)為,此次DeepSeek開(kāi)源代碼庫(kù),或?qū)@降本增效這一核心,通過(guò)開(kāi)源模式與低成本路徑,改變此前“大力出奇跡”,即堆算力、堆數(shù)據(jù)的AI開(kāi)發(fā)邏輯,加速技術(shù)普惠化。同時(shí),DeepSeek繼續(xù)其開(kāi)源策略,也將進(jìn)一步加速AI技術(shù)平權(quán),并在其基礎(chǔ)上催生大量垂類應(yīng)用,進(jìn)一步帶動(dòng)算力需求爆發(fā)。 在AI界有這樣一個(gè)說(shuō)法:2023年Meta開(kāi)源大模型LLaMA為全球開(kāi)發(fā)者帶來(lái)ChatGPT水平的智能,2025年DeepSeek-R1的開(kāi)源為大家?guī)?lái)了OpenAI o1水平的智能。如今,開(kāi)源策略已成為DeepSeek擴(kuò)大影響力的重要途徑。 截至2月24日,DeepSeek-R1在國(guó)際知名開(kāi)源社區(qū)Hugging Face上已獲得上萬(wàn)點(diǎn)贊,成為該平臺(tái)150萬(wàn)個(gè)公開(kāi)模型中最受歡迎的開(kāi)源大模型之一。公開(kāi)信息顯示,目前,已有多個(gè)團(tuán)隊(duì)成功復(fù)現(xiàn)了DeepSeek的核心模型,比如Hugging Face的Open-R1、香港科技大學(xué)的simpleRL-reason等。 “開(kāi)源模型之間的競(jìng)爭(zhēng)在于開(kāi)放程度,眾人拾柴火焰高!碧镓S提到,他身邊就有不少人自己在家里部署了DeepSeek系列模型,并積極地在模型上面創(chuàng)新,訓(xùn)練行業(yè)模型。田豐認(rèn)為,圍繞DeepSeek的開(kāi)源社區(qū)生態(tài)已經(jīng)逐漸建立起來(lái),其擴(kuò)張的速度取決于社區(qū)內(nèi)開(kāi)發(fā)者的數(shù)量。“只要我們堅(jiān)持開(kāi)源,足夠開(kāi)放,絕對(duì)會(huì)有越來(lái)越多的全球開(kāi)發(fā)者參與進(jìn)來(lái),為DeekSeek社區(qū)作貢獻(xiàn)。”他說(shuō)。 真正的“護(hù)城河”在哪里 值得一提的是,今年1月DeepSeek火爆出圈以來(lái),越來(lái)越多的AI廠商開(kāi)始擁抱開(kāi)源。今年2月,字節(jié)跳動(dòng)、昆侖萬(wàn)維、百度文心一言等均推出開(kāi)源模型。2月25日,阿里云旗下視覺(jué)生成基座模型萬(wàn)相2.1(Wan)正式開(kāi)源,阿里云自此實(shí)現(xiàn)了全模態(tài)、全尺寸大模型的開(kāi)源。 “AI以及整個(gè)計(jì)算機(jī)科學(xué)的底層推動(dòng)邏輯,始終是建立在開(kāi)源精神之上的。”清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系長(zhǎng)聘副教授、面壁智能創(chuàng)始人劉知遠(yuǎn)對(duì)記者說(shuō),通過(guò)開(kāi)源,所有開(kāi)發(fā)者都可以基于已有的、可信賴的技術(shù)基石,快速迭代、創(chuàng)新,“未來(lái),開(kāi)源會(huì)更深入、更廣泛地應(yīng)用”。 在國(guó)內(nèi),AI大模型開(kāi)源似乎已成趨勢(shì),但從全球來(lái)看,這種趨勢(shì)尚未統(tǒng)一。比如OpenAI依然堅(jiān)持走閉源路線,Google則采取混合策略,其核心模型Gemini為閉源產(chǎn)品,Gemma等小型模型則為開(kāi)源。 記者在采訪中了解到,對(duì)AI企業(yè)來(lái)說(shuō),閉源模式有利于形成技術(shù)壁壘,通過(guò)控制代碼的使用和分發(fā),能夠?yàn)槠髽I(yè)提供穩(wěn)定的收入來(lái)源。反過(guò)來(lái),則可能會(huì)影響其核心競(jìng)爭(zhēng)力,這也是投資圈對(duì)AI模型開(kāi)源存在的憂慮之一。 “開(kāi)源的代碼或模型只是基礎(chǔ),真正的競(jìng)爭(zhēng)力往往體現(xiàn)在如何將其打磨、優(yōu)化,并應(yīng)用到大規(guī)模、復(fù)雜的實(shí)際場(chǎng)景中!鼻迦A大學(xué)計(jì)算機(jī)系助理研究員、面壁智能首席研究員韓旭認(rèn)為,單點(diǎn)技術(shù)的開(kāi)源不會(huì)削弱其核心優(yōu)勢(shì),反而可能豐富整個(gè)行業(yè)的生態(tài),“真正的護(hù)城河依然掌握在那些能夠整合、優(yōu)化,并持續(xù)推進(jìn)技術(shù)演進(jìn)的企業(yè)手中”。 大模型“開(kāi)源潮”涌起,要想繼續(xù)留在這張“牌桌”上比拼,AI企業(yè)未來(lái)的發(fā)力點(diǎn)在哪?田豐指出,一方面,要進(jìn)一步提高開(kāi)源模型的推理能力、計(jì)算性能,降低部署門檻。他以DeepSeek-V3為例說(shuō),部署該模型的“滿血版”依然有一定的算力要求,如果模型部署門檻能進(jìn)一步降低,將會(huì)有更多的開(kāi)發(fā)者擁抱DeepSeek,也會(huì)帶動(dòng)更大范圍的硬件智能+物聯(lián)網(wǎng)、軟件智能+應(yīng)用生態(tài)鏈的升級(jí)。 另一方面,在開(kāi)源底層基礎(chǔ)模型之外,芯片、數(shù)據(jù)、應(yīng)用等層面的軟硬件協(xié)同創(chuàng)新也很關(guān)鍵!皣(guó)產(chǎn)GPU、存儲(chǔ)系統(tǒng)如何與AI技術(shù)深度適配,數(shù)據(jù)處理模塊如何更高效地支持模型運(yùn)行等,在模型之上,還有大量生態(tài)需要中國(guó)甚至全球的開(kāi)發(fā)者去補(bǔ)足!碧镓S說(shuō),這是開(kāi)源生態(tài)構(gòu)建的重要內(nèi)容,也是眾多企業(yè)應(yīng)該抓住的機(jī)會(huì)。 中青報(bào)?中青網(wǎng)記者 賈驥業(yè) 來(lái)源:中國(guó)青年報(bào)}
主辦單位:北京市教育委員會(huì)
承辦單位:北京市數(shù)字教育中心
政府網(wǎng)站標(biāo)識(shí)碼:1100000152
京公網(wǎng)安備 11040202430147號(hào)
京ICP備20014478號(hào)-1