大模型輪番登場(chǎng),上海打響“百模”大戰(zhàn)。加快建設(shè)更具國(guó)際影響力的人工智能高地,上海如何讓算力“即取即用”?東方衛(wèi)視《今晚》特別欄目“看懂上?!毖?qǐng)上海市人工智能標(biāo)準(zhǔn)化技術(shù)委員會(huì)副秘書長(zhǎng)、上海人工智能行業(yè)協(xié)會(huì)標(biāo)準(zhǔn)研究部部長(zhǎng)陳曦、臨港新片區(qū)管委會(huì)數(shù)據(jù)處副處長(zhǎng)倪曉杰,以及上海星云愛店科技有限公司首席技術(shù)官董繼明,一起討論。
“百模”大戰(zhàn)打響 大家在“卷”什么?
當(dāng)ChatGPT、Sora等AI大模型驚艷亮相,改變?nèi)祟惖纳a(chǎn)生活、認(rèn)知思維方式時(shí),一批國(guó)產(chǎn)大模型正敲響戰(zhàn)鼓、迎頭趕上。最近,上海接連“上新”了一批大模型,“百模大戰(zhàn)”愈加激烈。
4月23日,商湯科技發(fā)布新一代大模型,其知識(shí)、推理、數(shù)學(xué)、代碼等指標(biāo)與GPT4 Turbo不相伯仲。自去年4月首次發(fā)布以來(lái),商湯“日日新”大模型體系已推出五個(gè)大版本迭代。如今的5.0版本,基于龐大訓(xùn)練數(shù)據(jù)和大量合成數(shù)據(jù),采用混合專家架構(gòu),創(chuàng)意寫作能力、推理能力以及總結(jié)能力均大幅提升,在金融、出行、辦公、IP角色等行業(yè)實(shí)現(xiàn)深耕落地。
日前,在上海唯一的大模型創(chuàng)新生態(tài)社區(qū)“模速空間”內(nèi),新銳企業(yè)智象未來(lái)在為即將發(fā)布的文生視頻模型做最后的技術(shù)攻堅(jiān)。這款自研大模型,目標(biāo)直指美國(guó)OpenAI團(tuán)隊(duì)的視頻生成模型Sora,立志要用中國(guó)的人工智能講述中國(guó)故事,“輸入延時(shí)攝影星空閃爍,不到1分鐘可以生成出來(lái)一個(gè)視頻的片段”品牌負(fù)責(zé)人張一鳴對(duì)自家產(chǎn)品信心滿滿。
目前,在“模速空間”,類似智象未來(lái)這樣的大模型企業(yè)已超過(guò)60家,而上海已有24款大模型完成備案、可上線提供服務(wù),數(shù)量位居全國(guó)前列。
身為業(yè)界中人,上海星云愛店科技有限公司首席技術(shù)官董繼明在節(jié)目中感慨,圍繞國(guó)產(chǎn)大模型的各個(gè)行業(yè)近年來(lái)確實(shí)“卷得不得了”,然而取得的長(zhǎng)足發(fā)展也頗令人驚喜。
董繼明表示,3個(gè)月前他們嘗試性地將其從200萬(wàn)用戶收集的任務(wù)問(wèn)題,從國(guó)外先進(jìn)大模型“切換”至國(guó)產(chǎn)大模型,以此檢測(cè)能否支撐他家產(chǎn)品——科研助手“萬(wàn)能小in”的復(fù)雜運(yùn)算?!盁o(wú)論輸入長(zhǎng)度、邏輯性,還是趣味性,實(shí)際效果都超出我們的期望,而且文生圖的多模態(tài)能力也比較理想”,董繼明說(shuō),既然國(guó)產(chǎn)大模型能堪大用,索性就全量切到了國(guó)產(chǎn)大模型。
解決算力“焦慮” 要抓哪些關(guān)鍵要害?
算力、算法和數(shù)據(jù),是訓(xùn)練人工智能大模型的三個(gè)關(guān)鍵要素。如果把大模型比喻成“身體”,那么維系身體機(jī)能運(yùn)轉(zhuǎn)的“血液”則是海量的算力,尤其是智能算力。據(jù)預(yù)測(cè),算力每投入1元錢,就將帶動(dòng)3至4元的經(jīng)濟(jì)產(chǎn)出。
隨著人工智能技術(shù)更新迭代,對(duì)算力的需求也與日俱增。以GPT-3和GPT-4模型為例,二者對(duì)應(yīng)的算力增長(zhǎng)24倍??梢哉f(shuō),在數(shù)字時(shí)代,算力決定了人工智能技術(shù)創(chuàng)新的上限。
值得注意的是,在算力需求總量增長(zhǎng)的同時(shí),因供需錯(cuò)位導(dǎo)致大量算力閑置的情況仍存在。目前,我國(guó)整體算力利用率不足30%,高端算力缺口相對(duì)較大。
上海市人工智能標(biāo)準(zhǔn)化技術(shù)委員會(huì)副秘書長(zhǎng)、上海人工智能行業(yè)協(xié)會(huì)標(biāo)準(zhǔn)研究部部長(zhǎng)陳曦認(rèn)為,之所以會(huì)出現(xiàn)算力缺口問(wèn)題,主要在于在這一輪大模型發(fā)展中,企業(yè)要將很大部分的研發(fā)成本投入在算力以及合規(guī)的語(yǔ)料數(shù)據(jù)上面。2022年在美國(guó)用顯卡訓(xùn)練模型的成本比在中國(guó)高出一倍,而2023年在中國(guó)用進(jìn)口顯卡訓(xùn)練模型的成本達(dá)到了美國(guó)的兩倍,“而且,顯卡還不好買,推高了企業(yè)的算力成本。”
陳曦指出,這種情況迫使我們必須加快國(guó)產(chǎn)AI芯片升級(jí),同時(shí)也欣喜地看到目前已有很多國(guó)產(chǎn)AI芯片可以實(shí)現(xiàn)大模型的推理,“我們也期待有朝一日,國(guó)產(chǎn)AI芯片可以正式在訓(xùn)練階段得到很好的應(yīng)用?!?/span>
夯實(shí)算力基礎(chǔ)設(shè)施建設(shè) 打造“智算產(chǎn)業(yè)”生態(tài)圈
當(dāng)前,上海正持續(xù)夯實(shí)算力基礎(chǔ)設(shè)施建設(shè),各個(gè)重點(diǎn)區(qū)域持續(xù)布局,助力構(gòu)建全國(guó)一體化算力網(wǎng)。
臨港新片區(qū)的工地上,中國(guó)電信臨港智算中心一期工程的一部分算力設(shè)施已經(jīng)崛起。其中一間機(jī)房承載3000張GPU卡,4個(gè)機(jī)房通過(guò)網(wǎng)絡(luò)互聯(lián),形成了國(guó)內(nèi)首個(gè)超萬(wàn)卡液冷算力集群。工程建成后服務(wù)的大模型為萬(wàn)億級(jí)參數(shù),對(duì)標(biāo)GPT4.0即可融合文本、圖片、視頻多模態(tài)。
5月7日,包括“國(guó)產(chǎn)萬(wàn)卡液冷集群賦能星辰大模型”等在內(nèi),一批大模型集群在臨港新片區(qū)正式啟動(dòng),進(jìn)一步助力算力與大模型產(chǎn)業(yè)應(yīng)用深化聯(lián)動(dòng)。目前,臨港新片區(qū)已布局含三大運(yùn)營(yíng)商、商湯科技、有孚網(wǎng)絡(luò)等在內(nèi)的8個(gè)算力中心,可調(diào)度算力約3EFLOPS,約占上海市總體算力20%。
除了臨港,上海還加快在青浦、松江、金山、張江等重點(diǎn)區(qū)域建設(shè)大型智算中心。其中,松江擁有10個(gè)大數(shù)據(jù)中心、算力中心項(xiàng)目,已批復(fù)3.4萬(wàn)個(gè)機(jī)柜,落地了騰訊長(zhǎng)三角人工智能先進(jìn)計(jì)算中心、上海儀電智算中心等一批重大項(xiàng)目。規(guī)劃?rùn)C(jī)柜數(shù)量近4萬(wàn)架的騰訊長(zhǎng)三角人工智能先進(jìn)計(jì)算中心項(xiàng)目,建成后將成為亞洲領(lǐng)先的人工智能計(jì)算中心和全國(guó)最大的GPU計(jì)算集群。
董繼明服務(wù)的公司,坐落于全國(guó)首個(gè)大模型生態(tài)社區(qū)“模速空間”?!澳K倏臻g”位于徐匯濱江,與上海人工智能實(shí)驗(yàn)室、商湯科技、阿里巴巴、騰訊等知名科研機(jī)構(gòu)和科技企業(yè)毗鄰,形成了一個(gè)人工智能產(chǎn)研生態(tài)圈。
入駐“模速空間”的企業(yè)不僅可享受房租減免,還可獲得算力、數(shù)據(jù)、評(píng)測(cè)、金融等大模型研發(fā)所必需的資源,“這些原料單靠一家企業(yè)單打獨(dú)斗來(lái)積累,是非常困難的”董繼明說(shuō)。此外,在市區(qū)兩級(jí)政府的支持下,購(gòu)買算力資源的企業(yè)將得到現(xiàn)金補(bǔ)貼,每個(gè)季度補(bǔ)貼一次,“有了這個(gè)補(bǔ)貼以后,可以把我們的成本降低下來(lái)。”
讓董繼明最能體會(huì)“產(chǎn)業(yè)生態(tài)圈”福利的還有智慧的集聚與碰撞,“在我們吃飯、午休的時(shí)候,周圍都能結(jié)識(shí)到做大模型的人。大家常常在一起交流,甲公司用戶需要的應(yīng)用場(chǎng)景,乙公司可以幫忙找到解決方案?!?/span>
“全球數(shù)據(jù)經(jīng)濟(jì)快速發(fā)展、人工智能大模型不斷更新迭代,算力是當(dāng)下數(shù)字經(jīng)濟(jì)時(shí)代重要的戰(zhàn)略性資源,大家都在爭(zhēng)搶”,臨港新片區(qū)管委會(huì)數(shù)據(jù)處副處長(zhǎng)倪曉杰介紹,最近在臨港,臨港集團(tuán)“智算集群賦能港大自主算法平臺(tái)”、上海電信“國(guó)產(chǎn)萬(wàn)卡液冷集群賦能星辰大模型”、商湯科技“日日新5.0大模型”等又一批大模型訓(xùn)練集群正式啟動(dòng)。
其中,“智算集群賦能港大自主算法平臺(tái)”用于3D生成和基于人工智能的藥物設(shè)計(jì)等方向的研究;“國(guó)產(chǎn)萬(wàn)卡液冷集群賦能星辰大模型”為客戶提供大模型場(chǎng)景化應(yīng)用一站式交付;“日日新5.0大模型”大幅提升了日日新大模型的訓(xùn)練效率和推理速度,打造了國(guó)內(nèi)首個(gè)全面對(duì)標(biāo)GPT4的大模型,在金融、出行、辦公、IP角色等行業(yè)實(shí)現(xiàn)落地?!皩⑦@些訓(xùn)練集群集聚在我們臨港新片區(qū),我們可以更好地服務(wù)各行業(yè)垂類大模型,同時(shí)在相關(guān)制度方面進(jìn)行先行先試?!?/span>
國(guó)際競(jìng)爭(zhēng)日趨激烈 上海有哪些優(yōu)勢(shì)?
有句話叫“算力即國(guó)力”,在數(shù)字經(jīng)濟(jì)與人工智能時(shí)代,算力已經(jīng)成為重要的資源之一,全球圍繞算力的競(jìng)爭(zhēng)博弈也日益激烈。
從國(guó)家算力指數(shù)排名來(lái)看,美國(guó)和中國(guó)位列前兩位。2023年《中國(guó)算力發(fā)展指數(shù)白皮書》顯示,美國(guó)和中國(guó)在全球算力規(guī)模中的份額分別為34%、33%。位居全球第二的中國(guó),算力總規(guī)模已經(jīng)達(dá)到197EFLOPS。算力規(guī)模近5年年均增速近30%,存力規(guī)模、運(yùn)力質(zhì)量也在不斷提升。
為了搶得先機(jī),全球主要國(guó)家和地區(qū)都在持續(xù)加碼推進(jìn)算力發(fā)展。2022年8月,拜登正式簽署《芯片與科學(xué)法案》,旨在鞏固美國(guó)在半導(dǎo)體領(lǐng)域的地位,并強(qiáng)化算力基礎(chǔ)設(shè)施應(yīng)用和協(xié)同創(chuàng)新。2023年美國(guó)的《國(guó)家量子計(jì)劃》,則增加了對(duì)量子算法、應(yīng)用程序等軟件工程的研發(fā)投資。歐盟也在不斷加大前沿計(jì)算技術(shù)研發(fā)和算力發(fā)展的投入。《2023至2024年數(shù)字歐洲工作計(jì)劃》就提出,要投入1.13億歐元提升數(shù)據(jù)與計(jì)算能力。
對(duì)標(biāo)全球領(lǐng)先水平,上海正摩拳擦掌,強(qiáng)化算力產(chǎn)業(yè)發(fā)展的政策支持和保障。5月7日,上海臨港新片區(qū)發(fā)布5方面11項(xiàng)措施,計(jì)劃將臨港打造成具有重要戰(zhàn)略地位和全球影響力的算力高地。到2025年,力爭(zhēng)總算力超過(guò)5EFLOPS,智算占比達(dá)80%,算力產(chǎn)業(yè)總規(guī)模提升至100億元。
從全市層面來(lái)看,上海市通信管理局等11部門日前也印發(fā)方案,提出構(gòu)建智算生產(chǎn)要素、打造智算應(yīng)用場(chǎng)景等五方面重點(diǎn)任務(wù),力爭(zhēng)到2025年,上海市智能算力規(guī)模將超過(guò)30EFlops,占比達(dá)總算力的50%以上。上海具備大規(guī)模應(yīng)用賦能價(jià)值的智算中心數(shù)量達(dá)到10家,智能算力典型應(yīng)用場(chǎng)景超過(guò)50個(gè),爭(zhēng)取5個(gè)以上智算中心納入國(guó)家級(jí)算力基礎(chǔ)設(shè)施典型案例名單。
“盡管美國(guó)從Ai芯片到深度學(xué)習(xí)框架,以及核心算法仍然存在領(lǐng)先地位,但是我們也不必妄自菲薄”,陳曦指出,中國(guó)和上海有著最廣泛的消費(fèi)人群,在移動(dòng)互聯(lián)網(wǎng)時(shí)代就能創(chuàng)造出“殺手锏”級(jí)別的消費(fèi)應(yīng)用?!?/span>2024年是大模型應(yīng)用場(chǎng)景元年,上海本身是一個(gè)超級(jí)巨大的場(chǎng)景城市,產(chǎn)業(yè)類別齊全,同時(shí)服務(wù)業(yè)高度發(fā)達(dá),所以我們要利用算力提供的基礎(chǔ)保障和應(yīng)用場(chǎng)景方面的優(yōu)勢(shì),把握住大模型的發(fā)展機(jī)遇”陳曦說(shuō)。
打造全球算力新高地,臨港新片區(qū)被寄予厚望。倪曉杰表示,今年政府工作報(bào)告提出“加快形成全國(guó)一體化算力中心”,算力網(wǎng)是促進(jìn)全國(guó)范圍內(nèi)各類算力大規(guī)模調(diào)度運(yùn)營(yíng)的數(shù)字基礎(chǔ)設(shè)施。臨港新片區(qū)地處長(zhǎng)三角沿海界面的中心位置,在全國(guó)一體化算力網(wǎng)絡(luò)長(zhǎng)三角樞紐節(jié)點(diǎn)中扮演重要角色,能形成算力能力對(duì)外輻射的優(yōu)勢(shì)。在新政的支持下,臨港新片區(qū)將持續(xù)優(yōu)化算力布局體系,在基礎(chǔ)設(shè)施、核心產(chǎn)業(yè)和示范場(chǎng)景三方面形成合力,打造智能算力“三位一體”的協(xié)同發(fā)展體系。
編輯: | 李瑤郝苗苗 |
責(zé)編: | 趙歆 |
劍網(wǎng)行動(dòng)舉報(bào)電話:12318(市文化執(zhí)法總隊(duì))、021-64334547(市版權(quán)局)
Copyright ? 2016 Kankanews.com Inc. All Rights Reserved. 看東方(上海)傳媒有限公司 版權(quán)所有
全部評(píng)論
暫無(wú)評(píng)論,快來(lái)發(fā)表你的評(píng)論吧