在過(guò)去一周,中國(guó)的人工智能大模型,成為美國(guó)硅谷乃至全球科技人士熱議“東方神秘力量”的話題。引發(fā)熱議的正是中國(guó)的人工智能初創(chuàng)公司DeepSeek“深度求索”。今天,DeepSeek應(yīng)用超越ChatGPT、登頂蘋果美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜。而在蘋果中國(guó)區(qū)應(yīng)用商店免費(fèi)榜上,DeepSeek今天也高居榜首。
“深度求索”公司上周發(fā)布的推理大模型DeepSeek-R1,因其比肩OpenAl o1的性能和極低的服務(wù)價(jià)格震驚業(yè)界?!吧疃惹笏鳌惫颈硎荆琑1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。此外,DeepSeek-R1的預(yù)訓(xùn)練費(fèi)用只有557.6萬(wàn)美元,不到OpenAI GPT最新版本訓(xùn)練成本的十分之一。DeepSeek甚至被戲稱為AI界的“拼多多”。這也就是說(shuō),DeepSeek以較低的成本,實(shí)現(xiàn)了高性能的AI模型,由此也具備了更多市場(chǎng)競(jìng)爭(zhēng)優(yōu)勢(shì)。
分析人士評(píng)價(jià)說(shuō),“深度求索”公司以200人左右的小團(tuán)隊(duì),不依靠外部融資,早期購(gòu)入很多算力卡,投入資源做研究,做出了一個(gè)有性價(jià)比,并被廣泛認(rèn)可的大模型。
受相關(guān)消息提振,今天,DeepSeek概念股表現(xiàn)強(qiáng)勢(shì),每日互動(dòng)、華金資本等相關(guān)個(gè)股漲?;驖q幅居前。
“深度求索”公司成立于2023年7月,是一家注冊(cè)在杭州的創(chuàng)新型科技公司,專注于開(kāi)發(fā)先進(jìn)的大語(yǔ)言模型(LLM)和相關(guān)技術(shù)。
DeepSeek頁(yè)面極為簡(jiǎn)潔,主框上只有深度思考、聯(lián)網(wǎng)搜索、發(fā)送三個(gè)按鈕。公開(kāi)信息顯示,在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,性能比肩OpenAI o1正式版。
從常規(guī)的新聞搜索功能來(lái)看,DeepSeek的亮點(diǎn)在于,總結(jié)簡(jiǎn)潔,而且重點(diǎn)突出,收集的內(nèi)容也不局限于國(guó)內(nèi)平臺(tái),部分消息來(lái)自海外新聞媒體,點(diǎn)擊鏈接可直達(dá)海外的新聞網(wǎng)站。
與此同時(shí),DeepSeek的數(shù)學(xué)題解答能堪稱快速、準(zhǔn)確。除了能夠正確回答問(wèn)題,還能詳細(xì)展示思考步驟,部分問(wèn)題還能反復(fù)驗(yàn)證答案,甚至使用其他方式再計(jì)算一次。
不過(guò),總結(jié)目前市面上多款A(yù)I大模型發(fā)現(xiàn),內(nèi)容總結(jié)能力都較為一般,普遍會(huì)出現(xiàn)重點(diǎn)缺失,車轱轆話來(lái)回轉(zhuǎn)的情況。在實(shí)際評(píng)測(cè)中,DeepSeek也出現(xiàn)了類似的情況,總結(jié)內(nèi)容時(shí)容易變成“歸納大綱和標(biāo)題”,導(dǎo)致信息缺失。
DeepSeek的橫空出世,就像當(dāng)初的ChatGpt,一石激起千層浪。那么,DeepSeek憑借哪些表現(xiàn)在AI界殺出重圍?復(fù)旦大學(xué)信息科學(xué)與工程學(xué)院副教授凌力指出,DeepSeek團(tuán)隊(duì)是“厚積薄發(fā)”,之前就在不斷地研究,這個(gè)小團(tuán)隊(duì)集聚了人工智能方面的一些專家,擁有一些創(chuàng)新的思維。以小成本的投入就能達(dá)到同樣水平AI的能力,是非常有意義的。因?yàn)槿绻鸄I大模型投入要求非常高的話,就把很多公司擋在外面了。有效壓低成本,業(yè)界生態(tài)就會(huì)繁榮,各行各業(yè)都可以用AI賦能來(lái)提升自身能力。
DeepSeek、字節(jié)跳動(dòng)等中國(guó)企業(yè)的出現(xiàn)和發(fā)力,讓美國(guó)意識(shí)到,管制并不能阻止中國(guó)持續(xù)推進(jìn)AI技術(shù)研發(fā),并在這一領(lǐng)域取得領(lǐng)先。
《福布斯》發(fā)文指出,DeepSeek讓世界認(rèn)識(shí)到,中國(guó)并未退出這場(chǎng)人工智能的競(jìng)賽。
《紐約時(shí)報(bào)》則稱,如果最好的開(kāi)源技術(shù)來(lái)自中國(guó),美國(guó)開(kāi)發(fā)人員將在這些技術(shù)的基礎(chǔ)上構(gòu)建他們的系統(tǒng)。從長(zhǎng)遠(yuǎn)來(lái)看,這可能會(huì)讓中國(guó)成為研發(fā)AI的中心。
不過(guò),DeepSeek依然面臨競(jìng)爭(zhēng)對(duì)手囤積大量算力的挑戰(zhàn)。本周,特朗普宣布,OpenAI與甲骨文、日本軟銀集團(tuán)共同創(chuàng)立一家5000億美金投資新計(jì)劃公司“星際之門”,在美國(guó)至少投資1000億美元,用于AI基礎(chǔ)設(shè)施。同時(shí),馬斯克的xAI也正在大規(guī)模擴(kuò)展其超級(jí)計(jì)算機(jī),以容納超過(guò)100萬(wàn)個(gè)GPU,幫助訓(xùn)練其Grok AI模型。
目前來(lái)看,DeepSeek證明開(kāi)源并沒(méi)有落后,但是,DeepSeek是否會(huì)因此面臨美國(guó)政府的針對(duì)性限制,最終導(dǎo)致模型訓(xùn)練和算力受到制約,依然存在巨大不確定性。
DeepSeek是中國(guó)在AI界的一次彎道超車嗎?未來(lái)AI還將如何進(jìn)化?國(guó)產(chǎn)大模型怎樣走得更遠(yuǎn)、腳步更堅(jiān)實(shí)?復(fù)旦大學(xué)信息科學(xué)與工程學(xué)院副教授凌力表示,DeepSeek的突破意義重大,但我們也要更理性地來(lái)看待,因?yàn)?,目前?lái)看,它還只是在效果上跟國(guó)外先進(jìn)的模型處于并列狀態(tài),未來(lái)是不是還能夠進(jìn)一步做得更好,這一點(diǎn)還要拭目以待。目前,國(guó)內(nèi)芯片的性能暫時(shí)還是弱于國(guó)外的同類產(chǎn)品。所以,人工智能的模型,如果能降低對(duì)國(guó)外高性能芯片的依賴,或許是一個(gè)努力的方向。此外,首先要讓人工智能變成生產(chǎn)力工具,才是有意義的。一定要跟各行各業(yè)的生產(chǎn)過(guò)程結(jié)合起來(lái),一是要把AI模型變成一種智能體,融合到生產(chǎn)過(guò)程當(dāng)中,生成一些指令去控制設(shè)備或者解決實(shí)際問(wèn)題。另外一種發(fā)展方向,是人工智能要變成通用人工智能,能夠更好地像人類思考一樣,成為思考、研究、生產(chǎn)活動(dòng)的助手。
編輯: | 阮麗 |
責(zé)編: | 嚴(yán)相莉 |
劍網(wǎng)行動(dòng)舉報(bào)電話:12318(市文化執(zhí)法總隊(duì))、021-64334547(市版權(quán)局)
Copyright ? 2016 Kankanews.com Inc. All Rights Reserved. 看東方(上海)傳媒有限公司 版權(quán)所有
全部評(píng)論
暫無(wú)評(píng)論,快來(lái)發(fā)表你的評(píng)論吧