近日大模型DeepSeek-R1正式發(fā)布,作為一款開源模型它在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上的性能能夠比肩OpenAI o1模型。
發(fā)布后幾天這款國產(chǎn)大模型,引發(fā)海內(nèi)外開發(fā)者和投資者的熱議,它的訓(xùn)練成本僅557.6萬美元,不到同類項(xiàng)模型訓(xùn)練成本的10%。
作為一款“100%開源”的模型R1還比國外同類模型便宜96.4%,同時提供類似的性能。
海內(nèi)外不少科技大佬、投資機(jī)構(gòu)稱DeepSeek有可能徹底改變訓(xùn)練和推理領(lǐng)域的游戲規(guī)則。
甚至有媒體擔(dān)憂開源的先進(jìn)AI,讓試圖出售技術(shù)賺取巨額利潤的美國AI公司“天塌了”。
還有美國學(xué)者稱中國的系統(tǒng)工程師人才庫比美國大得多,即使沒有最好的芯片他們也可以充分利用計(jì)算資源來更便宜地訓(xùn)練和運(yùn)行模型。
編輯: | 張?zhí)N昆 |
責(zé)編: | 方媛 |
劍網(wǎng)行動舉報(bào)電話:12318(市文化執(zhí)法總隊(duì))、021-64334547(市版權(quán)局)
Copyright ? 2016 Kankanews.com Inc. All Rights Reserved. 看東方(上海)傳媒有限公司 版權(quán)所有
全部評論
暫無評論,快來發(fā)表你的評論吧