亚洲国产成人久久一区WWW,中文字幕日韩人妻在线视频,亚洲最大中文字幕无码网站,欧美黑吊大战白妞

壓力給到梁文鋒

2025-04-23 07:42 來源:中國企業(yè)家
查看余下全文
(責(zé)任編輯:孫丹)
手機(jī)看中經(jīng)經(jīng)濟(jì)日報(bào)微信中經(jīng)網(wǎng)微信
當(dāng)前位置     首頁 > 新聞 > 國內(nèi)時政更多新聞 > 正文
中經(jīng)搜索

壓力給到梁文鋒

2025年04月23日 07:42   來源:中國企業(yè)家   

  根據(jù)DeepSeek過往的產(chǎn)品更新周期來看,梁文鋒的主場時間又快到了。

  文|《中國企業(yè)家》記者 閆俊文

  這兩天,中美大模型公司各有大事發(fā)生。

  4月15日凌晨,OpenAI發(fā)布了GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 Mini、GPT-4.1 Nano,它們的核心特征是成本更低,速度更快;同一天,另一家中國明星AI公司,智譜AI正式啟動上市輔導(dǎo)備案,由中金公司擔(dān)任輔導(dǎo)機(jī)構(gòu)。備案報(bào)告顯示,智譜AI將在今年8月至10月完成IPO輔導(dǎo)計(jì)劃。

  此前的3月底,智譜AI CEO張鵬曾告訴《中國企業(yè)家》,他判斷實(shí)現(xiàn)AGI,路程還長,“不管我們?nèi)诹硕嗌馘X,其實(shí)都是AGI道路上的盤纏,未來,還需要更多盤纏,我們會持續(xù)地做相關(guān)的事情”。

  如今看來,這個“更多的盤纏”就是指IPO。

  2025年開年,DeepSeek“燃爆”AI圈,目前,截至R1模型正式發(fā)布已經(jīng)過去86天。

  DeepSeek和梁文鋒的團(tuán)隊(duì)什么時候推出新的大模型產(chǎn)品,尤其是R1的更新版?

  《中國企業(yè)家》統(tǒng)計(jì)了國外Anthropic、Meta等公司更新大模型的周期,如果是模型的重大升級,周期在5至10個月左右;而同一版本的功能升級則在3至4個月之間。

  根據(jù)DeepSeek官網(wǎng)數(shù)據(jù),梁文鋒的AI團(tuán)隊(duì)更新產(chǎn)品與國外主流公司同頻,2024年9月發(fā)布V2.5,12月發(fā)布V3,2025年3月將V3更新為V3-0324版本,也幾乎每隔3個月就會迎來一次升級。

  有一些預(yù)測認(rèn)為,DeepSeek下一次更新R1模型可能是在5月初,屆時或提前發(fā)布,但DeepSeek方面目前還尚未對這種預(yù)測進(jìn)行回應(yīng)。

  OpenAI也在追求更小更快

  公開資料顯示,GPT-3的參數(shù)規(guī)模為1750億,GPT-4的參數(shù)規(guī)模為1.76萬億,到了GPT-4o參數(shù)約2000億規(guī)模,此次OpenAI推出的GPT-4.1 Mini,被稱作OpenAI的高效小型模型,在多個基準(zhǔn)測試中表現(xiàn)超越GPT-4o,大幅減少延遲并降低83%成本。

  GPT-4.1 Nano被稱之為首個超小型模型,它能支持100萬token的上下文窗口,適用于低延遲任務(wù),如分類和自動補(bǔ)全。

  值得注意的是,上述三個模型將上下文窗口處理的規(guī)模從GPT-4o的128K直接提升至100萬token(1M)。這意味著模型在更長的文本中保持專注和理解的能力得到了強(qiáng)化。

  具體到成本、價(jià)格方面,GPT?4.1比GPT?4o便宜26%,輸入、輸出分別是每百萬token2美元和8美元;GPT?4.1 Nano輸入、輸出分別為0.1美元和0.4美元。

  對比DeepSeek,標(biāo)準(zhǔn)時間段內(nèi),V3模型輸入、輸出百萬token的費(fèi)用為0.5元、8元,R1推理的費(fèi)用分別為1元和16元。

  可以說,OpenAI也打上了token的價(jià)格戰(zhàn),價(jià)格直接對標(biāo)DeepSeek。

  與此同時,OpenAI已暫停了其此前2月發(fā)布的GPT-4.5,原因在于成本太高,其API定價(jià)為輸入、輸出每百萬token75美元、150美元。官方回應(yīng)說此次調(diào)整旨在將更多資源投入未來模型的研發(fā)。

  關(guān)于開源,OpenAI的CEO山姆·阿爾特曼不得不走向與DeepSeek同樣的路徑,他曾表示,DeepSeek的出現(xiàn)并未影響GPT的增長,OpenAI將推出更好的開源模型。

  不過,在DeepSeek沖擊之下,阿爾特曼曾經(jīng)一度非常惱火,甚至恐慌,他曾在社交平臺上指責(zé)R1模型使用了GPT的數(shù)據(jù)蒸餾,又寫公開信給美國政府,聲稱限制AI技術(shù)流向中國等國家,并禁用DeepSeek。

  但這并不影響DeepSeek的影響力。在英偉達(dá)的2025GTC開幕主題演講會上,黃仁勛數(shù)次提到R1模型,并用R1模型驗(yàn)證了黃仁勛所謂的“推理越多,所需算力越多”的說法。

  除了OpenAI,谷歌在4月9日也舉辦了發(fā)布會,宣布推出Agent2Agent智能體交互協(xié)議,該協(xié)議允許生態(tài)系統(tǒng)中的AI智能體進(jìn)行底層技術(shù)無關(guān)的相互操作。多個智能體的協(xié)作將帶來更高的自主性,同時成倍提高生產(chǎn)力、降低長期成本。

  梁文鋒的主場時間又快到了

  在R1模型“爆火”之后,DeepSeek除了模型升級,人事布局上動作頗多,DeepSeek官網(wǎng)在3月份發(fā)布了招聘CFO、COO、財(cái)務(wù)負(fù)責(zé)人崗位的信息。這也被一些媒體解讀為DeepSeek在為融資做準(zhǔn)備;模型方面,DeepSeek最大的動作是3月25日發(fā)布了V2模型的更新版。

  目前,DeepSeek并未發(fā)布有關(guān)融資方面的信息。4月3日,梁文鋒和團(tuán)隊(duì)發(fā)表了一篇論文,題目是《通用獎勵建模的推理時間縮放》,文章論述了如何讓注意力機(jī)制更高效地處理更長的上下文等。

  DeepSeek“燃爆”AI圈后,外界對其充滿好奇和新的期待。潞晨科技CEO尤洋近期在接受《中國企業(yè)家》采訪時說,如果有機(jī)會跟梁文鋒面對面,他最想問梁文鋒的是他最終的目標(biāo)是什么,“梁文鋒是想做一個成功的商業(yè)化公司,還是想通過一些其他手段做一些非盈利的事情?這兩者肯定差距是非常大的,OpenAI可能還是想做一個Google那樣的非常高價(jià)值的商業(yè)化公司!

  記者了解到,目前,無論是杭州本地的大公司,還是深圳的頂級創(chuàng)投,都難見梁文鋒一面。

  近期英偉達(dá)公開表示,美國政府正在限制其H20芯片向中國的出口,并且H20芯片對華出口需要獲得許可證,這一要求是“無限期”。

  而H20芯片正是梁文鋒最在意的“基礎(chǔ)設(shè)施”,早先,梁文鋒在接受媒體采訪時說,“我們真正的挑戰(zhàn)從來不是資金,而是高端芯片的出口禁令!

  不過,面對禁令,梁文鋒也并非坐以待斃,他曾在接受媒體采訪時說,“英偉達(dá)的GPU沒有什么神秘之處,但要趕上他們,就必須重建團(tuán)隊(duì)、付出時間和成本,追趕下一代技術(shù)——這才是真正的護(hù)城河。”

(責(zé)任編輯:孫丹)