壓力給到梁文鋒_中國經(jīng)濟(jì)網(wǎng)—

　　根據(jù)DeepSeek過往的產(chǎn)品更新周期來看，梁文鋒的主場時間又快到了。

　　文｜《中國企業(yè)家》記者閆俊文

　　這兩天，中美大模型公司各有大事發(fā)生。

　　4月15日凌晨，OpenAI發(fā)布了GPT-4.1系列模型，包括GPT-4.1、GPT-4.1 Mini、GPT-4.1 Nano，它們的核心特征是成本更低，速度更快；同一天，另一家中國明星AI公司，智譜AI正式啟動上市輔導(dǎo)備案，由中金公司擔(dān)任輔導(dǎo)機(jī)構(gòu)。備案報(bào)告顯示，智譜AI將在今年8月至10月完成IPO輔導(dǎo)計(jì)劃。

　　此前的3月底，智譜AI CEO張鵬曾告訴《中國企業(yè)家》，他判斷實(shí)現(xiàn)AGI，路程還長，“不管我們?nèi)诹硕嗌馘X，其實(shí)都是AGI道路上的盤纏，未來，還需要更多盤纏，我們會持續(xù)地做相關(guān)的事情”。

　　如今看來，這個“更多的盤纏”就是指IPO。

　　2025年開年，DeepSeek“燃爆”AI圈，目前，截至R1模型正式發(fā)布已經(jīng)過去86天。

　　DeepSeek和梁文鋒的團(tuán)隊(duì)什么時候推出新的大模型產(chǎn)品，尤其是R1的更新版？

　　《中國企業(yè)家》統(tǒng)計(jì)了國外Anthropic、Meta等公司更新大模型的周期，如果是模型的重大升級，周期在5至10個月左右；而同一版本的功能升級則在3至4個月之間。

　　根據(jù)DeepSeek官網(wǎng)數(shù)據(jù)，梁文鋒的AI團(tuán)隊(duì)更新產(chǎn)品與國外主流公司同頻，2024年9月發(fā)布V2.5，12月發(fā)布V3，2025年3月將V3更新為V3-0324版本，也幾乎每隔3個月就會迎來一次升級。

　　有一些預(yù)測認(rèn)為，DeepSeek下一次更新R1模型可能是在5月初，屆時或提前發(fā)布，但DeepSeek方面目前還尚未對這種預(yù)測進(jìn)行回應(yīng)。

　　OpenAI也在追求更小更快

　　公開資料顯示，GPT-3的參數(shù)規(guī)模為1750億，GPT-4的參數(shù)規(guī)模為1.76萬億，到了GPT-4o參數(shù)約2000億規(guī)模，此次OpenAI推出的GPT-4.1 Mini，被稱作OpenAI的高效小型模型，在多個基準(zhǔn)測試中表現(xiàn)超越GPT-4o，大幅減少延遲并降低83%成本。

　　GPT-4.1 Nano被稱之為首個超小型模型，它能支持100萬token的上下文窗口，適用于低延遲任務(wù)，如分類和自動補(bǔ)全。

　　值得注意的是，上述三個模型將上下文窗口處理的規(guī)模從GPT-4o的128K直接提升至100萬token（1M）。這意味著模型在更長的文本中保持專注和理解的能力得到了強(qiáng)化。

　　具體到成本、價(jià)格方面，GPT?4.1比GPT?4o便宜26%，輸入、輸出分別是每百萬token2美元和8美元；GPT?4.1 Nano輸入、輸出分別為0.1美元和0.4美元。

　　對比DeepSeek，標(biāo)準(zhǔn)時間段內(nèi)，V3模型輸入、輸出百萬token的費(fèi)用為0.5元、8元，R1推理的費(fèi)用分別為1元和16元。

　　可以說，OpenAI也打上了token的價(jià)格戰(zhàn)，價(jià)格直接對標(biāo)DeepSeek。

　　與此同時，OpenAI已暫停了其此前2月發(fā)布的GPT-4.5，原因在于成本太高，其API定價(jià)為輸入、輸出每百萬token75美元、150美元。官方回應(yīng)說此次調(diào)整旨在將更多資源投入未來模型的研發(fā)。

　　關(guān)于開源，OpenAI的CEO山姆·阿爾特曼不得不走向與DeepSeek同樣的路徑，他曾表示，DeepSeek的出現(xiàn)并未影響GPT的增長，OpenAI將推出更好的開源模型。

　　不過，在DeepSeek沖擊之下，阿爾特曼曾經(jīng)一度非常惱火，甚至恐慌，他曾在社交平臺上指責(zé)R1模型使用了GPT的數(shù)據(jù)蒸餾，又寫公開信給美國政府，聲稱限制AI技術(shù)流向中國等國家，并禁用DeepSeek。

　　但這并不影響DeepSeek的影響力。在英偉達(dá)的2025GTC開幕主題演講會上，黃仁勛數(shù)次提到R1模型，并用R1模型驗(yàn)證了黃仁勛所謂的“推理越多，所需算力越多”的說法。

　　除了OpenAI，谷歌在4月9日也舉辦了發(fā)布會，宣布推出Agent2Agent智能體交互協(xié)議，該協(xié)議允許生態(tài)系統(tǒng)中的AI智能體進(jìn)行底層技術(shù)無關(guān)的相互操作。多個智能體的協(xié)作將帶來更高的自主性，同時成倍提高生產(chǎn)力、降低長期成本。

　　梁文鋒的主場時間又快到了

　　在R1模型“爆火”之后，DeepSeek除了模型升級，人事布局上動作頗多，DeepSeek官網(wǎng)在3月份發(fā)布了招聘CFO、COO、財(cái)務(wù)負(fù)責(zé)人崗位的信息。這也被一些媒體解讀為DeepSeek在為融資做準(zhǔn)備；模型方面，DeepSeek最大的動作是3月25日發(fā)布了V2模型的更新版。

　　目前，DeepSeek并未發(fā)布有關(guān)融資方面的信息。4月3日，梁文鋒和團(tuán)隊(duì)發(fā)表了一篇論文，題目是《通用獎勵建模的推理時間縮放》，文章論述了如何讓注意力機(jī)制更高效地處理更長的上下文等。

　　DeepSeek“燃爆”AI圈后，外界對其充滿好奇和新的期待。潞晨科技CEO尤洋近期在接受《中國企業(yè)家》采訪時說，如果有機(jī)會跟梁文鋒面對面，他最想問梁文鋒的是他最終的目標(biāo)是什么，“梁文鋒是想做一個成功的商業(yè)化公司，還是想通過一些其他手段做一些非盈利的事情？這兩者肯定差距是非常大的，OpenAI可能還是想做一個Google那樣的非常高價(jià)值的商業(yè)化公司�！�

　　記者了解到，目前，無論是杭州本地的大公司，還是深圳的頂級創(chuàng)投，都難見梁文鋒一面。

　　近期英偉達(dá)公開表示，美國政府正在限制其H20芯片向中國的出口，并且H20芯片對華出口需要獲得許可證，這一要求是“無限期”。

　　而H20芯片正是梁文鋒最在意的“基礎(chǔ)設(shè)施”，早先，梁文鋒在接受媒體采訪時說，“我們真正的挑戰(zhàn)從來不是資金，而是高端芯片的出口禁令�！�

　　不過，面對禁令，梁文鋒也并非坐以待斃，他曾在接受媒體采訪時說，“英偉達(dá)的GPU沒有什么神秘之處，但要趕上他們，就必須重建團(tuán)隊(duì)、付出時間和成本，追趕下一代技術(shù)——這才是真正的護(hù)城河。”

（責(zé)任編輯：孫丹）

亚洲国产成人久久一区WWW,中文字幕日韩人妻在线视频,亚洲最大中文字幕无码网站,欧美黑吊大战白妞

壓力給到梁文鋒

壓力給到梁文鋒