|
查看: 54|回复: 2
|
DeepSeek又有重磅消息?梁文鋒論文曝新技術「突破GPU記憶體限制」
[复制链接]
|
|
|
1月12日晚間,中國人工智慧(AI)初創公司DeepSeek創始人梁文鋒與北京大學研究人員共同署名發表了一篇技術論文,提出了一種新的模型訓練技術。他們表示,該技術可以通過繞過圖形處理單元(GPU)記憶體限制,實現「參數的積極擴展」。觀察者網報導了前述訊息,隨後引發關注。
香港《南華早報》1月13日報導指出,此舉凸顯了DeepSeek在算力相對美國行業領先企業存在差距的情況下,持續專注於最大限度地提高成本效率。與此同時,外界猜測該公司將在今年春節之前發佈一款重要的新模型。
報導稱,這篇技術含量極高的論文將受到中國和美國業內人士的廣泛關注,他們希望從中瞭解DeepSeek所取得的最新進展。在過去一年中,DeepSeek一直是中國AI領域創新的典範。
|
|
|
|
|
|
|
|
|
|
|
发表于 15-1-2026 09:54 AM
|
显示全部楼层
|
DEEPSEEK一炮而红后现在已经被晒在一旁,评价也越来越低 |
|
|
|
|
|
|
|
|
|
|
发表于 15-1-2026 10:01 AM
|
显示全部楼层
本帖最后由 lcw9988 于 15-1-2026 10:03 AM 编辑
一年吹一次都没人屌它 DEEPSHIT了 ! 
和 GEMINI, CHATGPT, GROK, Anthropic . . . 差距太大了
|
|
|
|
|
|
|
|
|
| |
本周最热论坛帖子
|