全网都在等梁文锋
创始人
2025-04-28 20:41:37
0

在如今的网络世界里,有一种神秘的等待在悄然蔓延。全网都在等梁文锋,仿佛他是一颗璀璨的星辰,吸引着众人的目光。不知他是一位才华横溢的创作者,还是在某个领域有着非凡成就的人。他的名字如同一道神秘的密码,引发着大家的好奇与期待。或许他即将带来一场震撼心灵的艺术表演,或许他将有重大的科研成果问世,又或许他会以独特的方式改变我们的生活。无论如何,全网都在翘首以盼,等待着梁文锋的出现,见证那即将开启的精彩篇章。


五月将至,中美科技巨头或将迎来新一轮巅峰对决。


先是在4月中旬,OpenAI一口气发布了GPT-4.1 o3、o4 mini系列模型;谷歌则拿出了Gemini 2.5 Flash Preview,一个混合推理模型;与谷歌同一天,豆包在杭州巡展中正式发布了1.5·深度思考模型,在多模态上展现出了更强的实力。凤凰网科技从行业人士处了解到,阿里的下一代大模型Qwen3也将于本月内发布。


混战之下,那股“神秘的东方力量”似乎也在悄悄准备着新的发布。


敏感的神经之下,一点蛛丝马迹都会被放大。昨日,全球最大AI开源社区Hugging Face首席执行官Clément Delangue在社交平台发布了一条耐人寻味的动态。这条动态仅由三个眼睛的表情符号构成,并附上了DeepSeek团队在Hugging Face平台的官方资源库入口。



这组充满悬念的组合引发科技圈热议,业内普遍推测DeepSeek R2模型已进入发布倒计时。


一、DeepSeek R2发布已进入倒计时?


近半个月来,有关“DeepSeek全新模型R2即将问世”的传闻持续发酵。除HuggingFace首席执行官Clément Delangue发布动态外,玩家@deedydas也在社交平台贴出了所谓DeepSeek-R2大模型的详细技术参数。



1. 拥有1.2万亿参数,活跃参数为780亿,采用混合MoE架构


2. 成本比GPT-4o便宜97.3%(输入每百万次0.07美元,输出每百万次0.27美元)


3. 使用了5.2PB的训练数据,在C-Eval2.0测试中取得了89.7%的得分


4. 视觉能力更强,在COCO测试集上达到了92.4%



凤凰网科技就以上消息向DeepSeek方面发去询问,对方表示不予回应。有接近DeepSeek的知情人士对凤凰网科技表示,目前网上盛传的消息,真实性含量非常低。


但结合DeepSeek的产品迭代规律与产业链动态,其五月有望发布新品的传闻却并非空穴来风。


据《中国企业家》报道,过去DeepSeek创始人梁文锋率领的AI团队始终保持着与国际巨头同频的产品迭代节奏——2024年9月推出V2.5版本,12月发布V3基础架构,次年3月即升级至V3-0324版本,形成每季度重大更新的开发范式。这种紧扣行业脉搏的研发策略,使得业界普遍预测其下一代主力模型R2或将延续“五一档”发布传统。


路透社此前披露的研发动向印证了这种猜测:DeepSeek正在加快R1模型的后续产品R2的研发和发布进程,原计划在5月初发布,但公司现在希望能够尽早推出。


更值得关注的是技术演进方向,此前也有业内人士推测,DeepSeek-R2模型预计将在代码生成和除英语外的更多语种推理能力方面有不小的提升。


这一预期并非无中生有——今年三月发布的V3-0324版本已展现惊人实力,根据Artificial Analysis Intelligence Index最新评测,该模型已经成为得分最高的非推理模型。在基准测试中力压Google Gemini 2.0 Pro、Anthropic Claude 3.7Sonnet及Meta Llama 3.3 70B等顶尖模型。


这种技术积淀与迭代速度,使得R2尚未发布便已承载全球AI界的较高期待。无论前述传闻最终是否成真,可以预见的是,当这款新模型正式亮相时,或将改写新一轮全球算法与算力生态格局。


二、该梁文锋出场了


在国产AI大模型赛道暗流涌动的当下,DeepSeek创始人梁文锋的每一步都走得很稳。他曾说过:“中国也要逐步成为创新贡献者,而不是一直搭便车。”


尽管近期DeepSeek在公众视野中保持低调,但梁文锋一直在向着DeepSeek的核心使命努力,那就是探索通用人工智能的本质。


多位接触过DeepSeek团队的人士都认为,梁文锋的志向不在服务好用户和做好产品,而是直指终极AGI。这让他在早年间试探性接触资方时,优先排除了有退出顾虑的绝大多数机构,甚至主要依托于自有资金,“梁文锋也有这个资本实力”。


一位在早期就接触过DeepSeek的机构对凤凰网科技表示,梁文锋很早就发现Chatbot产品的可替代性很强,“现在的产品都没有黏性,所以只要技术强随时可以把用户抢过来”。DeepSeek R1的发布也的确证实了这一观点。


DeepSeek的最后一次模型更新发布是在今年3月,发布了V3-0324版本,也被看作是R2的基础模型,已针对性能、用户体验和实用性进行了优化,通过6850亿参数的MoE架构升级,代码能力显著增强,又一次深度影响了全球市场。


因而5月或将发布的旗舰模型R2,也被视为影响全球AI格局的关键落子。


特别需要说明的是,这一技术攻坚的窗口期,恰逢国产芯片产业剧变。美国对英伟达H20芯片的出口禁令,直接斩断中国AI企业获取高端GPU的主渠道,倒逼华为昇腾910C、寒武纪MLUarch04等国产芯片加速填补市场空白。


清程极智的CEO汤雄超曾经告诉凤凰网科技,作为当前开源市场所能用到的最好模型,DeepSeek和最难获取的芯片一度是深度捆绑的。如此前DeepSeek开源周所呈现的,其推出了一系列针对英伟达H卡的算力优化方案。


这让梁文锋在早年间曾表达:“我们真正的挑战从来不是资金,而是高端芯片的出口禁令。”


但禁令也从未真正束缚其技术野心,“英伟达的GPU没有什么神秘之处,但要赶上他们,就必须重建团队、付出时间和成本,追赶下一代技术——这才是真正的护城河。”梁文锋表示。


多位国产算力产业从业人士也对凤凰网科技表示,当前国产生态已在加速迭代中。


本次DeepSeek新一代旗舰模型发布,也或将存在另一变量,即在推理侧深度适配国产算力。


当前,千行百业都展现出了旺盛的大模型部署需求,但正如李彦宏所言,DeepSeek最大的问题就是又慢又不稳定,如何才能获取到稳定的、便宜的满血版DeepSeek,这不仅仅是行业需要解决的问题,更需要DeepSeek官方加入其中。


值得一提的是,凤凰网科技从行业人士处了解到,DeepSeek已经在和一些国产芯片合作,“国产芯片中有些头部的,实际上已经在和DeepSeek合作了”。


但对于合作的进展,以及R2可能满足的情况,目前尚不能得知更多细节。

相关内容

宫崎骏比肩黑泽明的神作,五...
宫崎骏的这部神作,堪称与黑泽明比肩之作,五一期间重磅重映,再度引发...
2025-04-30 16:21:13
五一好去处|“粤通行”新姿...
“五一”假期去哪?攻略选择困难?广东车主的“黄金高峰期”出行焦虑,...
2025-04-30 16:18:04
自己能够战胜自己吗?
自己能够战胜自己吗?很简单,学习一下阿Q:精神胜利法,呵呵楼主,你...
2025-04-30 16:09:30
市值300亿,江苏首富闯关...
在资本市场的舞台上,一家市值达 300 亿的江苏企业正开启一场大胆...
2025-04-30 16:01:14
亚马逊“价格雪崩”倒计时?...
在亚马逊的舞台上,一场“价格雪崩”倒计时正悄然开启。面对可能高达 ...
2025-04-30 15:41:15
谁能帮我翻译一下这首诗
谁能帮我翻译一下这首诗独醉小楼壶酒,鹊会娇妍执手。惜若镜中花,糖似...
2025-04-30 15:38:30
如今的“青椒”,更容易早逝...
请你明确一下“青椒”具体所指呀,是指某种蔬菜“青椒”呢,还是有其他...
2025-04-30 15:21:46

热门资讯

宫崎骏比肩黑泽明的神作,五一重... 宫崎骏的这部神作,堪称与黑泽明比肩之作,五一期间重磅重映,再度引发轰动。影片以其细腻的情感、奇幻的画...
市值300亿,江苏首富闯关跨界... 在资本市场的舞台上,一家市值达 300 亿的江苏企业正开启一场大胆的跨界并购之旅。这位江苏首富凭借着...
亚马逊“价格雪崩”倒计时?连线... 在亚马逊的舞台上,一场“价格雪崩”倒计时正悄然开启。面对可能高达 30%的涨幅,却有一位淡定的华裔格...
如今的“青椒”,更容易早逝吗? 请你明确一下“青椒”具体所指呀,是指某种蔬菜“青椒”呢,还是有其他特定含义的“青椒”呢?如果是指某种...
原创 星... 上海车展即将谢幕,为何今年的展会几乎没有存在感? 这是来自网友的评论与疑问。 相信真正了解近期汽车行...
四川旅游攻略自由行攻略参团5天... 标题:我的四川五日四晚梦幻之旅——跟着乐乐导游深度体验四川魅力 四川旅游推荐!当地导游-乐乐:185...
五一趣村游,来鹅遇美食村“烧大... TRAVEL 五一 趣 村游 来鹅遇美食村躺赢 风/里/撒/欢 云/下/停/步 ...
跟团去贵州五日游路线怎么规划?... 这次贵州5天纯玩游价格人均花了1000左右,几天时间里,就让我感受到了不一样的贵州,圆了第一次去的遗...
一家人去黄山旅游五天走团要多少... 一家人去黄山旅游五天走团要多少钱,黄山5日游的团多少钱? 黄山,这座被誉为“天下第一奇山”的名山,以...