站长之家 - 业界 2025-02-21 14:48

DeepSeek让腾讯阿里重新上桌了

声明:本文来自于微信公众号 凤凰网科技,作者:徐珍,授权站长之家转载发布。

“领导都认真了”

春节复工之后,在深圳一家传统企业担任行政岗位的棘棘,被通知她多了一项工作内容:“用DeepSeek完成部分工作、提升工作效率,部门领导要求每周梳理上报AI工具使用成果。”

这让她感到惊讶,“我们是传统行业,虽然之前有使用一些AI技术,但是仅限于研发同事,没有涉及到我们行政部。”棘棘为此犯起了嘀咕:“行政日常不过是收发快递、贴发票、跑跑腿,有必要用AI吗?”

但很快,她就意识到这一次公司领导层尤为认真。据她透露,在短短几天之内,公司迅速组建出一个“AI战略部”,还从外部请来讲师培训全体员工使用DeepSeek,并且要求所有部门按周提交成果。推行AI的力度也是前所未有——培训会上有领导讲到,从下个月开始,公司计划逐步优化掉部分可用AI替代掉的岗位人员。

在北京一家互联网公司总部工作的秋然,也感受到了DeepSeek卷起的热潮。

她向凤凰网科技回忆道,节后复工约一星期后,公司向全体成员发送了一条通知,大意为:“请各位同学集思广益,深入思考DeepSeek可能为业务带来哪些促进,或者可以落地在什么场景中,并提交思考成果。”

技术支持部门的动作很快,借助DeepSeek的开源思路便搭建了一些工具。秋然称:“我们作为互联网公司,本身就有AI方面的能力储备,而且业务形态已经很成熟了,所以之前老板一直是非常谨慎的,不愿意刻意向外求、为了AI而AI。”

但DeepSeek打破了此前的所有犹疑,“听部门领导说,老板觉得如果此时不做动作,可能就要在这一波里被甩下了。”秋然透露。

老板们的紧迫感不难理解,DeepSeek效果惊艳,这直接促进了各家的决策。棘棘告诉凤凰网科技,员工私下里悄悄交流,发现领导层都被DeepSeek的效果“震到了”,“之前ChatGPT、Claude发布的时候,公司也有小范围让业务同事试用过,但都是各有各的‘智障’,过几天就不提这事了。”

DeepSeek打破了这种对AI是“人工智障”的刻板印象,棘棘讲道,据她从新成立的AI部门同事处了解,公司甚至还在考虑加大AI技术方面的投入。

如果说小公司的判断还有失误的可能性,那么巨头的动作,无疑就是这个行业的真正风向标。

2月20日晚,阿里发布财报,阿里集团CEO吴泳铭在财报电话会上称,“ AI时代对于基础设施有明确而巨大的需求,将积极投资于AI基础设施建设,未来三年在云和AI的基础设施投入预计将超越过去十年的总和。”

图片

“阿里也正在AItoC业务层面大举地招兵买马”,一位与阿里有过接触的候选人士对凤凰网科技表示,“看得出来,非常积极”。

就在几天之前,腾讯同样宣布组织架构调整,主要针对AI产品线,继腾讯元宝从TEG(技术工程事业群)转入CSIG(腾讯云与产业事业群)之后,QQ浏览器、搜狗输入法、ima等更多产品和应用也会汇入CSIG。

腾讯也是这一轮最先接入DeepSeek的巨头,微信在接入DeepSeek-R1后迅速掀起市场波澜。

AI的发令枪,已经响了。

狂欢与隐忧并存

尽管新涌入者很多,但身处其中的一些人并不感到意外,在苏州一家智能制造企业担任CTO的冯牧便是其中之一。

他告诉凤凰网科技:“成本、技术、环境,各方面的因素共同造就了行业的狂欢。对很多我们这样的企业而言,自己并没有深厚的大模型研发能力,在产业革命的过程中是很被动的,而DeepSeek开源了这样强大的模型,(为我们)提供的是一剂良药、一个荡平从0到1技术壁垒的方法论。”

如他所言,上游技术创新所带来的利好自然流淌到了下游环节。但与此同时,压力也给到了与DeepSeek同处于基座大模型研发环节的友商。

同样有着出色研究能力的企业,开始反思自己到底错过了什么。

DeepSeek V3与R1的最大功能亮点,是尤为出众的思维链(Long-CoT)能力。

月之暗面研究员Flood Sung透露,早在一年多以前,月之暗面联合创始人周昕宇就已经验证了长思维链的有效性,但公司先意识到了长文本(Long-Text)的重要性,以及考虑到成本问题,让Kimi选择了优先选择攻关长文本功能。

在DeepSeek爆火前,这一路线也完全没有问题。

2024年,月之暗面一度借长文本成为国内最炙手可热的大模型创企,但长文本的商业化场景始终不够明朗,如今仍在探索过程中。

冯牧向凤凰网科技解释道:“你可以把长思维链理解为对复杂问题的解决能力,当大模型拥有了推理思维,那么在编程、数学计算等等领域的应用能力就会提升。这也是为什么DeepSeek要对标OpenAI的o1大模型,后者也是一个标榜思维能力的大模型。”

冯牧强调了o1与DeepSeek V3发布的时间差:“o1正式版是2024年12月初发布的,V3是12月末发布的,而这两者的性能是可以掰手腕的。我们之前总说国内大模型和国外发展差了几年,至少在这类模型方面,DeepSeek帮我们把差距抹平了一些。”

惊艳的效果,也让DeepSeek迅速下沉,撬动了过去任何一家大模型公司都没能撬动的用户盘。

QuestMobile统计显示,DeepSeek在1月28日的日活跃用户数首次超越豆包,并于2月1日突破3000万大关,成为史上最快达成这一里程碑的应用。而随着各大手机厂商、微信等企业官宣接入DeepSeek,流量疯狂涌向后者的态势还是有增无减。

这样的背景之下,从互联网时代沿袭而来的大力投放模式还有效吗?凤凰网科技询问百度、腾讯、昆仑万维等企业,接下来是否考虑大模型产品调整投放策略,截至发文暂无回复。

但从数据中,或许可以看到市场的答案。

AppGrowing数据显示,近日豆包App、Kimi等广告投放量大幅减少,几乎降低至近180天的最低水平。

图片

图|Kimi近180天广告投放量级变化情况,图源/AppGrowing

那些未被察觉的改变

数天之前,DeepSeek悄悄撤下了张贴在办公楼下的LOGO。那是DeepSeek风暴席卷而来半个月后,作为DeepSeek与英特尔、中金、德州仪器等公司共享的办公所在地,北京的融科资讯中心意外成为一个景点。

DeepSeek犹如一条鲶鱼,搅动市场。就连在DeepSeek楼上办公的百度风投,也无法躲避,被质疑距离如此之近却错过投资机会。引得百度风投CEO高雪不得不亲自下场回应,申明是对方无意外部融资。

尽管DeepSeek刻意低调,但今天开始,许多人的工作仍旧和DeepSeek密不可分了。

除了思维链模型,DeepSeek身上的独特标签还有开源模式和低算力需求。而这三点几乎跳脱于国内市场主流玩家押注的所有玩法,甚至重新定义了游戏规则。

原本固守闭源路线的百度,决定从4月1日零时起,允许所有PC端和APP端用户免费使用模型服务,并且计划从下一代模型起正式开源。

作为长思维链代名词的“深度思考”功能,也开始成为了诸多大模型主打的核心标签。无论是百度、阿里、字节,还是科大讯飞、百川智能、月之暗面等AI企业,从1月份开始密集为旗下模型升级了深度思考能力。

该怎么看待DeepSeek另辟蹊径给出的答案?

“没有人敢下定义说它就是对的,只能说的确是一种不可忽视的创新。”AI领域连续创业者、北京市朝阳区一家AI大模型训练服务企业创始人这样告诉凤凰网科技。

“有关开源还是闭源的模式,我也想过很久,最后得到的答案是这是囚徒困境——如果闭源,作为初创公司,有谁会来用你的东西?你凭什么和大厂竞争?所以初创公司只能开源,但开发者们肯定是唯效果论,那在DeepSeek之前,全球最好的开源模型是海外的Llama,你该怎么追上Meta?”他讲道,“所以我最开始的预测是,国内的大厂快速军备竞赛,做出一些效果还不错的模型,然后开源一部分,千行百业都集中用大厂的基座。”

这位创业者承认,自己并未预料到DeepSeek能在这场有关背景实力的竞赛中脱颖而出。如今就职于西二旗一家大厂,曾有硅谷工作背景的算法工程师,也表达了类似的情绪。

这股席卷了市场的“DeepSeek效应”,还蔓延至产业链上游。

根据DeepSeek公开相关论文中的表述,训练V3的仅仅使用了280万GPU小时。而按照OpenAI创始成员之一Andrej Karpathy解读,作为对比,同等性能的模型训练成本却是DeepSeek的十倍多(Llama3405B使用了3080万GPU小时)。

正因如此,DeepSeek-V3与R1模型被誉为“有限算力下的美妙工程”,也引起了市场对持续已久的GPU淘金热的反思。

DeepSeek发布后,全球GPU龙头英伟达股价一度大跌,其中单日跌幅最大达到了17%。不过截至成文,英伟达股价已基本回升至本轮下跌前水平。

尽管如此,当DeepSeek指出一条更经济的道路,下场玩家们还要不要继续沉湎于这场有关算力资源的“无限战争”?接下来或许有人会给出更保守的答案。

(文中冯牧为化名)

ChatGPT源码推荐:小狐狸ChatGPT付费创作系统完全开源源码

推荐关键词

24小时热搜

查看更多内容

大家正在看

DeepSeek,搅了谁的局?

DeepSeek劝不了谷歌们