站长之家 - 业界 2025-02-15 10:03

Claude 4被曝发布在即!DeepSeek把大招都给逼出来了

声明:本文来自于微信公众号 量子位 | 公众号 QbitAI,作者:衡宇,授权站长之家转载发布。

终于!终于!Claude4被曝将在未来几周内发布!

高亮重点,最新的它采取了一个与之前模型路线不同的办法:

是个混合型大模型。

简单来说,就是既带有推理能力,会使用更多的算力来思考和解决难题;在面对简单问题的时候,又能像传统大模型一样短平快地轻巧处理,无需多费不必要的功夫。

图片

怎么样,听起来是不是和昨天奥特曼透露的GPT-5非常类似(doge)。

都是不再把传统通用模型和推理模型分开推出,直接融合在一起。

据透露,Anthropic计划在未来几周内发布该模型。

而翻遍互联网发现,4天前就有人按捺不住,在推特上剧透过:

Anthropic内部员工告诉我,他们将在本周内发布Claude4,以及一个推理模型。

至于性能嘛,超过满血o3!

图片

俗话说得好:传言有出入,期待需谨慎。

但还是禁不住狠狠期待一下!

下面一起来看更详细的剧透——

Claude4不走老路,可控制使用时的推理成本

如前所述,Claude4与此前的通用大模型不同。

把通用模型和推理模型融合到一起去了,会根据具体任务,调整所需算力和所需功能:

遇到复杂的问题,就启用推理能力;遇到简单的问题,就用通用模型处理。

而且用户可以自行控制,每个问题需要耗费多少token——表现出来就是我可以规定它在每个具体的问题上思考推理多长时间。

具体操作,是使用者可以通过一个游标刻度尺来调整,刻度上标注的是“完成任务所需的token数”。

如果将游标滑动到“0”,那么Claude4就是一个传统的、不带推理能力的AI大模型。

滑动到的数值越大,所调用的算力就越多,思考推理过程就越长。

图片

其实呢,OpenAI现在的模型也有类似功能。

不过OpenAI只分了“低-中-高”三档,供用户选择推理强度。

但讲道理,很难预测模型在每一档位实际上会用掉多少tokens,所以很多用户反馈“三个档位并不能很好地控制使用成本”。

不过,这可能和OpenAI和Anthropic的市场定位有关系。

OpenAI更多针对的是普通用户和个人开发者,三档式更简单易懂,方便操作。

而Anthropic更注重企业级市场,相对来说toB一些,所以采用了游标刻度尺来调整,让使用者控制成本、速度等。

推理通用二合一,下一个大趋势?

可以看到,国外大模型的两个最强玩家,Anthropic和OpenAI,都明确了下一步道路:

让通用模型和推理模型合二为一。

几周内将发布的Claude4如此,数月内将发布的GPT-5也是如此。

这或许是所有基座大模型玩家的下一步共同选择也未可知——

当传统Scaling Law撞墙成为一个强共识,而后训练、推理、CoT的重要性与日俱增时,推理变成通用模型的必需技能,似乎是大势所趋。

图片

不过在这中间,Anthropic有属于自己的牢固生态位,那就是它旗下的Claude系列,编程能力一直站在第一梯队的顶尖

而且它擅长的是大厂工程师所需级别的编程任务。

举个例子,Claude系列更擅长理解由数千个文件组成的复杂代码库,并生成就能正常运行的完整代码,且一次成功。

这就非常有意思了~

因为在面对复杂编程问题时,AI大模型往往会偷懒,仅提供注释,而不是吐出实际代码。

不过,现在还不清楚Claude4将如何定价。

会比o3-mini便宜吗?会比DeepSeek-R1便宜吗?会比Google2.0Flash-Lite便宜吗?

暂时还没人知道。

不过有网友说出了大多数人的心声:

如果花1000美元还解决不了我想解决的问题,那不是纯纯浪费钱吗。

图片

说白了,如果不是在某项实用能力上有「傲视群雄的拔尖实力」,或许所有模型玩家在定价这一part上能做的,就是像DeepSeek和Google2.0Flash-Lite一样。

(忍痛)对着价格先狠狠砍一刀,然后再砍一刀,再砍一刀……

参考资料:

[1]https://x.com/iruletheworldmo/status/1888978299159756878

[2]https://x.com/kimmonismus/status/1890056488774676697

推荐关键词

24小时热搜

查看更多内容

大家正在看