站长之家 - 业界 2025-02-14 16:51

DeepSeek缝合Claude，比单用R1/o1效果都好！GitHub揽星3k

声明：本文来自于微信公众号量子位 | 公众号 QbitAI，作者：梦晨西风，授权站长之家转载发布。

让DeepSeek代替Claude思考，缝合怪玩法火了。

原因无它:比单独使用DeepSeek R1、Claude Sonnet3.5、OpenAI o1模型的效果更好。

再来看一个测评结果:

在代码编辑基准Polyglot Benchmark上，缝合模型效果小超o1-high和R1一头。

在这个测试中，R1扮演架构师，描述如何解决代码问题。

而Claude扮演程序员，按要求生成特定的代码编辑指令，以便把改动应用到源文件中。

除此之外，实验过程中还得出还有几个有意思的结论:

o1与Claude Sonnet搭配效果并不如单独使用o1。
使用R1或o1当架构师，Claude之外的其他模型当程序员，效果都不如单独使用R1或o1。
但o1-preview和o1-mini当架构师，使用很多不同的模型当程序员都能提高组合的成绩。
使用R1的推理过程token效果不如使用R1的最终输出token。

这样看来，R1和Claude Sonnet还真是一对绝配啊～

DeepClaude应用本身100%免费且开源，在GitHub上已揽获3k星星（当然API要用自己的）。

网友测试后总结到:Claude擅长撰写清晰、结构良好的文本和代码，因此它能将DeepSeek-R1的想法转化为精炼的回复。

DeepClaude作者之一对此有感而发:

AI智能体和智能体应用正在展示出一种“数字世界优先”的范式转变，智能系统正在成为主动的合作者，而不仅仅是被动的工具。

DeepSeek和Claude的混血儿

具体来说，DeepClaude是一个LLM推理API，通过Rust编写。

它提供了一个统一的接口，将DeepSeek R1的CoT逻辑推理能力和Claude的回复在单一流中无缝衔接。

开发者可以通过这个API同时调用两种模型的功能，还能完全掌控自己的API密钥和数据。

打造它的团队名为Asterisk，团队成员具有安全研究&CTF（Capture The Flag）背景，致力于利用AI让检查代码安全这事儿变得更加高效。

团队认为，DeepSeek R1的CoT深度推理甚至达到了LLM具有反省认知（metacognition）的程度，它能够自我纠正、思考不常见/极端/特殊的情况，并在自然语言中进行类似蒙特卡洛树搜索(MCTS)的推理。

不过R1在代码生成、创造力和对话技巧方面有所欠缺，Claude3.5Sonnet在这些方面表现出色，刚好可以作补充。

何不将两者结合起来?取两者之长，打造出DeepClaude～

对话中，Claude回应之前，系统会显示“<thinking>”这样的预填充文本。

DeepClaude结合了这两种模型，具有以下特性:

托管API完全免费，允许用户使用自己的密钥，并将DeepSeek和Claude的流式API整合在一起，提供计算组合使用量和价格等便利功能。

代码是开源的，用户可以自由托管、修改和重新分发。团队表示它已经在Asterisk的生产环境中大规模使用，每天处理数百万token，至今尚未出现故障，只要不滥用就行。

One More Thing

你以为两个模型缝合就是极限了吗?

No no no

还有网友开发出了三缝合玩法，将DeepSeek-R1和Gemini2.0Flash的思考结果组合起来，在让Claude Sonnet去回答问题。

在GPQA测试（谷歌搜不到的理化生博士级选择题）中也取得了好成绩。

Github地址:https://github.com/getasterisk/deepclaude

参考链接:

[1]https://aider.chat/2025/01/24/r1-sonnet.html

[2]https://x.com/deepclaude_/status/1886911416478642279

[3]https://x.com/omercelik/status/1883510797193937278

[4]https://x.com/mufeedvh/status/1883620781583901011

— 完 —

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

大家正在看

Claude 4被曝发布在即！DeepSeek把大招都给逼出来了

2025-02-151.1万阅读

物理测试暴击AI圈，DeepSeek R1稳超o1、Claude，我们已进入RL黄金时代

2025-01-257282阅读

关于deepseek的一些普遍误读

2025-02-056435阅读

英伟达回应股价遭DeepSeek暴击：DeepSeek是出色的AI进步

2025-01-288544阅读

DeepSeek，搅了谁的局？

2025-02-102.4万阅读

DeepSeek劝不了谷歌们

2025-02-061.6万阅读

第一波利用DeepSeek搞钱的人出现了 DeepSeek概念股集体大涨

2025-02-053.0万阅读

DeepSeek的华丽文风是怎样炼成的？

2025-02-107363阅读

DeepSeek让我审视，什么才是属于“人”的创作

2025-02-079582阅读

对于那些出来卖的DeepSeek课程，我有些话想说。

2025-02-112.7万阅读

起猛了，腾讯元宝接入DeepSeek了。

2025-02-133846阅读

DeepSeek爆火之下暗潮汹涌

2025-02-122.8万阅读

是不是好AI，DeepSeek得过玄学关

2025-02-112.9万阅读

AI颠覆者：DeepSeek的过去、现在与未来

2025-02-058204阅读

DeepSeek推翻两座大山

2025-01-281.1万阅读

DeepSeek日活突破2000万 DeepSeek概念股开盘集体大涨

2025-02-062.0万阅读

谷歌DeepMind CEO评价Deepseek为中国最好的作品：但外界炒作有点夸大

2025-02-104704阅读

DeepSeek官方推荐：R1要这样设置

2025-02-168982阅读

商业导师们全面拥抱DeepSeek

2025-02-122.9万阅读

DeepSeek会“杀死”网文作者吗？

2025-02-102.0万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题