老显卡也能用！美团开源首发INT8无损满血版DeepSeek R1

快科技3月7日消息，日前美团技术团队宣布对DeepSeek R1进行了INT8精度量化，让DeepSeek R1可以在如A100等老型号GPU上进行部署。

据介绍，DeepSeek R1发布以后不少企业和个人都在尝试部署满血版本，但原生版本的模型权重为FP8数据格式，对GPU芯片类型有严格限制，仅能被英伟达新型GPU支持（如Ada、Hopper架构芯片），其他型号GPU（如A100）无法直接部署。

虽然可以将FP8权重反量化为BF16权重后，在A100等GPU上进行推理，但是这对显存的要求提升了一倍，推理吞吐也会下降。

为此美团搜索和推荐平台部对DeepSeek R1模型进行了INT8精度量化尝试，发现使用INT8量化后模型精度基本无损。

基于INT8量化，DeepSeek R1模型解锁了芯片限制，可以部署到A100等其他型号GPU；并且相比BF16实现了50%的吞吐提升，进一步降低了推理成本。

目前量化代码已经发布在了开源LLM推理框架SGLang上，量化模型已经发布到了Hugging Face社区：

https://huggingface.co/meituan/DeepSeek-R1-Block-INT8

https://huggingface.co/meituan/DeepSeek-R1-Channel-INT8

对具体过程感兴趣的，可以查看官方技术报告。

32B IOI奥赛击败DeepSeek-R1！Open R1开源复刻第三弹，下一步R1-Zero

2025-03-122.2万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

老显卡也能用！美团开源首发INT8无损满血版DeepSeek R1

推荐关键词

24小时热搜

大家正在看

阿里推出全新推理模型：仅1/21参数媲美DeepSeek R1

谷歌：我们的Gemma 3，单GPU便能媲美Deepseek

“复制”DeepSeek，量化巨头为何能成大模型顶流？

DeepSeek V3“小版本更新”背后，V3和R1正在融合成一个模型

卓世科技：DeepSeek部署接入全攻略

中国AI大模型APP月活TOP10出炉：DeepSeek第一 1.8亿遥遥领先

我用扣子Coze搭建了一个超频版DeepSeek-R1

DeepSeek官方辟谣：R2发布为假消息

32B IOI奥赛击败DeepSeek-R1！Open R1开源复刻第三弹，下一步R1-Zero

字节和DeepSeek争抢“天才少年”

马化腾：和梁文锋有交流非常敬佩DeepSeek

小红书“如接”DeepSeek

暂时不敢用deepseek写作了

DeepSeek-R1联网搜索能力首测：腾讯元宝第一

华南高校X亿万克，完成DeepSeek本地化部署！

苏姿丰：DeepSeek发布首日AMD就给予了支持、还在一直优化

曼朗：DeepSeek如何赋能新搜索营销？

高通总裁谈DeepSeek：AI模型正在变得更小、更有能力

LG发布韩国首款开源推理AI模型，韩媒声称：数学比Deepseek强！

后DeepSeek时代：六小虎向左，BAT向右

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

老显卡也能用！美团开源首发INT8无损满血版DeepSeek R1

推荐关键词

24小时热搜

大家正在看

阿里推出全新推理模型：仅1/21参数媲美DeepSeek R1

谷歌：我们的Gemma 3，单GPU便能媲美Deepseek

“复制”DeepSeek，量化巨头为何能成大模型顶流？

DeepSeek V3“小版本更新”背后，V3和R1正在融合成一个模型

卓世科技：DeepSeek部署接入全攻略

中国AI大模型APP月活TOP10出炉：DeepSeek第一 1.8亿遥遥领先

我用扣子Coze搭建了一个超频版DeepSeek-R1

DeepSeek官方辟谣：R2发布为假消息

32B IOI奥赛击败DeepSeek-R1！Open R1开源复刻第三弹，下一步R1-Zero

字节和DeepSeek争抢“天才少年”

马化腾：和梁文锋有交流 非常敬佩DeepSeek

小红书“如接”DeepSeek

暂时不敢用deepseek写作了

DeepSeek-R1联网搜索能力首测：腾讯元宝第一

华南高校X亿万克，完成DeepSeek本地化部署！

苏姿丰：DeepSeek发布首日AMD就给予了支持、还在一直优化

曼朗：DeepSeek如何赋能新搜索营销？

高通总裁谈DeepSeek：AI模型正在变得更小、更有能力

LG发布韩国首款开源推理AI模型，韩媒声称：数学比Deepseek强！

后DeepSeek时代：六小虎向左，BAT向右

马化腾：和梁文锋有交流非常敬佩DeepSeek