站长之家 - 业界 2025-01-12 14:44

AI圈开年首炸:139位中国清北名校天才 创立一家震撼硅谷的企业

中国AI领军企业<a href="//m.fordpalmbay.com/tags/855878.shtml" target="_blank">DeepSeek</a>横空出世,震撼全球科技界

DeepSeek: 中国AI领域的开年重磅突破

据国内外媒体报道,DeepSeek以其卓越的本土研发实力震惊了全球科技界。这家AI创业公司汇聚了一支由清北等名校精英组成的精英团队,以其独特的人才结构和技术成就成为业界瞩目的焦点。

规模虽小,实力不俗

DeepSeek团队规模精干,工程师和研究人员仅有139人。与之相比,海外同行的OpenAI拥有1200名研究人员,Anthropic也有500多名。但DeepSeek凭借其强大的研发能力,在业界脱颖而出。

一系列吸睛标签,大放异彩

DeepSeek凭借"未寻求外部融资"、"创始人囤卡富翁"、"团队成员均为清北等名校毕业生"等一系列吸睛标签,成功在AI创业圈中崭露头角。

V3开源模型表现亮眼

2024年12月,DeepSeek发布了最新的V3开源模型。该模型在评测中表现出色,超越了阿里自研的Qwen2.5-72B和Meta自研的Llama 3.1-405B等顶级开源模型,甚至与GPT-4o、Claude 3.5-Sonnet等顶级闭源模型相媲美。

训练成本低于同类模型,打破限制

值得注意的是,DeepSeek V3大模型发布后完全开源,其训练成本远低于同类模型。数据显示,OpenAI GPT-4的训练成本高达6300万美元,而DeepSeek-V3的成本仅为其十分之一不到。此外,DeepSeek V3模型的训练是在2000块英伟达H800 GPU上完成的,远远低于硅谷大厂普遍使用的数十万块更高性能的GPU。这一成就打破了算力芯片对国产大模型的限制瓶颈。

全球AI专家赞誉有加

DeepSeek-V3模型的出色表现,得到了全球AI专家的高度赞扬。OpenAI创始团队成员Andrej Karpathy发帖赞叹:"DeepSeek-V3性能高过Llama3最强模型,且耗费资源仅十分之一,未来或许不需要超大规模的GPU集群了。" Meta科学家田渊栋惊叹道:"FP8预训练、MoE、预算非常有限的强大性能、从CoT中提取以进行引导——这是伟大的工作!"。

中国AI技术创新佼佼者

DeepSeek的创始人梁文锋表示,中国需要逐步成为技术的贡献者,而不是一直依赖西方的创新成果。他强调了中国AI发展需要建立自己的技术生态,并指出很多国产芯片发展不起来,正是因为缺乏配套的技术社区和前沿技术的参与。

独特历程,独树一帜

DeepSeek的母公司幻方量化是一家量化基金起家的企业,与DeepSeek的用人风格相似,均注重本土人才。DeepSeek在AI产品正式亮相前,曾长时间内部孵化该产品,并招聘文科人才提供相关知识来源。这一独特的历程使得DeepSeek在AI领域独树一帜,成为中国AI技术创新的佼佼者。

推荐关键词

24小时热搜

查看更多内容

大家正在看

为什么说DeepSeek是2025年的Kimi