站长之家 - 业界 2025-03-07 17:46

见过开源模型,没见过直接开源AI应用的,这把火山引擎玩大了

声明:本文来自于微信公众号 AI新榜,作者:月山橘 石濑,授权站长之家转载发布。

源神启动!

大模型开源潮从模型卷向了应用,这一次下场的超级玩家是火山引擎。

3月3日,火山引擎正式上线“大模型应用实验室”平台,一口气开源了手机助手、DeepSeek联网版、实时视频理解、互动双语视频生成器等AI应用,涵盖移动终端、内容创作以及教育娱乐等多个领域。

图片

火山引擎此次开源应用发布恰逢DeepSeek现象级爆红后的冷静期。据“AI新榜”观察,主流社交媒体平台上对AI应用的讨论焦点已从技术参数转向是否联网、是否支持多模态等产品力上的比拼。

尤其是DeepSeek的核心优势在于文本推理,更加突显出大模型应用的困境:模型能力≠实际价值。换句话说,能够真正满足用户生活工作需求的AI,才是好应用。

为了加速AI在千行百业中落地应用,火山引擎给出的解题思路是:直接开源应用。无论是企业、独立开发者,还是普通爱好者,都能通过一键复制开源代码,快速搭建基础应用,实现开箱即用、按需迭代。

值得一提的是,早前我们曾在《我用AI开发了一个DeepSeek锐评生成器,被联网满血的D老师“骂爽了”》一文中提到过,无论是SuperCLUE测评,还是我们自己的第一手实测开发体验,从火山引擎调用的DeepSeek R1稳定性表现是最好的。

有开源这等好事,我们自然不能错过,于是第一时间抓住这波免费机会,实测了除需要本地部署的Deep Research外的其余五大AI应用,看看它们各自有哪些亮点、是否真的好用。

火山引擎五大开源应用实测

一、手机助手

最近很火的一张梗图点出了目前手机端AI现状:

图片

说白了就是:手机自带AI不好用,大家还只能凑合着用。

这次火山引擎开源应用中就有手机端的AI智能助手。它基于Deepseek R1、豆包图像理解等多个模型组合,支持屏幕内容智能识别、无需反复切换应用,并且不管手机厂商是哪家,只要是安卓手机(需安卓5.0及以上系统),现在就可以扫码下载体验了

安装完成后,打开应用、开启手机助手,一个紫色悬浮球就会出现在手机界面上。只要你不关闭应用,它就会一直显示在屏幕上,方便你在各个应用里和它交互。

发朋友圈,不知道写什么文案?长按紫色悬浮球,跳出“AI帮写”功能,让DeepSeek帮你写。不满意还可以通过多轮对话反复打磨,直到满意为止。

一开始我们喂给它的文案平平无奇:“去龙华寺了”。经过DeepSeek加工变成了:“手机电量在禅意中悄悄充满的下午三时三十三分”。这点令人十分惊喜。它大概率是根据应用自带的自动化屏幕截图知道了具体时间,于是把时间这一信息点巧妙地融入进了文案,量身定制感十足。

image.png

除了“AI帮写”,还可以让它翻译外国菜单、听不懂的地方方言。只需轻点屏幕上的紫色悬浮球,即可与DeepSeek进行实时语音交互。我们测试了两种方言:上海话和重庆话,得到的翻译结果基本正确。

虽然在长段语音文本断句和嘈杂环境下的语音识别精度还有所欠缺,但整体表现瑕不掩瑜。要知道让AI翻译英文不难,毕竟是各个大模型厂商的标配。而能够精准翻译地方方言,才是AI应用在国内市场迈向多模态进化道路上的真正挑战。

图片

最后一轮测试,我们试着让AI记录每日摄入零食的卡路里。有两种记录方式:一是在外卖软件中唤醒手机助手,通过截屏的方式根据食物图片和配料信息预估卡路里;二是通过相机对准要记录的食物,唤醒手机助手,让它预估卡路里。

得到结果后,将其复制粘贴到手机备忘录就完成了一次卡路里记录。

图片

图片

无论是哪种方式,都让记录每日摄入卡路里这件原本相当繁琐的事情变得轻松简单一些。

三轮测试下来,手机助手这个应用最大的优势是DeepSeek R1+多模态融合的交互方式,让手机端AI变得既“聪明”又好用

尤其对需要随时办公的白领人群或常年在路上的创作者(如旅游博主)来说非常实用,一些轻量化的生产力场景,完全可以让手机成为满足即时需求的创作中枢。

更重要的是,它还是开源的,企业和开发者可以根据现成的应用进行下一步定制和迭代。

二、DeepSeek联网版

AI爱“胡说八道”的幻觉问题,这一点在DeepSeek R1深度思考模型上表现得尤为突出。

为了降低大模型的幻觉问题,在产品层面上,可以通过提供更高效、准确的实时联网搜索功能来实现。例如,在联网情况下,让DeepSeek R1锐评一下“我爸得了MVP”这个热梗,它生成的内容都围绕着事实而非“故事”,给出了准确的答复。其中部分精辟的语句和评价,甚至可以直接用在相关的热梗现象解读稿里。

图片

而在没联网的情况下,DeepSeek会为了完成任务而编造“故事”来自圆其说。

图片

实测同样接入DeepSeek R1但没有联网功能的第三方产品,AI开启“胡编”模式

相比其他应用,火山引擎此次开源的DeepSeek联网版亮点在于其白盒联网能力,即支持用户修改中间联网配置细节,如引用内容源、引用条数等,并提供头条图文和抖音百科等海量优质实时内容。

明确AI信息来源,能在很大程度上有效防范大模型的幻觉问题。尤其对于注重知识搜索和整合的产品来说,减少AI幻觉问题并不是一个次要的技术优化,而是直接影响用户体验和产品价值的关键因素。换句话说,只有当AI能够提供准确、可靠的信息时,用户才会信任它。

三、实时视频理解

相比于纯文字和语音交互,与AI实时视频通话显然是next level。

在火山引擎发布的豆包视频通话功能Demo中,记录了一系列对豆包实时视频通话的测试,涵盖图像识别、代码修正、记忆与联想能力、常识问答以及导航等多个方面,豆包在各项测试中表现出色。

不仅能够准确识别创意加湿器、描述M78星云的天文现象、评估BMI值,一眼分析出一段React贪吃蛇游戏代码的bug,指出useEffect依赖项可能存在问题,还能够记住之前出现过的元素,并进行关联。

最后,豆包还精准识别出了测试者所在的地点,并提供了前往北京南站的准确导航信息,包括路线规划和检票口指引。

一直以来,视觉理解能力都是衡量AI多模态认知能力的核心,也是迈向AGI的关键一步。而实时视频理解能力意味着AI能够“看见”和“理解”世界,更全面地理解和处理复杂的任务,而不仅仅是简单的语音或文本响应。

虽然实时视频通话技术并非全新概念,但火山引擎此次开源,能使开发者和企业能够更低成本、更高效率地接入这一功能,为这些应用场景提供更大的灵活性和可拓展性。

四、互动双语视频生成器

这是一款可以生成互动双语视频的应用,只要简单输入一个主题,就能轻松生成寓教于乐的双语视频,尤其适合教育场景中的儿童内容创作。而且过程十分可控,可以通过调整提示词(prompt)、选择图片或视频素材等方式,干预视频生成的具体效果。

比如我们输入主题“一顶古怪的帽子让一个害羞的孩子变得勇敢,知道他发现真正的勇气其实一直在自己心中”,模型会先后生成故事创意、分镜脚本、分镜画面、分镜配音和最终视频,整个过程十分丝滑。

图片

图片

如果小男孩的衣服和帽子在不同分镜画面中发生了变化,可以点击下方的编辑修改提示词,重新生成画面,以保持角色形象的连贯和统一。

图片

图片

五、语音助手青青

眼下,拟人化、情感化的实时语音交互几乎成了所有AI对话产品的技术风向标。

特别是在社交和陪伴场景中,情感化、低延迟、具备情绪感知能力的语音模型,无疑能够显著提升用户体验。相比冷冰冰的机械音,带有温度、情感的语音反馈能让用户感受到“被倾听”和“被回应”。

以火山引擎推出的语音助手“青青”为例,其不仅拥有“20岁射手座新闻传播专业学生”的人设,还注入了许多“人性化”的细节。比如她的性格率真爽朗、对追星、旅游、唱歌、摄影充满热情,还可以切换不同的音色,这种设计让“青青”不仅仅是一个语音助手,更像是一个懂你的朋友,陪你聊天、安慰你、为你解忧。

在技术层面,青青的实现和部署也相对容易,具备通用性强、跨平台兼容性好的特点,开发灵活,成本相对较低。这意味着,无论是大企业还是小团队,都有机会将语音交互能力嵌入自己的产品中,打造更有温度的应用场景。

技术普惠的新范式:

解构火山引擎应用开源战略

在AI技术爆发式迭代的今天,火山引擎提出一个反直觉的洞见:开源应用的战略价值大于开源模型

当行业沉迷于大模型参数竞赛时,出现了两个断层——认知断层与实践断层。前者表现为很多企业决策者仍困在“大模型能做什么”的基础追问中,后者则体现在即便理解技术价值的企业,也因缺乏可落地的工程化方案,陷入“从0到1”的试错泥潭

而开源应用就是架在这道鸿沟上的钢索桥梁。对于认知层用户,一个能实时解析会议视频的完整应用,远比10篇Transformer架构论文更能具象化AI价值。对于实践层用户而言,一个成熟的“开箱即用”的StarterAPP显然能缩短从理论到实际产品的转化路径

对于企业,尤其是中小型企业和初创公司来说,开源应用意味着可以用更低的成本、在更短的时间内,验证业务场景与AI技术的契合度,避免走弯路。这无疑有助于加速行业创新和项目落地。

面对2025年是一个“应用大年”的产业共识,火山引擎在这个节点开源显然也是一次有意为之的选择。当大模型趋于稳定,行业进入拼应用和落地效果的阶段,开源应用的“现实生产力”将更具说服力。

但开源从来都不是技术情怀的独角戏,火山引擎这场开源运动背后,实际上是对产业生态的长期考量。与其独占技术红利,不如通过开放的姿态,吸引开发者、企业和合作伙伴共同搭建一个更繁荣、更具活力的AI应用生态。而这无论是对开发者还是对企业而言,都是一个共同成长的机会。

目前,火山引擎“大模型应用实验室”的开源应用代码托管在GitHub上,开发者可以通过以下链接访问:

https://github.com/volcengine/ai-app-lab

也可以登录火山引擎,左侧菜单栏找到“应用广场”,免费试用各个应用。最近官方在狂撒代金券,只要注册登录时,输入“AI新榜”邀请码:AZ39II1O,即可获得相当于375万tokens的15元代金券,邀请好友注册还能再获得一张可抵扣3250万tokens的代金券,足够免费畅玩好一阵子了

相关话题

推荐关键词

24小时热搜

查看更多内容

大家正在看