豆包实时语音大模型正式上线！端到端语音对话情商智商双高

快科技1月20日消息，今日，字节跳动豆包大模型团队宣布，豆包实时语音大模型今日正式上线，并在豆包App全量开放，将App升级至7.2.0版本即可体验。

据介绍，豆包实时语音大模型是一款语音理解和生成一体化的模型，实现了端到端语音对话。

相比传统级联模式，在语音表现力、控制力、情绪承接方面表现惊艳，并具备低时延、对话中可随时打断等特性，号称情商智商双高”。

该模型是真正意义上的端到端语音系统，主要面向中文语境和场景（可进行英语对话，暂不支持多语种）。

豆包表示，依托于语音和语义联合建模，豆包实时语音大模型拥有丰富表现力，呈现出接近真人的语音表达水准。

通过学习角色语音和情感特点，模型具备强大讲故事能力，在对话或内容演绎中，可生动切换成不同角色/状态，配合不同情绪表达，增强交互趣味性和沉浸感。

联合建模后，模型涌现出超出预期的指令理解、声音扮演和声音控制能力。

比如，目前模型部分方言和口音，主要源自于Pretrain阶段数据泛化，而非针对性训练。

豆包实时语音大模型输出语音表现力高度逼近真人，包括类人的副语言特征（如语气词、停顿思考等），同时赋予模型实时联网功能，能根据问题，动态获取最新信息，对时效问题给到精准、及时的回应。

从豆包发布的技术展示来看，该模型语音语气自然度和情绪饱满度逼近真人，对话风格更加拟人，情感理解更加深刻，对用户的情绪做到较好承接。

豆包大模型团队也坦言，现阶段的模型主要支持中文，其他语种尚未较好支持，中文范围内，模型也仅支持小部分方言和地方口音的理解和表达。

你还说这是AI？我们体验了一波生成亚洲人最好看的文生图大模型

2024-12-301.1万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

豆包实时语音大模型正式上线！端到端语音对话情商智商双高

推荐关键词

24小时热搜

大家正在看

字节跳动与科大讯飞：大模型之战的AB面

讯飞星火大模型升级发布会：语音同传大模型开启AI翻译新纪元

豆包说要「普惠」，于是大模型处理图片按「厘」计价了

讯飞同传搭载星火语音同传的模型，更快更准的AI翻译

理想同学AI大模型APP抢鲜体验：识物精准、语音交互流畅

OpenAI源代码分享！实时AI Agent，20分钟开发语音智能体

天工版o1、4o同时上线！超强逻辑推理秒杀数学竞赛，实时语音陪聊太上头

AI日报：Kimi发布多模态图片理解模型API；周鸿祎参演AI短剧开拍；MiniMax-01系列模型开源；星火同传语音大模型发布

AI日报：字节豆包全新上线AI编程功能；腾讯大模型检测工具打假AI；FLUX Pro微调API可定制AI模型

AI日报：可灵AI API对口型能力全面开放；豆包大模型宣称追平GPT-4；百度2024年度AI提示词“答案”；通义千问视觉模型直降80%

视频生成大模型赛道，只是看上去拥挤

微信官宣上线语音消息倍速播放功能：时长需不少于5秒

“卷王”豆包上桌，压力给到了谁？

美团听障骑手助手全量上线：支持在线沟通语音转文字

字节跳动海外上线短剧App Melolo：可免费看短剧

大模型不再有信仰

智象多模态生成大模型3.0发布离幻觉更远与离落地更近

你还说这是AI？我们体验了一波生成亚洲人最好看的文生图大模型

羡慕不已！网友晒字节跳动员工三餐每人每天100元标准且免费

寒武纪：深挖生成式大模型算力打造智能芯片新引擎

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

豆包实时语音大模型正式上线！端到端语音对话 情商智商双高

推荐关键词

24小时热搜

大家正在看

字节跳动与科大讯飞：大模型之战的AB面

讯飞星火大模型升级发布会：语音同传大模型开启AI翻译新纪元

豆包说要「普惠」，于是大模型处理图片按「厘」计价了

讯飞同传搭载星火语音同传的模型，更快更准的AI翻译

理想同学AI大模型APP抢鲜体验：识物精准、语音交互流畅

OpenAI源代码分享！实时AI Agent，20分钟开发语音智能体

天工版o1、4o同时上线！超强逻辑推理秒杀数学竞赛，实时语音陪聊太上头

AI日报：Kimi发布多模态图片理解模型API；周鸿祎参演AI短剧开拍；MiniMax-01系列模型开源；星火同传语音大模型发布

AI日报：字节豆包全新上线AI编程功能；腾讯大模型检测工具打假AI；FLUX Pro微调API可定制AI模型

AI日报：可灵AI API对口型能力全面开放；豆包大模型宣称追平GPT-4；百度2024年度AI提示词“答案”；通义千问视觉模型直降80%

视频生成大模型赛道，只是看上去拥挤

微信官宣上线语音消息倍速播放功能：时长需不少于5秒

“卷王”豆包上桌，压力给到了谁？

美团听障骑手助手全量上线：支持在线沟通语音转文字

字节跳动海外上线短剧App Melolo：可免费看短剧

大模型不再有信仰

智象多模态生成大模型3.0发布 离幻觉更远与离落地更近

你还说这是AI？我们体验了一波生成亚洲人最好看的文生图大模型

羡慕不已！网友晒字节跳动员工三餐 每人每天100元标准且免费

寒武纪：深挖生成式大模型算力 打造智能芯片新引擎

豆包实时语音大模型正式上线！端到端语音对话情商智商双高

智象多模态生成大模型3.0发布离幻觉更远与离落地更近

羡慕不已！网友晒字节跳动员工三餐每人每天100元标准且免费

寒武纪：深挖生成式大模型算力打造智能芯片新引擎