昊梵体育网

豆包打电话支持“边听边说”;DeepSeek专家模式支持上传文件 AI语音交互的

豆包打电话支持“边听边说”;DeepSeek专家模式支持上传文件
AI语音交互的革命来了,两个重磅更新同时炸场!
先聊聊这两件事分别是什么。
【豆包 × 全双工语音】
字节跳动在4月9日正式发布了原生全双工语音大模型 Seeduplex,并已在豆包 App 全量上线。
这次升级的核心,是把过去"你说完我再说"的半双工模式,彻底换成了"边听边说"的全双工框架。
简单说,就是以后跟豆包打电话,它能一边听你说话,一边思考、一边回应,节奏更像真人对话。
有两个关键能力值得重点关注:
- 精准抗干扰: 误回复率和误打断率相比上一代减少了一半,背景噪音不再让它乱说话。
- 动态判停: 你在思考、犹豫的时候,它会耐心等;你说完的瞬间,它能快速接话,抢话比例下降了40%。
对话流畅度 MOS 分提升了12%,整体通话满意度提升了8.34%。
这不是小修小补,是语音交互逻辑层面的一次重构。
【DeepSeek × 专家模式上传文件】
DeepSeek 的专家模式也在同期完成了一次重要更新,正式支持上传文件。
App 端和网页端均已上线,具体参数如下:
- 最多可上传 50个文件
- 每个文件上限 100MB
- 支持各类文档和图片格式
需要注意的是,官方明确提示:目前仅识别文字内容,上传文件本质上是 OCR 提取文本,专家模式暂不具备原生视觉感知能力。
也就是说,图片里的文字它能读,但图片本身的内容它看不懂。
【我的判断】
这两个更新,指向同一个方向:AI 工具正在从"能用"快速迭代到"好用"。
豆包在打破语音交互的物理感割裂,DeepSeek 在补齐文档处理的基础能力缺口。
两家路径不同,但都在用实际动作告诉用户:产品还没到天花板。
我是 AI 魔术师,持续追踪每一个值得关注的 AI 变化。