导读部分 返回列表
Google Gemini 3.5 Live Translate:实时语音翻译的新突破 最近Google又放大招了,推出了Gemini 3.5 Live Translate——一个能实时翻译、还能保留...
正文内容
Google Gemini 3.5 Live Translate:实时语音翻译的新突破

最近Google又放大招了,推出了Gemini 3.5 Live Translate——一个能实时翻译、还能保留你说话语气和声调的AI模型。作为一个经常需要和海外团队开会的职场人,我第一时间就关注到了这个功能。
说实话,Google在实时翻译这条路上已经走了好几年。以前我们只能在Google翻译App里用一下,或者戴着Pixel Buds才能体验。现在Gemini 3.5 Live Translate直接把门槛降到了最低——任何耳机甚至根本不需要耳机,拿着手机贴耳边就能听翻译结果。这意味着你出差、旅行、商务谈判,不再需要额外设备,一个Google Translate App就够了。
这个模型是3.5家族的新成员,之前在Google I/O大会上露过面。目前只有Flash版本可用,Pro版本预计几周内就会上线。最让我心动的是它的”声音克隆”能力:它不仅能翻译70多种语言,还会模仿你的语调、语速和情感,听起来不像冷冰冰的机器人,更像你本人在说另一种语言。这对于播客、视频会议、外语学习来说,体验感直接拉满。
跟目前市面上其他翻译工具比起来,比如DeepL、Microsoft Translator,Google最大的优势是生态整合。你可以在Google Meet里直接使用,翻译结果实时显示,界面也已经做了优化。国内用户可能更关心是否能翻墙使用,这里暂时不展开,但技术上Google的API是开放的,开发者可以自己调用。
实际体验如何?
开发者现在就可以用Gemini Live API或AI Studio接入。企业用户这个月也能在Google Meet里用上这个翻译功能。Google甚至改了Meet的界面,把实时翻译按钮放到了更显眼的位置。对于经常开跨国会议的人来说,这绝对是个生产力工具。

另外说个细节:在嘈杂环境下,模型会自动过滤背景噪音,只保留说话人的声音。这对我这种经常在咖啡馆开会的人来说简直太实用了。Google还提到,翻译音频会嵌入SynthID水印,防止被滥用变声欺诈。
个人使用建议
如果你是Android用户,可以把手机像打电话一样举到耳边听翻译;iOS用户可能还需要等一等。目前”听筒模式”仅限Android。但整体来说,这次的更新让我们离”巴别鱼”(《银河系漫游指南》里的万能翻译鱼)又近了一步。
据Ars Technica报道,该功能已在Google Translate App上逐步推送,预计未来几周覆盖更多设备。如果你还没收到更新,可以去应用商店检查一下版本。另外,近期Google也在测试Gemini 3.5 Pro模型,预计性能和准确率会有进一步提升。对于科技爱好者来说,我们正处在翻译技术跨越式发展的节点上,实时语音翻译将会像今天的搜索引擎一样成为日常生活的基础设施。
如果你对AI语音合成也感兴趣,可以看看这篇:AI语音合成玩得转?段子手教你三步变身配音大神。想了解AI工具互联的朋友还可以阅读:2026年MCP协议与AI工具互联教程。
你对这种实时翻译工具有什么看法?觉得它能在多大程度上替代人工翻译?欢迎在评论区聊聊~
本文出自 AI一族,原文链接:https://www.aiyizu.cn/?p=3869
转发请注明出处,禁止未经允许用于任何商业用途。