欧易okex官方网站
复制成功

分享至

OKX > 快讯 >

AI 初创公司现在可以使用您的声音生成 30 种语言的语音

gateio

欧易OKX交易所

全球排名前三的数字货币衍生品交易平台,新用户注册可拆数字货币盲盒,最高60000元,100%有奖哦

点击注册 进入官网

人工智能军备竞赛继续加速,声音克隆的新领域几乎每天都在出现。最新的进展来自旧金山的初创公司 ElevenLabs,该公司刚刚宣布,他们的新 AI 模型现在可以模仿 30 种不同语言流利地说的声音,比之前支持的最初 8 种语言有了显着的扩展。




该公司以文学机构兼独立出版商 Lukeman Literary 为例,解释说该公司每年以多种语言制作许多有声读物。


ElevenLabs 在官方博客文章中表示:“卢克曼的团队过去需要花费几周的时间才能制作一本有声读物,因为这需要他们找到合适的配音艺术家、预订录音室、录制和管理后期制作。”整个过程需要几个小时,”


据 ElevenLabs 称,新的多语言 v2 模型可提供“情感丰富”的音频,捕捉自然语音的微妙变化。用户输入他们想要用目标语言朗读的文本,人工智能会生成无缝的画外音。


该公司提供两种主要的语音克隆选项:文本转语音工具和用于克隆特定语音的“VoiceLab”。


用户上传语音样本来创建自定义语音克隆,人工智能会对其进行分析以构建合成版本。然后可以操纵这个克隆的声音说出任何可以想象到的事情。ElevenLabs 声称最新的更新意味着这些人工智能分身现在可以流利地讲瑞典语、阿拉伯语和马来语等语言。


扩展的语言功能也与 ElevenLabs 将其语音克隆技术移出 Beta 测试相一致。该公司的目标是将该工具推广到实际应用中,例如有声读物的叙述,就像 Lukeman Literary 的例子一样。


解决问题


该技术被滥用的可能性使这些商业雄心蒙上了阴影。Deepfake 音频使用户容易受到欺诈和错误信息活动的影响。去年,ElevenLabs 本身也遭受了强烈反对,因为其平台被用来冒充和骚扰公众人物。


该公司表示,此后已经实施了更严格的保障措施,但道德问题仍然存在。正如 Decrypt最近报道的那样,“诈骗者可以使用人工智能来克隆你所爱之人的声音”,而要获得可信的结果所需要的只是几分钟的音频。


像 Meta 这样的大型科技公司也面临着类似的批评,因为它们在没有完全透明的情况下开发了强大的生成人工智能。Meta 最近推出了一款名为 Voicebox 的人工智能语音合成工具,它承认该工具可以轻松促进深度伪造。与 ElevenLabs 不同的是,考虑到“滥用风险”,Meta没有公开发布任何内容。


然而,尽管存在担忧,人工智能语音克隆的快速进展似乎势不可挡。正如 ElevenLabs 的语言学家 Mati Staniszewski所说,“最终我们希望在人工智能的帮助下覆盖更多的语言和声音,消除内容的语言障碍。”


确保道德实施仍然是一项艰巨的挑战,因为全球错误信息和创新沟通方式之间的界限非常模糊。谨慎行事是关键,以免我们的声音地球村变成喧闹的巴别塔。


免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。本站资讯仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

相关推荐

industry-frontier