我希望苹果允许我使用人工智能克隆声音的 5 种方式
要点
- Apple 的个人语音可让您为辅助任务创建语音的合成克隆。
- 该功能可能有更多用途,例如自动响应、旁白和身份保护。
- 我们可以用语音克隆做的其他很酷的事情包括用于会议和实时翻译的语音过滤器。
Apple 的个人语音可让您在 iOS 和 macOS 中使用 AI 创建语音的合成克隆。虽然这是一个很棒的功能,但您可以用它做的事情非常有限。我们认为将其严格限制在辅助功能上是一个错失的机会。
Apple 个人语音如何工作?
Apple Personal Voice 随 iOS 17 和 macOS Sonoma 一起发布,并受 iPhone 12 及以后的设备以及 Apple Silicon Mac 支持。要进行设置,请前往(系统)设置 > 辅助功能 > 个人语音,并大声朗读短语列表,然后将设备插入过夜,以便它可以使用人工智能处理和克隆您的语音。
您必须大声朗读 150 个短语才能记录您独特声音的所有声音和变化,因此您可能需要为此留出一个小时(当您朗读时,您会厌倦自己的声音)完成了)。
目前,您只能使用克隆的个人语音来执行 iOS 中的辅助功能任务,例如使用它在电话中讲话以及通过手机扬声器亲自朗读文本。有了这样一项很酷的技术,可以在您自己的设备上安全地运行,我们认为苹果有机会让您用它做更多的事情。
这是我们希望用我们的个人声音做的事情(应用程序开发人员请注意)。
用您自己的声音自动回复
想象一下,如果您的 iPhone 可以为您接听电话,用您的声音询问一些基本问题,然后仅在来电重要时提醒您。这将是过滤掉电话推销员的好方法,并且可以汇总非紧急电话(例如您的伴侣让您知道他们去了商店或您医生的预约确认)并通过 iMessage 发送给您。
当您正在开车或看电影而无法使用手机时,这将特别有用。
视频和演示文稿的旁白
并不是每个人都是出色的叙述者。在阅读剧本时,很难连贯、清晰地说话。相反,在即兴发言时,可能很难即兴表达自己想说的话。能够编写您想说的话的文字记录,然后将生成的语音文本导出为音频文件,这对于播客、YouTube 视频和演示文稿来说非常有用,可以帮助那些不擅长公共演讲的人。
当然,苹果公司尚未完善个人语音,有时听起来有点机械化。但随着时间的推移,随着功能的成熟,它只会变得更有说服力。
给您完美的声音
曾经与感冒或喉咙痛的人通话吗?它们听起来不太好,这可能会给人留下不好的印象。人工智能克隆的声音可以用来消除这种情况,消除开会时“鼻塞”的鼻音、吸鼻子、咳嗽和清喉咙的声音。它还可用于在连接不良或嘈杂的环境中使音频更加清晰。
保护您的声音和身份免遭诈骗者利用
如果 iOS 可以复制你的声音,它应该能够检测到其他人是否在未经你许可的情况下做了同样的事情。随着语音克隆诈骗变得越来越普遍(使用从社交媒体上获取的录音),这一点尤其重要。
通过与您的 iCloud 家人和其他可信联系人安全地共享您的声音指纹,如果他们接到试图使用实际上并非您本人的声音副本的呼叫,他们可能会收到警告。这非常符合苹果对用户隐私和安全的关注。
实时翻译
也许是最明显的错失机会。对着你的手机说话,翻译应用程序就会实时翻译你的声音。那有多酷?让您的朋友相信您周末学会了芬兰语!
个人语音功能在 iOS 和 macOS 中是隐藏的,并且尚未广泛宣传。 iOS 还有许多您可能不知道的其他隐藏功能,因此请务必查看它们,看看其中是否有一些功能可以让您的生活更轻松。