2023 年 9 月,微软的 Azure 团队宣布将推出一些声音逼真的人工智能语音,供企业客户使用。本周,微软表示,九种更逼真的人工智能语音现在已普遍提供给这些用户。
微软在一篇博客文章中说,这些声音可用于各种工作和任务,包括商业聊天机器人、语音助手和电子学习工作。它们还可以用于更有趣的娱乐和游戏任务。
微软补充道:
这一扩展扩大了我们在91种语言及其变体中表达内容的能力。这一进步彰显了我们克服语言障碍、促进更具包容性和无障碍的全球通信环境的坚定承诺。
九种新的语音可在所有 Azure 地区使用。它们包括:
- en-US-AvaMultilingualNeural
- en-US-AndrewMultilingualNeural
- en-US-EmmaMultilingualNeural
- en-US-BrianMultilingualNeural
- De-DE-FlorianMultilingualNeural,
- De-DE-SeraphinaMultilingualNeural
- Fr-FR- RemyMultilingualNeural
- Fr-FR-VivienneMultilingualNeural
- zh-CN-XiaoxiaoMultiligualNeural
每种新语音都有自己的风格和语调。例如,微软表示,en-US-AvaMultilingualNeural 语音是 "明亮、迷人的女声,音色优美",而 en-US-AndrewMultilingualNeural 语音则是 "温暖、迷人的男声,听起来就像你想认识的人"。
有些语音更适合特定的应用。微软表示,en-US-EmmaMultilingualNeural 版本是一种 "友好、轻松、悦耳的女声,非常适合教育和解释"。
微软还表示,En-US-RyanMultilingual 语音现已普遍适用于 GA 的所有 Azure 地区。该公司还将 En-US-JennyMultilingual 语音与 en-US-JennyMultilingualV2 语音合并,现在所有地区都可以使用。
该公司仍在对一些语音进行公开预览。其中包括 en-IN-NeerjaNeural 和 hi-IN-SwaraNeural 语音,在美国东部、欧洲西部和东南亚各有三种新风格。此外,在中印度地区的预览版中还提供了新的女声:en-IN-KavyaNeural、en-IN-AnanyaNeural、en-IN-AashiNeural、hi-IN-KavyaNeural 和 hi-IN-AnanyaNeural。
除了越来越多的声音逼真的人工智能语音外,Microsoft Azure 还拥有 400 种神经文本到语音语音,涵盖 140 多种语言。