当前位置:首页 >国际 >

物联网因DeepMind的云文字语音转换而变得健谈

来源:   2021-10-07 08:00:44

DeepMind已将其文本语音转换技术引入Google Cloud Platform,以创建一个健谈的物联网(IoT)世界。

云文本语音转换提供来自12种语言和变体的32种不同语音

借助云文字语音转换功能,用户可以为呼叫中心的语音响应系统提供支持,以进行实时自然语言对话。并启用IoT设备(例如电视,汽车,机器人)与您交流。

它还可以将基于文本的媒体(例如新闻文章,书籍)转换为语音格式(例如播客或有声读物)。

谷歌刚刚透露了这一消息,但是思科和IT通信公司Dolphin ONE已经开始使用云文本语音转换。

云文本语音转换提供来自12种语言和变体的32种不同语音。谷歌表示,它可以正确地发音复杂的文本,例如名称,日期,时间和地址,以“在门口传出真实的语音”。

此外,它还包括使用WaveNet构建的“高保真”语音选择,WaveNet是DeepMind创建的原始音频生成模型。WaveNet可以合成听起来更自然的语音,并且平均而言,它会产生人们喜欢的语音音频,而不是其他文本语音转换技术。

TOP