如何使微软小冰拥有逼真生动的人声?看看微软是怎么做的

2019-05-29 11:27:38 微软资讯
人工智能的发展似乎越来越受到大家的关注。微软小冰就是一个较为先进的人工智能机器人,为了能够提升用户的使用体验,微软也在不断的进行相关的改进。针对其语音的发声,如何才能让其用户更加生动的人声,微软投入了大量的研究。那么到底该怎样做才能让这些声音更为真实呢?

微软和中国的研究人员可能有有效的方法。他们制作了一个文本到语音的人工智能,它只需要200个语音样本(大约20分钟)和匹配的转录,就可以生成逼真的语音。
 
 
微软小冰已经有了动画形象,若再加上逼真生动的语音,必将成为广大宅男的福音。
 
该系统在一定程度上依赖于一个转换器,也就是大致模拟大脑中神经元的深层神经网络。转换器像突触连接一样在飞行中测量每一个输入和输出,帮助它们高效地处理甚至是冗长的序列——比方说一个复杂的句子。结合去噪编码器组件,人工智能的工作效率会大大提高。
 
带有少许机械性的语音或许并不完美,但它们具有99.84%的单词可理解性,因而具有很高的准确度。这可以使文字到语音的转换更容易理解。研究人员希望在不匹配的数据上进行训练,因此可能在原有的工作量上进一步缩减就可以实现更逼真的对话。

除了能够帮助用户更加便利的操作之外,人工智能将具有更为精彩的服务功能。如果真的能够实现超自然对话,那么就无异于多了一个可以聊天的人。

热门资讯

最新下载

最新文章