亚马逊开发出有史以来最大的文本转语音模型

nihdff 2024-05-13 46

扫一扫用手机浏览

文章目录 [+]

【TechWeb】2月18日消息,据外媒报道,亚马逊一个人工智能研究团队宣布,他们开发出了有史以来最大的文本语音模型。所谓“最大”,是指拥有最多的参数,使用最大的训练数据集。

外媒报道称,这个名为BASE TTS的新模型拥有9.8亿个参数,在同类产品中最大,在规模和能力上都超越了之前的迭代版本。它使用了10万个小时的录音(来自公共网站)来进行训练,其中大部分为英语语音,但也包括德语、荷兰语和西班牙语,这使它成为自然语音的新标准

研究人员表示,尽管遇到了文本转语音引擎固有的困难,如发音错误或语调错误,但该模型在处理复杂的语言结构方面表现出了非凡的能力。

亚马逊开发出有史以来最大的文本转语音模型
(图片来源网络,侵删)

研究人员进一步指出,与之前的文本转语音模型相比,该模型提高了单词的发音质量。

外媒称,这一突破标志着文本转语音技术发展向前迈出了重要的一步,在不久的将来有可能得到广泛的应用。

然而,该团队表示,为了避免滥用,BASE TTS不会向公众发布。相反,他们***把它作为一种学习应用。(小狐狸)

亚马逊开发出有史以来最大的文本转语音模型
(图片来源网络,侵删)
亚马逊开发出有史以来最大的文本转语音模型
(图片来源网络,侵删)

[免责声明]本文来源于网络,不代表本站立场,如转载内容涉及版权等问题,请联系邮箱:83115484@qq.com,我们会予以删除相关文章,保证您的权利。

转载请注明出处:http://www.kfgrw.com/post/35173.html

相关文章

美防长与荷兰、英国国防大臣通话

  当地时间12月30日,美国国防部发表声明称,国防部长奥斯汀与荷兰国防大臣奥隆格伦进行了电话会议,双方讨论了胡塞武装对红海国际航...

今日资讯 2024-05-13 阅读111 评论0

10年来城乡居民大病保险赔付超7000万人

  新华社北京1月2日电(记者彭韵佳)据国家医保局2日消息,保险业积极承办城乡居民大病保险,目前21家保险公司在全国承办城乡居民大...

今日资讯 2024-05-13 阅读124 评论0