Google升级云端语音转文字服务,新增7种语言
Google更新云端语音转文字(Speech-to-Text)API,新增支持的语言以及增强对方言的识别能力以扩展支持的市场范围。新支持的语言为缅甸语、爱沙尼亚语、乌兹别克语、旁遮普语、阿尔巴尼亚语、马其顿语和蒙古语等,训练资源相对于主流语言不足的7种语言,使整体云端语音转文字API支援的语言,从64种上升为71种,把方言也算进去的话,从120种来到了127种。
Google语音转文字功能以API的形式提供,让用户对各种长度的语音,或是串流音讯,将语音转成文字,而企业也可以自定义功能,配置转录的过程。这次的更新,Google还强化了其叁项功能,语音适应(Speech Adaptation)、电话通话模型(Telephony Model)以及说话者自动分段标记(Speaker Diarization)对方言的辨识能力。
语音适应可以让企业调整服务产生的文字,零售商可以训练语音转文字功能,强化辨识客户服务来电中难以翻译的产品名称,甚至是转换各种时间表达方法成为数字格式(下图),另外,用户也能配置API,控制其回传资讯的方式,以大幅改进特定使用案例的语音辨识品质。现在语音适应功能新提供68种语言和方言,包括Mandarin、日语和西班牙语等。
说话者自动分段标记是一种可区分一段语音中不同说话者的技术,将音讯档案中的单词和语句分配给不同说话者,让用户不仅可以理解语音内容,还能知道是由谁说的。而这项技术可以让用户更简单地为影片增加字幕。这次的更新加入了对10种方言的支持,包括英国英文、西班牙文等。
另外,正确的标点符号也是转录品质的重点,Google的自动标点符号功能,会试图模仿用户写下所说话语的方式,这将有助于提升文字的可读性。这次更新Google新增了对德语、法语和日语等18种方言的支持。
Google提到,这次更新扩大了语音转文字的服务对象,新增超过2亿人,而功能强化也可为原本的服务对象提供品质更好的转录功能。
十次方专注于浪潮服务器销售,正品保证,稳定可靠,超强算力,快速部署!
客服热线:0755-26922157 微信:18123621760
0

相关文章
0评论
文章点评