王小川谈“人与机器”:技术跟人会产生新融合 会改变我们人

2019-05-26 15:00:01果青

除了这样的迁移以外,我们现在还能做到的就是AI语音变声的技术,我们应该是首次将语音变声技术用到实际的产品里面,今年谷歌大会发表了语音表征识别的技术,我进行一下演示,可以把任何人的声音转化成特定的声音,这是在表征学习当中一个重大的突破,我们也是首次把它做了实用。这里点语音,然后点变声,我们做了很多人的特定音色,从明星,到卡通人物,到特别声音,比如高晓松,我可以给大家演示一下。

(高晓松声:大家好,欢迎来到极客公园2019年现场和大家一起分享人和机器的共创未来。)

还可以变成其他的动漫声音,游戏声音,或者剩下的方言。这样的变声技术并不是简单的语音合成,能把语音、语调、情感做到这样一个迁移。所以在输入法中间我们做了一件好玩的事情,大家意识到没有,这里只是好玩。可当我跟网络教育行业进行沟通的时候,整个行业沸腾了。

在远程的直播行业当中,我们遇到有些老师带有口音,我刚才是把一个普通话转成带有东北腔,但倒过来你口音能转成正常的语音,在知识付费的这种远程教育当中,这些学校的老师,或者说之前找的导游,会对他们有一个新的颠覆。

有一些导游声音可能不足够好听,但知识很渊博,对于一个网络的知识付费的公司而言,当他找不同人的时候也要考察他们的音色到底好不好。现在可以把任何一个人,5毛钱的音色变成价值50元的音色,而且当他找不同的老师或者导游的时候,产品也能做到非常标准化,因为输出高度一致。今天在表达信息和获取信息上,语音方面已经可以做到非常的突破了。

今年年初我们发布了另外一款技术,叫做AI的合成主播。这件事情把语音、图像和文字的关系完全联动起来,我前面讲的技术能够把嘴形识别变成声音、变成文字,现在我们倒过来,也是同样的技术,能把文字变成声音变成它的表情,并且在这里面我们年初已经在新华社和央视里面上线了这样一个产品。

这就是我们称之为的AI合成主播,能合成人的声音、嘴形、表情,同时也是我们全球首个用AI能取代人的分身技术。这个技术发布之后,全球100多家媒体都能做这样的报道。我们给大家看看效果。

这个技术在年初已经上线,全球很多媒体都会采购,包括国内最大的一家保险公司在线客服也将采用我们的技术,用机器取代部分人。在感知视觉里,机器和人沟通机器能做到很大的取代人的作用,独立开展工作。

这是我们做的机器翻译,包括语音同传,我们有非常丰富的落地场景,我们之前首个离线翻译引擎,用到离线翻译机,没有网络的情况下也能工作。我们也能在讲中文和英文的时候,翻译成其他国家的文字进行传递。我们还能翻译成全球的文字,全球更多的网络咨询是英文文写的,我们现在能用中文浏览很多内容。

相关文章 大家在看