王小川:从渠道角度我觉得两个事要突破,一个地方就是利用自有的流量渠道,比如怎么和在搜狗上的输入行为做连接。其实用户在用输入法输入的时候,如果我们能甄别到他有怎样的意图,就能直接提供更好的信息满足给他,这个方面我们还有很大空间去提升的。
第二,我们希望在搜索结果里面能够有更好的差异化、权威性内容。比如说之前做的微信内容,现在我们着力在强调医疗健康内容,希望内容上有差异化,就使得用户变成一种主动来使用,而不是靠合作,这样成本就会降下来。
AI落地新动作
今年 11 月, 2018 乌镇世界互联网大会上,搜狗与新华社合作推出的全仿真智能虚拟主持人“AI合成主播”首次亮相,演示环节,观众任意输入文本后,“AI合成主播”就能用真人一样的声音、唇形进行播报,搜狗未来人工智能的核心技术“搜狗分身”正式浮出水面。
记者:为什么集中了这么大的精力去做 “搜狗分身”?
王小川:去年搜狗上市的时候,我一天收了 3000 条祝福的微信。如果我用语音回复的话,还得说 3000 条,而且每个人不一样,有的是记者,有的是老同学。这时候你就开始需要分身了,帮你去说话,帮你去做机械性、重复性的工作。搜狗做AI有两个理念,一个是希望能够成为你的分身,一个是成为你的助理,这是我们核心的两个方向。
记者:搜狗在技术方面做了哪些突破?
王小川:“搜狗分身”技术诞生于搜狗“自然交互+知识计算”这一人工智能理念之下,该技术能够利用搜狗的AI能力,从图像表情,声音语言习惯,逻辑思维等层面对AI进行拟人化训练,然后克隆制造人类的AI分身,提高我们信息表达和传递的效率。
以前我们说婴儿学习新东西很快,看一张图片就会了,但其实是他看了很多图片之后再看一张图片才会明白,这就是特定领域的数据越小越好,但是它对通用领域要有足够多的掌握。里面涉及到了既要有海量声音的训练,同时做到能用更少的声音去训练一个特定的人,后面都是技术壁垒。
记者:这部分商业化的前景是怎样的?
王小川:AI 合成主播可以充当人机交互的沟通角色,适用于比较垂直的领域,比如医疗、法律、教育等行业。
记者:是不是以后除了写稿子,剩下的事情都能交给“AI合成主播”?
王小川:不能做的惟妙惟肖,因为稿子的内容机器是听不懂的,什么时候要发怒、什么时候要柔情,这个比较难,因为它不理解真正的含义。但如果只考虑视觉和听觉表达,这个地方跟真人是分不出来的。
记者:在你看来未来机器真的能替代人吗?
王小川:不能把AI当成一个大的词,它有好多内涵在里面,分感知技术和认知技术。感知是讲声音、图像,这部分机器有机会可以和人类做到基本一样好。但是认知技术,涉及了人类大脑背后的推理、思考,特别是以语言为核心的逻辑性东西,现在机器的处理能力有限的。










