2018-07-05 11:14 来源:AI星球 百度 /李彦宏 /技术

撰文 | 都保杰
编辑 | 吕梦
2018年7月4日,北京国家会议中心,这是百度转型AI战略以来举办的第二次百度AI开发者大会,相比第一届,技术配方和味道愈发纯正,而且今年的重点不再是树旗造势,更多的是技术成果解读和商业化探讨。
在过去的一段时间内,很多人有这样的质疑?
第一,陆奇亲自操刀帮百度理顺了AI航道后淡然离场,对百度的影响大不大?之前大刀阔斧设定好的目标路线还能否被继续保持?第二,百度总是说自己是AI公司,AI主要业务的真实情况怎么样?如何去做商业转化和技术变现?
因此,李彦宏特意用一场AI开发者大会交了一份长长的答卷,用答卷去证明陆奇离开,百度并无大碍,自己能够带领一众技术高管把AI战略进行的有声有色,无人驾驶车量产、AI开放平台和芯片、智能小程序上线······一步一个亮点,步步为营形成技术体系和商业生态的闭环。
AI全栈技术布局:多模态深度语义理解+“昆仑”芯片
百度高级副总裁、AI技术平台体系(AIG)总负责人王海峰详解了百度大脑3.0,从芯片到深度学习框架,百度大脑形成了技术、平台和生态的AI全栈技术布局。
发布会上,李彦宏播放了一段电话录音,一位即将参加开发者大会的嘉宾与百度智能客服进行了几轮对话,一问一答非常自然,随后揭晓,录音中的这位客服并不是人,而是AI,它背后便是百度大脑的自然语言理解、语音识别与合成技术。
王海峰指出,百度AI能力的核心是百度大脑,而百度大脑3.0是百度AI能力的集大成者。
8年前,基于多年的搜索技术积累,百度开始布局AI,2016年9月正式发布“百度大脑”,如今,百度大脑的能力从1.0进阶到3.0。
百度大脑1.0完成基础能力搭建和核心技术初步开放,2.0形成了完整的技术体系,开放60多项AI核心能力,3.0的核心是“多模态深度语义理解”,同时开放110多项AI能力,覆盖算法层、感知层、认知层、平台层。

百度大脑3.0提出了“多模态深度语义理解”,“多模态深度语义理解”是指对文字、声音、图片、视频等多模态的数据和信息进行深层次多维度的语义理解,包括数据语义、知识语义、视觉语义、语音语义一体化和自然语言语义等多方面的语义理解技术。
王海峰表示,“多模态深度语义理解不仅能让机器听清、看清,更能理解它背后的含义,深度地理解真实世界,进而更好地支撑各种应用。”
数据语义化技术可以将大千世界中多元、异构和多模态的三元空间大数据,形成包含千亿节点、万亿关系的庞大数据语义网络,从中总结规律、提炼知识、发现价值,助力经济和社会发展。比如在新能源充电桩智能运维中,结合百度的大数据、深度学习等技术进行设备监测、故障诊断等,可以显著提升效率,节约成本。
而多元语义知识方面,百度已经构建了包含数亿实体、数千亿级事实的庞大知识图谱。除了基础的由实体、属性、关系构成的实体图谱,我们还针对不同的应用场景和知识形态,构建了关注点图谱、事件图谱、多媒体图谱、行业知识图谱等多种图谱。所有这些知识,构成了百度大脑的基础。
视觉语义化可以让机器从看清到看懂视频,并提炼出结构化语义知识。视觉语义化技术应用于世界杯视频解析,能够全面识别视频中的球员、裁判、球、以及球门、球场线等人、物和场景,可以捕捉射门、进球、角球、任意球、换人等事件。基于这些语义化知识,既可以完成机器人自动解说,也可以进行精彩片段集锦、以及各种数据统计分析等。
而在实际生活的超市购物场景中,百度的视觉语义化技术通过识别人物、动作、物品并关联时间序列,将数字化的视频转化为结构化的语义知识,既能实现顾客在无人超市购物的完整体验,还可以帮助商店经营者分析和优化商店经营。










