文章来源:公众号“杭派工程师”
撰文:丹如
编辑:猛哥
“人脑和电脑到底哪一个更厉害?”
2014年第一季第一集,《最强大脑》的嘉宾马化腾曾提出了这个问题。
《最强大脑》是一档以德国 The Brain 为原型的国产科学真人秀。2014年开播后,因着节目组发掘出众多拥有过人天赋的选手,一跃成为当年最火爆的电视综艺。连周杰伦、章子怡等巨星都纷纷前来担任嘉宾。
天才与常人到底有多大差距,他们是从大脑结构和思维方式就与普通人不一样吗?
由于每个人都会产生这种好奇,《最强大脑》的节目热度一直延续至今。一大批如水哥王昱珩、“中国雨人”周玮、听风者艾晓娃等选手,更是在参加节目后,成为了具有国民认知度的脑力偶像。
但实际上但走到第三季时,《最强大脑》的制片人就宣称找不到天才来做节目了。
第五季之后,这档节目干脆放弃了对偏才、天才的追逐,将目标锁定于普通人之中的脑力强者。而到了2020年的第七季,节目组重新设定比赛环境,通过缩短比赛准备时间和现场压力,来呈现“脑力强者”们在极限压力下如何发挥自己的特长,完成比赛。
有老观众认为《最强大脑》不再有令人惊艳的天才了,丧失了节目的初心。但从另外一个角度看,天才本就不易寻,而普通人中的脑力强者如何在极限条件下突破困难同样具有研究价值。
为此,在本季《最强大脑》四强赛的现场,节目组请来了达摩院人工智能领域的两位科学家华先胜和鄢志杰作为嘉宾。
“人脑和电脑到底哪个更厉害?”这个从第一季延续至今,他们是最适合解答这个问题的人。
1
达摩院,从这一季《最强大脑》第一期选手们亮相时就频频被提及,它和清华姚班、天机团队成为选手们的光环认证。
当主持人报出选手出自达摩院或者拿到了达摩院的offer ,其他选手脸上都会露出惊讶或佩服的表情。
观众也因此对达摩院产生了好奇 “达摩院是什么?”
第一期节目中,薛兆丰这样说:“有的人专注于研究过去的问题,而有的人着重于解决当下的问题,达摩院则是一个研究未来的地方。”
“研究未来”用来形容达摩院实在是再合适不过。2017杭州·云栖大会上,阿里巴巴宣布成立达摩院的同时,就启动了一项代号“NASA”(登月)计划。
马云当场表示,未来阿里将面向机器学习、芯片、IoT、量子计算、生物识别这些核心技术,组建崭新的团队,并建立新的机制和方法,成立新技术研发体系,而研究的目标是为了解决 10 年、20 年后的困难。
作为阿里储备面向未来 20 的核心技术的最高研发团队,达摩院成立两年多以来,已吸引了各个领域的顶级人才的加入,团队成员几乎人均博士学位。
而此次被《最强大脑》邀请作为科学嘉宾的鄢志杰和华先胜就是其中的佼佼者。
华先胜是北京大学应用数学博士,如今《最强大脑》的很多热门选手都是他的师弟师妹,但华先胜除了是北大应用数学博士外,还是IEEE Fellow、ACM杰出科学家、2018年度MIT TR35“全球35位35岁以下的杰出青年创新人物”获得者。
他2001年加入微软研究院,始终走在视觉识别和图像搜索领域的国际前沿。2015年4月加入阿里iDST团队(达摩院前身)后,他主要带领视觉计算团队的研发工作,如今是达摩院城市大脑实验室的负责人,也是达摩院医疗AI团队的创建者。
鄢志杰同样出身于微软研究院,他2003年就在中科大语音实验室攻读博士,是国内较早一批人工智能语音交互领域的专业人才。在语音及文本识别领域顶级学术期刊及会议,鄢志杰发表过多篇论文,拥有多项美国及 PCT 专利,如今已经是语音领域顶级学术会议及期刊的专家评审和 IEEE 的高级成员。
作为达摩院人工智能领域的两位大咖,华先胜和鄢志杰被邀请到《最强大脑》,主要是为了从人工智能技术的角度对选手和比赛项目进行评价。
2
人工智能和人类中的脑力强者孰强孰弱?
这个问题如果放在二十年前,语音交互技术和图像识别都尚未成熟时,答案一定是后者。但到了今天,当人工智能越来越“聪明”时,属于人脑与电脑的边界开始变得模糊。
例如《最强大脑》这期节目的第一关“十二生肖”,选手要在很多干扰项中寻找正确的六块拼图,组成完整的衣服生肖图片。对于人脑而言,是很有挑战的,特别是其中细微的差别。观察力超强的选手陈小桥用了3分钟找到答案,令大家都叹为观止。但如果用电脑,用类似于阿里巴巴“拍立淘”或城市大脑的视觉搜索技术,可能只需要毫秒级的时间就可以完成。
比如《最强大脑》这期节目的第二关“多米诺效应”,选手需要在最短的时间找到不同齿轮之间的连接通路,找到出口。张若昀就问达摩院的两位科学家,如果是人工智能来做,会不会更简单?
华先胜和鄢志杰都给出了肯定的答案。
华先胜说:“因为答案是确定的,所以对于计算机而言只要试一下就能得出准确的结果,但对于人来说是很有挑战的。”
鄢志杰则补充道电脑与人脑最大的不同是,电脑不会犯错,人则不同,即便是简单的步骤,重复得多了也可能会犯错。
类似的问题在“谍影重重”一关也被提出来,这一关要求选手在2160个正三角形中找出选手手中正二十面体的展开图。
华先胜说这种题即便是人工智能来做也是极具挑战的,因为每一个正二十面体的展开图都有很多种类,不考虑颜色时有4万多种,考虑颜色择优数百万种之多,即便是计算机去展开和匹配,每一个花1毫秒或者0.1毫秒,计算机也需要40几分钟或者4分多钟来解决这道题,对人脑来说更是极大的挑战。
节目录制后,华先胜仍旧对这一环节印象深刻,他对《杭派工程师》说:“这道题的搜索空间很大,但最快的选手赵金昊只用了几分钟的时间,也令我感觉很意外。”
无可否认的是,在人工智能愈来愈发达的当下,人脑依旧有着出其不意的能力和极大的创造力,这一点华先胜和鄢志杰在整个节目录制过程中也强调了很多次。
鄢志杰说:“像比赛的节目考察的观察力、类似拍照记忆的图形记忆能力,其实对计算机来说都比较容易。”而他研究的项目如语音交互,则正好相反,“对人来说很简单,对计算来说却很难。”
人脑和电脑之争,实际上是个伪命题。因为双方的能力强项并不相通,节目录制时,两位科学家也始终强调这一点。
人工智能终究只是为人类提供服务的工具,而它的发展最终还是要依赖人类最顶尖的脑力强者们来推动。
3
“回到二十年前,如果有《最强大脑》,你们会参加吗?”
节目播出后,《杭派工程师》对华先胜和鄢志杰两位脑力强者提出了一个问题。
华先胜颇有些跃跃欲试。节目录制时,他评估题目的难度时,就认为题目倒是有难有易,关键在于对速度的要求。他说“如果回到二十多岁时,也有可能参加这种节目来挑战一下自己。”
而鄢志杰则表示,可能不会参加这期节目,因为节目考察的能力主要是观察和类似拍照的记忆能力,这些都需要长期的专业训练,这与他所擅长的能力并不一致。
当然这只是如果。
但是站在时间的长河上回首,如今的华先胜和鄢志杰,也曾像《最强大脑》中那些聪明的选手们一样,在二十多岁时有着天才的光环,和热血沸腾的青春。但他们把对脑力的痴迷延伸的更久远,最终选择了将天赋与热情投注了对科学共同体更有价值的领域,并在年复一年的寂寞和不确定性中去探寻其中的价值。
2003年,鄢志杰投身语音识别这个行业时,那还是一个冷门赛道。即便是微软亚洲研究院这样顶级的研发机构,每年也只有一两个校招名额,彼时语音技术的发展很初级,如今智能语音机器人可以与人类进行自然的互动在当时完全是不可想象的。但鄢志杰当时就预判到,语音是人机交互的下一个里程碑,只要是有趣有用的技术就值得学,这和他小时候选择计算机作为课外课程一样,兴趣做主导,有用则放在后面。
他的选择在如今看来正确且成功,但站在当时的节点上,实需莫大的魄力和远见,因为一个冷门专业的博士,很有可能面临毕业后的无人问津的窘境。
2008年,当大多数同行都选择加入 Nuance这样专门做语音技术提供商的公司时,鄢志杰却觉得语音技术并不是一个单项能力,而是一个撬动点,可以撬动更大场景。因此他加入了在这一领域走得最靠前的微软,一待就是七年,成为了这语音交互领域的权威。直到2015年,为了找到语音交互技术在应用层产生更多的价值的路径,才加入了阿里。
华先胜有着和鄢志杰几乎相同的路径,同为名校毕业,双方在微软研究院时就是老同事。但华先胜在微软的时间更长,2001至2015年期间,他先后待过微软亚洲和美国研究院,负责过微软Bing图像搜索引擎的研发工作,最终成为了视觉识别和搜索领域的国际级权威学者。
IEEE向华先胜颁发院士资格时曾评论,华先胜为多媒体内容分析和图像搜索做出了突出贡献,“虽然有效的基于内容的视频搜索仍然还有很多困难没有解决,但华先胜正在通过自动识别图像和视频中物体、场景、事件和其他语义特征来攻克这个壁垒。”
真正最强大脑的选择总是殊途同归。
4
鄢志杰
但在实际中,加入达摩院的科学家们面临的却不是《最强大脑》选手们面对的那种有明确答案的题目。
他们常常要面对的是没有明确答案的真实世界中的问题,因此必须超越单纯的解题思维,而是往往要去创造新的技术、方法甚至是场景,让自己具有技术创新并落地乃至商业化的能力。
鄢志杰在加入达摩院之初就被告知“什样的技术不是好技术”,因此他必须转换单纯的科研思维,让自己具有技术商业化的能力。
在阿里做前沿技术研发,达摩院的科学家都已经习惯了这种挑战,他们甚至将这种状态归纳为“经常被挑战,从未被否定,一直在进展”。
鄢志杰在阿里的技术研发历程可以分为两个阶段,第一个是以语音技术来帮助阿里经济体内部的业务,比如阿里的客服中心、高德的语音助手、钉钉的语音转文字、天猫精灵这些业务部门都得到了鄢志杰团队研发的新技术的赋能。
2017年后,达摩院制定了“达摩院技术零时差上云”的目标后,鄢志杰带领团队开始着手语音技术上云,向阿里云的所有客户赋能。
从为阿里经济体内部的业务服务,到服务外部客户。鄢志杰感觉像是被出了一道题,虽然他们本身就非常擅长做题,但仍旧会有种“一下子被投入商业世界、竞争市场上”的挑战感。
2017年,他们开始和浙高院合作智慧法院的项目,从法院的庭审速记等单一场景切入,不断向更多元的场景渗透,最终集成一个法院的AI应用系统。面对强劲对手,也占据优势。
此外,作为达摩院的重要实验室,鄢志杰的团队还将原本赋能于阿里集团电话客服中心的语音技术进行了升级,拓展到其他如银行、保险、水务、电力等各行各业当中。目前阿里云已经建立起全国最大客服呼叫中心领域产业的联盟。
成果丰硕,鄢志杰就认为“在高校或研究所,可以研究无用之美,这种环境下可能会产生相对论这样伟大的成果,但大部分都会失败,只有少量的突破会出来。”达摩院则不同,在阿里做技术则是基于应用和天然场景驱动。
他的经验是:“语音实验室不推崇闭门造车,坐在实验室里YY,而是要知道客户是谁,一项技术产生的客户价值是什么。”
只要找对了方向,他们总有解题的办法。
5
解题能力与创新能力,这是达摩院几乎所有人才都必须具备的能力。
以《最强大脑》这个节目为例,华先胜就认为聪明的人、天才并不一定能在《最强大脑》中获胜,因为人的能力是多方面的,不仅仅是解决“最强大脑”中设计的题目的能力。
华先胜
2016年,加入阿里后。华先胜用视觉识别和搜索技术做出“拍立淘”功能,跨过技术商业化的门槛后,却遇到了另外一个史无前例的挑战“城市大脑”。
“城市大脑”是阿里云创始人王坚十分看重的一个项目,他认为城市发展到今天,有那么多的车辆、道路、立交桥,但仅靠路和红绿灯,没法解决交通问题,未来的城市需要一颗“大脑”来帮进行计算和机器智能来解决交通和环境问题。
对于这个项目,王坚给予厚望,甚至称“城市大脑”是杭州献给整个世界的一个礼物。华先胜接手整个项目之初,很多人认为这是不可能挑战,“这可能是要十年之后才会发生的事情。”
在做“城市大脑”时,华先胜要面对的就是没有答案的问题。
为了解决城市当下遇到的各种问题,他们采用阿里云人工智能技术,对城市进行全局实时分析,自动调配公共资源,修正城市运行中的缺陷。在城市大脑团队看来,未来城市的所有服务、物体、空间等都将数字化。高楼大厦、轨道交通、山野湖泊,这些彼此隔离的城市元素在数字平行世界中开始碰撞。
这其中的挑战之多超乎常人的想象,如何挖掘城市内交通视觉数据,如何对这些数据进行计算?投入多少人力物力才能产出价值?用哪些技术才能更妥善的解决当下遇到的瓶颈?这些难题无时无刻都在挑动着他和团队的神经。
为了找到突破点,华先胜的技术团队几乎常年流连于城市交通指挥中心,只为找到最真实的应用场景和数据的价值。
好在这些努力都没有白费,目前城市大脑在杭州、郑州、海口、澳门、吉隆坡等全球20多个城市都获得了落地成果。人工智能让这些城市治理变得更高效,作为城市大脑的发源地,杭州就发生了“肉眼可见”的改变,2014年,杭州的延误指数为2.08,在全国拥堵排名第2,到2018年,哪怕是在杭州全市地铁、快速路网施工占用19.2%道路资源的情况下,杭州的延误指数仍下降到1.64,排在全国拥堵城市的第57位。
华先胜团队的人工智能技术还走进了全球医疗机构。这支团队的研究范围涵盖心血管、肺结节、肝脏、骨科、基因、细胞......不一而足,并且夺得多项世界冠军。仅新冠肺炎疫情期间,其CT影像AI、全基因分析AI等已在全球620多家医疗机构上线使用。
随着这些成果的落地,达摩院的名声也越来越响亮。《最强大脑》八进四决赛时,会八门语言的选手赵轶被淘汰时,华先胜亲自向他发出加入达摩院的邀请,弹幕上一片“这波血赚”、“这波不亏”的评论。
达摩院已经成为被顶尖人才向往之所在,也会诞生越来越多如华先胜和鄢志杰一样的顶级科学家。马云曾说:“能够被清楚定义的都不是未来,我们对未来所有的想象都是幼稚的。”
而对于这些脑力强者而言,加入达摩院就是拥有定义未来的开始。