机器之心报道
编辑:蛋酱
这本书曾深刻地影响了一代脑、认知、计算机视觉领域的学者。
四十多年前,一本视觉计算理论的经典著作《Vision》正式出版。
这本书的作者大卫 · 马尔(David Courtnay Marr)在计算机领域几乎无人不知。他是计算神经科学领域的创始人之一,曾任麻省理工学院心理学教授。为了纪念其贡献,计算机领域顶会 ICCV 特别设置了「马尔奖」,该奖项被看作是计算机视觉研究方面的最高荣誉之一。
马尔在 1980 年去世,一生的研究心血集结于遗著《Vision》中。在这本书中,马尔描述了理解视觉感知的通用框架,并介绍了关于如何研究和理解大脑及其功能等更广泛的问题。
长期以来, 马尔的创造力、智力以及整合来自神经科学、心理学和计算的见解和数据的能力,影响了来自大脑和认知科学领域的众多研究人员。
这本书厘清了计算理论、算法、实现三个研究层次,不仅对神经科学和认知科学都产生了深远影响,也对计算机视觉在 1980—1990 年代的蓬勃发展提供了指导思想。
马尔视觉计算理论的提出,标志着计算机视觉成为了一门独立的学科。《Vision》影响了一代大脑和认知科学家,激励了许多人进入该领域。
北京通用人工智能研究院院长,北京大学、清华大学讲席教授朱松纯表示:「我在 1989 年作为一名大三学生有幸读到这本书的第一个中译本,从而走上了计算机视觉的科研道路。」
粤港澳大湾区数字经济研究院理事长,美国国家工程院外籍院士沈向洋表示:「我看过的第一本计算机视觉英文书就是 David Marr 的 Vision。」
马尔关注的低层视觉和三维结构的重建在很长一段时间内主导了计算机视觉的研究,而低层视觉和三维重建确实是人类视觉中不可或缺的部分。除了计算理论的进展,计算机视觉领域过去十年的爆发式进展还应当归功于算法(以卷积神经网络和反向传播算法为代表)、硬件实现(以 GPU 为代表)和数据(以 ImageNet 为代表)这几个层次的进展。其中,计算理论、算法和实现三者与马尔的三个理解层次完全符合。
在近年深度学习的热潮之中,掌握本书介绍的视觉计算理论,对于在人工智能和计算机视觉领域内开展进一步探索是至关重要的。
现在,这本经典著作的中文版已经正式面世!
本书面向心理学、神经科学、计算机科学、人工智能、计算机视觉等相关专业的研究人员、 研究生及高年级本科生等,可供学习使用或作为研究参考。
中文版《视觉》的译者是清华姚班校友、斯坦福大学计算机科学系助理教授吴佳俊。
吴佳俊的研究方向为计算机视觉、机器学习和计算认知科学。加入斯坦福大学之前,曾是谷歌研究院的访问研究员,并分别在清华大学和麻省理工学院获得了学士和博士学位。他的研究曾获 ACM 博士学位论文荣誉提名奖、AAAI/ACM SIGAI 博士学位论文奖、麻省理工学院 George M. Sprowls 人工智能与决策博士学位论文奖,以及 2020 年三星人工智能年度研究人员奖。
在书籍的推荐序言中,斯坦福大学红杉讲席教授,美国国家工程院、国家医学院、艺术与科学院院士李飞飞表示:「Marr 在《视觉》一书中描述的视觉计算理论的思想,在数十年间主导了计算机视觉的发展。四十年后的今天,我们再读这本书,会发现虽然 Marr 的具体计算理论可能是理想化的,但他对计算理论这一概念的追求,启发了我们找到了物体识别这个新的计算目标,构建了 ImageNet 这样的数据集,并最终影响了今日计算机视觉的发展。」