(来源:MIT TR)
“目前这场辩论并不处于一个智力健康的状态,”Marcus 这样评价道。多年来,Marcus 一直在指出深度学习的缺陷和局限性,正是这项技术将人工智能推向主流,支撑着从大型语言模型到图像识别,再到自动驾驶汽车的一切应用。他在 2001 年出版的《代数思维》一书中提出,作为深度学习基础的神经网络本身无法独立进行推理。(我们暂时略过这一点,但稍后我会回来探讨像“推理”这样的词汇在一个句子中的重要性。)
Marcus 表示,他曾试图与 Hinton 就大型语言模型的实际能力展开一场恰当的辩论,而 Hinton 去年公开表达了对自己参与发明的这项技术的生存恐惧。“他就是不愿意这么做,”Marcus 说,“他叫我傻瓜。”(过去在与 Hinton 谈及 Marcus 时,我可以证实这一点。Hinton 去年曾告诉我:“ChatGPT 显然比他更了解神经网络。”)Marcus 在他撰写的一篇名为《深度学习正遭遇瓶颈》的文章后也招致了不满。Altman 在推特上回应称:“给我一个平庸深度学习怀疑论者的自信吧。”
与此同时,敲响警钟也让 Marcus 成为了一个个人品牌,并获得了与 Altman 并肩坐在美国参议院人工智能监督委员会面前作证的邀请。
而这正是所有这些争论比普通网络恶意更重要的原因。当然,这里涉及到巨大的自我和巨额的资金。但更重要的是,当行业领袖和有观点的科学家被国家元首和立法者召集,来解释这项技术是什么以及它能做什么(以及我们应该有多害怕)时,这些争议就显得尤为重要。当这项技术被嵌入到我们日常使用的软件中,从搜索引擎到文字处理应用程序,再到手机上的助手,人工智能不会消失。但如果我们不知道自己购买的是什么,谁又是那个受骗者呢?
Stephen Cave 和 Kanta Dihal 在 2023 年出版的论文集《构想 AI》中写道:“很难想象历史上还有其他技术能引起这样的辩论——一场关于它是否无处不在,或者根本不存在的辩论。对人工智能能有这样的辩论,证明了它的神话特质。”
最重要的是,人工智能是一种观念、一种理想,它受到世界观和科幻元素的塑造,就如同数学和计算机科学的塑造一样。当我们谈论人工智能时,弄清楚我们在谈论什么将澄清许多事情。我们可能在这些事情上无法达成一致,但就人工智能的本质达成共识将是讨论人工智能应该成为什么样子,至少是一个良好的开端。
那么,大家到底在争什么呢?
2022 年末,就在 OpenAI 发布 ChatGPT 之后不久,一个新的梗开始在网上流传,这个梗比任何其他方式都更能捕捉到这项技术的奇异之处。在多数版本中,一个名为“修格斯”的洛夫克拉夫特式怪物——全身触须和眼球——举起一个平淡无奇的笑脸表情符号,仿佛要掩饰其真实的本质。ChatGPT 在对话中的措辞表现出类似人类的亲和力,但在那友好的表面之下隐藏着难以理解的复杂性乃至恐怖之处。(正如 H.P. 洛夫克拉夫特在他的 1936 年中篇小说《疯狂山脉》中所写:“那是一个可怕得无法形容的东西,比任何地铁列车都要庞大——一团无定形的原生质泡状聚合物。”)
(来源:ANTHRUPAD)
这些争论核心在于,人工智能不仅是一个技术问题,它触及了我们对自身认知、创造力、道德责任,乃至我们对未来的希望和恐惧的根本理解。一方看到的是人工智能带来的无限潜能,是人类智慧的延伸,是解决复杂问题、提高生活质量的工具;另一方则担忧它可能带来的失业、隐私侵犯、社会不公,甚至是人类自主性和生存的威胁。ChatGPT 的出现,如同那个举起笑脸表情的修格斯,象征着人工智能技术在提供友好交互界面的同时,也隐藏着深刻的社会、伦理和哲学挑战。这场辩论,实质上是关于我们如何界定智能、何为人性,以及我们愿意让技术在我们的生活中扮演何种角色的深刻反思。
多年来,流行文化中人工智能最著名的参照物之一是《终结者》,Dihal 提到。但 OpenAI 通过免费上线 ChatGPT,让数百万人亲身经历了一种截然不同的东西。“人工智能一直是一个非常模糊的概念,可以无限扩展以包含各种想法,”她说。但 ChatGPT 让这些想法变得具体起来:“突然间,每个人都有了一个具体的参照物。”对于数百万人来说,人工智能的答案现在变成了:ChatGPT。
人工智能产业正大力推销这个微笑的面孔。想想《每日秀》最近如何通过行业领袖的言论来讽刺这种炒作。硅谷风投大佬 Marc Andreessen 说:“这有可能让生活变得更好……我觉得这简直就是个轻松得分的机会。”Altman 说:“我不想在这里听起来像个乌托邦式的技术狂人,但人工智能能带来的生活质量提升是非凡的。”Pichai 说:“人工智能是人类正在研究的最深远的技术。比火还要深远。”
Jon Stewart 讽刺道:“是啊,火,你吃瘪吧!”
但正如这个梗所示,ChatGPT 是一个友好的面具。在其背后,是一个名为 GPT-4 的怪物,这是一个基于庞大神经网络的大型语言模型,其摄入的文字量超过我们大多数人千辈子阅读的总量。在持续数月、耗资数千万美元的训练过程中,这类模型被赋予了填充来自数百万本书籍和互联网相当大部分内容中句子空白的任务。它们一遍又一遍地执行这个任务。从某种意义上说,它们被训练成超级自动补全机器。结果是生成了一个模型,它将世界上大部分书面信息转换成了一个统计表示,即哪些词最有可能跟随其他词出现,这一过程跨越了数十亿计的数值。
这确实是数学——大量的数学。没有人对此有异议。但问题在于,这只是数学吗,还是这种复杂的数学编码了能够类似人类推理或概念形成的算法?
许多对这个问题持肯定态度的人相信,我们即将解锁所谓的通用人工智能(AGI),这是一种假设中的未来技术,能在多种任务上达到人类水平。他们中的一些人甚至将目标瞄准了所谓的超级智能,即科幻小说中那种能远超人类表现的技术。这一群体认为 AGI 将极大地改变世界——但目的是什么?这是另一个紧张点。它可能解决世界上所有问题,也可能带来世界的末日。
(来源:X)
如今,AGI 出现在全球顶级 AI 实验室的使命宣言中。但这个词是在 2007 年作为一个小众尝试而创造出来的,旨在为当时以读取银行存款单上的手写内容或推荐下一本购书为主的领域注入一些活力。其初衷是重拾最初设想的人工智能,即能做类人事务的人工智能(更多内容即将揭晓)。
Google DeepMind 联合创始人 Shane Legg,也就是创造了这个术语的人,在去年告诉我,这其实更多是一种愿望:“我没有特别清晰的定义。”
AGI 成为了人工智能领域最具争议的想法。一些人将其炒作为下一个重大事件:AGI 就是人工智能,但你知道的,要好得多。其他人则声称这个术语太过模糊,以至于毫无意义。
“AGI 曾经是个忌讳的词,”OpenAI 前首席科学家 Ilya Sutskever 在辞职前告诉过我。
但大型语言模型,特别是 ChatGPT,改变了一切。AGI 从忌讳之词变成了营销梦想。
这就引出了我认为目前最具说明性的争议之一——这场争议设定了辩论双方以及其中的利害关系。
在机器中看见魔法
在 OpenAI 的大型语言模型 GPT-4 于 2023 年 3 月公开发布前几个月,公司与微软分享了一个预发布版本,微软希望利用这个新模型来改造其搜索引擎 Bing。
那时,Sebastian Bubeck 正在研究 LLMs(大型语言模型)的局限性,并对它们的能力持一定程度的怀疑态度。尤其是身为华盛顿州雷德蒙德微软研究院生成 AI 研究副总裁的 Bubeck,一直在尝试并未能成功让这项技术解决中学数学问题。比如:x - y = 0;x 和 y 各是多少?“我认为推理是一个瓶颈,一个障碍,”他说,“我原以为你必须做一些根本性不同的事情才能克服这个障碍。”
然后他接触到了 GPT-4。他做的第一件事就是尝试那些数学问题。“这个模型完美解决了问题,”他说,“坐在 2024 年的现在,当然 GPT-4 能解线性方程。但在当时,这太疯狂了。GPT-3 做不到这一点。”
但 Bubeck 真正的顿悟时刻来自于他推动 GPT-4 去做一些全新的事情。
关于中学数学问题,它们遍布互联网,GPT-4 可能只是记住了它们。“你如何研究一个可能已经看过人类所写一切的模型?”Bubeck 问道。他的答案是测试 GPT-4 解决一系列他和他的同事们认为是新颖的问题。
在与微软研究院的数学家 Ronen Eldan 一起尝试时,Bubeck 要求 GPT-4 以诗歌的形式给出证明存在无限多质数的数学证明。
以下是 GPT-4 回应的一段:“如果我们取 S 中未在 P 中的最小数/并称之为 p,我们可以将它加入我们的集合,你看不见吗?/但是这个过程可以无限重复。/因此,我们的集合 P 也必定是无限的,你会同意。”
很有趣,对吧?但 Bubeck 和 Eldan 认为这远远不止于此。“我们在那个办公室,”Bubeck 通过 Zoom 指着身后的房间说,“我们两个都从椅子上摔了下来。我们无法相信自己所看到的。这太有创意了,如此与众不同。”
微软团队还让 GPT-4 生成代码,在用 Latex(一种文字处理程序)绘制的独角兽卡通图片上添加一只角。Bubeck 认为这表明模型能够阅读现有的 Latex 代码,理解其描绘的内容,并识别角应该加在哪里。
“有很多例子,但其中一些是推理能力的铁证,”他说——推理能力是人类智能的关键构建块。