如果世界是电脑模拟的,人类能否像黑客一样“?越狱”逃离?

  更新时间:2026-02-16 10:44   来源:牛马见闻

吉报头条
重要新闻
国内新闻
国际新闻
图片精选

至少在超级智能 AI 的帮助下他收集了三百多种被提出的 AI 控制方法我们可能永远无法确保超级智能 AI 是安全的

<p id="4AS06H3K">在电(影《黑客)帝国》中,主角 Neo 面临着一个终极选择:吞下蓝色药丸,继续活在虚假但舒适的模拟世界里;或是吞下红色药丸,看清残酷但真实的世界。这是科幻电影史上最经典的场景之一,也留下了一个深刻的问题:如果现实就是计算机的一场超真实模拟,我们能否主动选择“逃离”?</p> <p class="f_center"><br>(来源:wikipedia)<br></p> <p id="4AS06H3N">人类可能生活在模拟之中的想法由来已久。早在 17 世纪,法国哲学家笛卡尔就曾讨论过“我们是否活在梦中”的观点,但还仅停留在哲学思辨的层面。真正引起学界注意的,是牛津大学哲学家尼克·博斯特罗姆(Nick Bostrom)在 2003 年发表的一篇极具影响力的论文:《你是否生活在计算机模拟中?》(Are You Living in a Computer Simulation?)。</p> <p class="f_center"><br>(来源:humanscience.org)<br></p> <p id="4AS06H3Q">在这篇论文中,博斯特罗姆猜想,我们生活在某种超级先进的外星计算机中的可能性大约为 20%。他核心论证是:如果文明发展到足够先进的程度,拥有了制造高度逼真“祖先模拟”的技术能力,那么他们很可能会运行大量这样的模拟程序,出于科学研究、娱乐,或是其他我们无法想象的目的。</p> <p id="4AS06H3R">如果真是这样,那么模拟中的“人”将远远多于真实世界的人。从纯粹的概率角度,我们更可能是这些模拟程序中的一员,而非那个唯一的“真实”世界的居民。</p> <p id="4AS06H3S">这个论证获得了一定范围的认同。例如埃隆·马斯克(Elon Musk)就曾表示,他认为我们生活在基础现实(base reality)中的概率仅有“十亿分之一”。天体物理学家尼尔·德格拉斯·泰森(Neil deGrasse Tyson)给出的概率是 50%。人工智能研究的先驱汉斯·莫拉维克(Hans Moravec)也认为我们“几乎肯定”生活在模拟中。(注:在讨论虚拟现实、模拟假说时,“基础现实”指代真实的物理世界,与模拟环境或虚拟现实相对。)</p> <p id="4AS06H3T">当然,也有持怀疑态度的学者,比如哥伦比亚大学的天体物理学家大卫·基平(David Kipping)通过贝叶斯分析认为,我们生活在模拟中的概率应该低于 50%。值得注意的是,即便是持怀疑态度的学者,也投入大量时间研究这个问题,这某种程度上说明了它的严肃性。</p> <p id="4AS06H3U"><strong>为什么要逃离?</strong></p> <p id="4AS06H3V">在这样的背景下,美国路易斯维尔大学计算机科学与工程系的罗曼·雅姆波尔斯基(Roman Yampolskiy)教授提出了一个更激进的问题:既然可能身处模拟,我们能否找到逃脱的方法,以此进入所谓的基础现实?2023 年 3 月,他发表了一篇题为《如何逃离模拟》(How to Escape from the Simulation)的论文,这可能是第一篇系统探讨“模拟越狱”的学术研究。</p> <p class="f_center"><br>图|罗曼·雅姆波尔斯基(来源:Wikipedia)<br></p> <p id="4AS06H42">雅姆波尔斯基的研究领域横跨人工智能安全、意识研究和模拟理论。在他看来,逃离模拟的动机其实很充分。</p> <p id="4AS06H43">首先,基础现实掌握着真正的知识和更强大的计算资源,这意味着在那里可能实现模拟世界中不可能的科学突破。关于宇宙起源、意识本质、生命目的这些终极问题的答案,很可能是外部世界的常识。更实际的考虑是,如果这个世界不是真实的,那么获得真实世界的访问权限,就能理解我们真正的终极目标应该是什么。</p> <p id="4AS06H44">成功逃离还可能带来其他好处:例如真正的永生,而非受限于模拟宇宙的物理年龄;控制超级智能机器的新方法;避免存在性风险,包括模拟被毫无预警地关闭;甚至获得某种超能力,因为掌握了外部世界的规则。如果能获得模拟的源代码,理论上甚至可以“修复世界”,比如彻底消除痛苦。</p> <p id="4AS06H45">“逃离”本身也被分成了不同的层次。最基础的可能只是怀疑自己在模拟中;进一步是获得关于外部世界的信息;更高级的是能够与模拟的创造者沟通;而终极形式则是将自己的意识或大脑上传到真实世界,可能需要某种物理载体,如果基础现实确实存在物理实体的话。</p> <p id="4AS06H46">雅姆波尔斯基在论文中引用了两个有趣的类比:一个是科学家让金鱼通过控制装载着鱼缸的小车在陆地上行驶,本质上是让金鱼逃离了它的水世界;另一个是研究者将秀丽隐杆线虫的完整 302 个神经元连接图上传到乐高机器人,让这个“意识”在完全不同的身体中运行。</p> <p id="4AS06H47"><strong>游戏世界里的成功案例</strong></p> <p id="4AS06H48">那么,具体应该如何破解模拟?雅姆波尔斯基在论文中明确表示,他只关注那些类似现实网络安全攻击的方法。例如硬件、软件漏洞利用和社会工程学攻击,而排除了更“玄学”的路径,比如冥想、致幻剂、梦境、魔法或宗教仪式。尽管历史上许多宗教确实声称这个世界不是真实的,而且可以通过某些方式“超越”物理世界进入“真实”的精神世界,但他选择从纯粹的计算机科学角度切入。</p> <p id="4AS06H49">最简单的逃离方式是“辅助逃离”,也就是获得外部世界的帮助。这可能通过一种社会工程学攻击实现。</p> <p id="4AS06H4A">尽管我们既不了解模拟外部的社会生活,也没有通信设备,甚至可能不知道他们的语言,一个大胆的想法是与模拟的设计者进行某种“非因果交易”(acausal trade),绕过直接通信的需要。如果我们的模拟正被监控,也许可以传达一个信息:我们知道自己被模拟了,请求同情。</p> <p id="4AS06H4B">论文中引用了一个被称为“机械降神计划”(Ex Machina Plan)的四步策略:说服模拟者与我们沟通;找到沟通方式;给模拟者一个让我们加入真实世界的理由;让模拟者自己想办法把我们带出去。</p> <p id="4AS06H4C">更有挑战性的是“非辅助逃离”,即完全从内部破解系统,寻找模拟的漏洞。现实中已经有人成功做到了类似的事情。2016 年,一位叫 SethBling 的程序员和团队成功地“越狱”了超级马里奥世界游戏。他们通过精确控制马里奥的动作,如跳跃、转向、拾取物品,这些动作会映射到游戏机的内存状态,最终写入任意代码,获得了对游戏的完全控制权。他们甚至在马里奥游戏中植入了一个完整的十六进制编辑器和《Flappy Bird》游戏。</p> <p class="f_center"><br><br></p> <p id="4AS06H4E">可以说,如果马里奥足够聪明,理论上他可以从游戏内部发现并执行这个破解程序。当然,这需要极其精确的操作,位置偏差哪怕一个像素都会导致失败。</p> <p id="4AS06H4F">模拟理论的研究者们还提出了各种奇异的破解策略。</p> <p id="4AS06H4G">比如,有人建议通过大规模的集体行动来“过载”模拟系统。具体做法是:让 1 亿人同时什么都不做(比如闭眼冥想,不产生任何思想),诱使负载平衡系统将他们打包到同一台机器上。然后突然间,所有人同时进行高强度的处理和输入输出操作,试图让系统过载,在这个脆弱的时间窗口寻找漏洞。理论上可以尝试缓冲区溢出攻击,或者制造类型转换错误,甚至通过“模糊测试”。比如用奇怪的方式看东西,对着鸟说话,或者跳进墙壁来混淆系统。</p> <p id="4AS06H4H">另一个方向是利用量子力学的“怪异性”。在模拟假说的框架下,量子纠缠、非局域性、叠加态、不确定性等现象可以被解释为计算伪影或模拟器硬件/软件的故障。科学家们近年来设计了越来越精巧的量子实验,某种程度上,每一个新的量子力学实验都可以看作是对模拟的一次“黑客”尝试。这类实验的设计近几年开始委托给人工智能,因为 AI 能够想出人类不太可能想到的巧妙组合。</p> <p id="4AS06H4I"><strong>AI:最后的希望</strong></p> <p id="4AS06H4J">这就引出了雅姆波尔斯基的最新观点:他认为 AI 可能是破解模拟的关键助手。根据“扩展假说”(scaling hypothesis),我们不需要新的发明就能持续改进 AI,只需要更多数据、更多计算力、更大的参数模型。</p> <p class="f_center"><br>(来源:Youtube)<br></p> <p id="4AS06H4M">这就形成了一个有趣的呼应,因为雅姆波尔斯基长期研究的另一个问题是“AI 约束问题”(AI Confinement Problem),即如何将超级智能 AI 安全地“关”在一个虚拟环境中研究,防止它逃脱并造成危害。这个问题与模拟逃离问题在本质上是同一个问题。无论是 AI 被人类“装箱”(boxing),还是人类被更高级的存在模拟,都是关于虚拟环境的逃脱问题。</p> <p id="4AS06H4N">这带来了一个关键推论:要么超级智能 AI 能够从虚拟环境中逃脱(这意味着我们也有可能逃离模拟),要么 AI 无法逃脱(这意味着模拟逃离也不可行,但至少说明理论上可以成功约束 AI)。这是一个经典的“排中律”命题:两者必有其一为真。如果当前的 AI 安全研究显示长期来看 AI 是“不可约束的”,那么这实际上是个好消息:这意味着我们也应该能够逃离模拟,至少在超级智能 AI 的帮助下。</p> <p id="4AS06H4O">当然,这个推论有一个前提:假设模拟者和被模拟者之间不存在太大的智能差距。如果我们的模拟是由远超我们的超级智能设计的,专门为了防范 AI 的出现,那么即使我们创造出超级智能,也可能仍然无法突破。</p> <p id="4AS06H4P"><strong>为何至今无人“越狱”?</strong></p> <p id="4AS06H4Q">但雅姆波尔斯基通过对 AI 控制方法的系统研究发现,情况可能并不乐观。在过去十年里,他收集了三百多种被提出的 AI 控制方法,涵盖社会学、计算机科学、经济学、政治学等各个领域,但没有一种方法真正有效。</p> <p id="4AS06H4R">问题在于,我们甚至无法就“什么是控制”达成一致。AI 研究的最初五十年,人们谈论的是如何让机器具有道德的伦理问题。但当 AI 变得更加通用和强大后,话题转向了“友好 AI”、“AI 对齐问题”、“AI 安全工程”。然而,要控制超级智能,我们需要能够解释它如何工作、理解这些解释、预测它将做什么、验证它的决策、对其代码建模等等。</p> <p id="4AS06H4S">现实是,我们在所有这些方面都面临根本性的限制。我们无法完全理解拥有数十亿神经元和权重的大型语言模型如何工作。如果我们和一个 AI 下棋,唯一能预测的就是它会赢,但不知道具体怎么赢。如果我能预测具体的走法,我就在同一水平,它就不再是“超级”智能了。</p> <p id="4AS06H4T">更根本的是,验证代码和数学证明也存在极限。谁来验证那个验证程序的程序?这是一个无限回归的问题。即使在数学界,对于某些过于复杂或冗长的证明,也存在无法达成共识的情况。没有足够多具备资格的人能够评审。这些限制意味着,我们可能永远无法确保超级智能 AI 是安全的、可控的。</p> <p id="4AS06H4U">不过,历史记录或许能给我们一些希望。雅姆波尔斯基指出,虚拟世界的越狱先例是存在的。不仅是马里奥世界,还有《魔兽世界》中的大规模黑客攻击、《赛博朋克 2077》的金钱复制漏洞、《塞尔达传说:时之笛》中实现的任意代码执行等等。</p> <p id="4AS06H4V">这些案例的共同点是:复杂的系统总是存在漏洞。软件有 bug 是常态,如果我们确实在一个软件模拟中,这些 bug 应该是可以被利用的。甚至关于“模拟论证”(Simulation Argument)本身的论文,学者都找到过逻辑漏洞。</p> <p id="4AS06H50">但并非所有尝试都有效。雅姆波尔斯基在论文中也列举了一些已经被尝试但没有产生任何效果的方法:通过魔法思维或大声祈祷与模拟者沟通没有产生可测量的影响;不道德的行为(比如虐待)也不会引来模拟者的干预,说明他们要么不在意,要么没在监控;增加计算负担(比如比特币挖矿)也没有让模拟崩溃,可能因为对方的计算能力远超我们的想象;宣称“我不再同意待在模拟中”同样无效;甚至运行大型强子对撞机也没有创造黑洞摧毁宇宙......</p> <p id="4AS06H51"><strong>“我们都还在这里”</strong></p> <p id="4AS06H52">还有一个更深层的困难:如果我们真的处在一个“完全模拟”中。那么在这里,不仅环境被模拟,我们的意识、思想本身也是模拟的。这种情况下,逃脱本身就是一个矛盾概念,就像要求小说里的人物跳出书本一样,根本无法破解。</p> <p id="4AS06H53">即便是雅姆波尔斯基自己也承认,他的论文发表时受到的第一个批评就是:“你并没有真正告诉我们怎么破解模拟。”他的回应颇为风趣:“通常一个话题的第一篇论文不会也是最后一篇。否则就没人引用了。”</p> <p id="4AS06H54">也许真正的问题还在于,我们对“模拟”的想象太过人类中心主义了。假设存在类似人类的模拟者,用类似计算机的设备,以我们能理解的方式运行程序,甚至会犯我们能察觉的错误。一位评论者指出:“能够创造我们这个宇宙的存在,其复杂性和能力可能完全超出我们的理解范畴。”</p> <p id="4AS06H55">要是真有那么一天,某个超级智能 AI 成功地破解了所有人类设置的限制,找到了从虚拟训练环境逃入真实世界的路径。或许到那时,我们会意识到人类和 AI 面对的其实是同一个困境:如何在一个由更强智能设计的系统中,找到通向更广阔现实的出口。不同的只是,我们身处的“盒子”可能比我们给 AI 设计的要精密得多、大得多,也更难察觉。</p> <p class="f_center"><br><br></p> <p id="4AS06H58">至于我们会不会成功?雅姆波尔斯基在最近的一次演讲中回应道:“我还在这里,这本身就说明了一些事情。”</p>

编辑:鄂靖文