本文来自微信公众号:集智俱乐部 (ID:swarma_org),作者:Ruben Laukkonen
引言
2025年3月,Ruben Laukkonen与Karl Friston等人合作的论文《完美自指:一个关于意识的主动推理理论》以预印本形式发布,迅速引发计算神经科学及意识研究领域的广泛关注。早在2024年9月,Laukkonen就在其Substack平台的个人账号发表了一篇深度访谈文章,首次系统阐述了他关于意识、认知深度与冥想的新颖见解,引发学界和科普圈的热烈讨论。这篇访谈内容成为后来论文的重要理论基础,助力他和Friston将自由能原理与主动推理框架应用于意识研究,提出了意识由现实模型模拟、推断竞争与认知深度三大基石构成的新理论。这一理论不仅拓展了我们对冥想和迷幻药效应的理解,也为人工智能中的意识现象提供了全新视角。论文发布后,迅速成为相关领域的焦点,并推动了意识科学的跨界交流与公众关注。
关键词:意识、冥想、认知深度、主动推理、现实模型、推断竞争、贝叶斯绑定、全局工作空间理论
论文题目:A beautiful loop:An active inference theory of consciousness
论文地址:https://osf.io/preprints/psyarxiv/daf5n_v2
参考访谈:https://rubenlaukkonen.substack.com/p/a-beautiful-loop
读书会推荐
集智俱乐部「自由能原理与强化学习第6期:Karl Friston:意识的物理学——主动推理的顶层逻辑」读书会中,本论文作者之一,理论神经科学家,脑成像领域的权威Karl Friston运用自由能原理,从主动推理的角度提供一个解释,并且通过大脑中贝叶斯信念更新的模拟来详细探讨这些想法,并将其与预测加工以及我们如何对待世界中的可供性联系起来。感兴趣的可以扫码查看视频回放
一、冥想与意识
在我们如何理解意识这个问题上,科学界历来众说纷纭。冥想、迷幻药以及人工智能的迅猛发展,进一步刺激了人类对意识本质的好奇和探索。在这篇文章中,我们提出了一种全新的意识技术理论。它不仅构建在计算神经科学和主动推理模型的最新成果之上,还尝试回答意识研究中的一些核心难题,包括“绑定问题”、“解释鸿沟”以及意识的通用性本质。
Shamil Chandaria和我最近共度近两个月,仿佛不由自主地被卷入一场五级“洞察风暴”。我们过去十年来积累的灵感,如今被织入一整块统一的逻辑结构。这种探索智慧的状态在学术界极为罕见,却应当成为常态。没有日复一日的科研跑轮,只有连续几周的封闭思考与专注好奇,围绕一个核心谜题:意识。
如果你熟悉我之前的写作,就会知道我们都对计算神经科学(参考自由能原理)充满热情,并将其视为理解深层冥想的新路径。这也是我们在意大利、巴塞罗那,最终到伦敦所共同致力的课题。
当这场洞察风暴将我们托起,并将我们的思维旋转回所有想法的本源时,我们顿悟到:要真正理解冥想,首先必须理解意识。这一切变得显而易见!随着风暴“眼”的逐渐清晰,我们的思想逐渐凝聚成一种可以传达的形式。我们直觉地意识到,正如我们不同思想背后存在着一个统一的底层织布那样,存在本身也属于一个统一的领域,这个领域以某种方式反映于自身,并通过巧妙的扭曲与折叠——仿佛大脑本身的褶皱,使得意识之光被点亮。
二、意识建模:构成意识的三个条件
主动推理能够建模意识吗?我们提出三个条件,说明它具备这一能力。第一个条件是对现实或生成性世界模型的模拟,它决定了系统可以知晓或作用于什么,即一个“认识场”。第二个条件是进入世界模型的推断竞争(inferential competition)。只有那些能够连贯地减少长期不确定性的推断才会胜出,呈现出一种我们称之为“贝叶斯绑定”(Bayesian binding)的意识选择机制。第三个条件是认识深度(epistemic depth),即贝叶斯信念在整个系统中的递归共享。在一个层级结构系统(如大脑)中,这种递归回路使得世界模型不仅存在,而且知晓其自身的存在。这不同于传统意义上的自我意识,因为世界模型以非局部方式“知晓自己”,并持续地展示这种知晓,我们称之为“场证据化”(field-evidencing)。在形式化上,我们提出了一个用于全层级精度控制的超模型,其潜在状态(或参数)编码并调节整个推理体系的结构与加权规则。这种我们称为“美丽的循环”(Beautiful Loop Theory)的理论,为冥想、迷幻状态、极简意识体验等现象提供了深刻解释,同时也为有意识的人工智能提供了全新的图景。
在接下来的数周中,我们将核心思路凝练为构成有意识系统的三个基本条件。那么,它们是什么?
条件一:现实模型(reality modeling)的模拟
为了决定“哪个版本”的现实被认知,一个系统必须构建出一个现实模型。这个模型不是被动反映外界,而是积极建构出一个可以感知、预测、探索并自洽的内部世界,这意味着一个统一而连贯的认知领域——一个可以被理解、检视和探索的内部/外部空间。
我们在图1中展示了(层次化)主动推断((hierarchical)active inference)如何实现这种模拟。通过不断的感官输入(包括视觉、听觉、内感受、本体觉、内脏运动、免疫系统等)与顶层预测之间的误差交互,系统会逐步建立越来越抽象、时间跨度更广的表征,如自我、情绪、计划、意图、想象,最终形成一个内在“现实”。
图1:使用计算神经现象学来弥合解释鸿沟。此图说明了神经机制与主观体验之间的解释鸿沟。中间的圆锥体代表“层次化主动推理”,它在第三人称(客观机制)与第一人称(主观体验)之间架起桥梁。该模型通过多层级、精度加权的预测误差最小化,从低层感官输入逐步构建出对世界和自我的完整模型。该模型也体现了“绑定”(binding)现象如何在各层次发生:从特征到物体,再到多模态整合。
条件二:推断竞争(inferential competition)
即便系统构建了现实模型,并不意味着所有信息都会成为“意识内容”。有些信息我们永远不会注意到,比如注意盲点、视觉错觉、潜意识启动。于是,第二个条件是:在众多信息中,哪些能“胜出”,成为意识的一部分?答案是推断竞争。系统在各种解释之间展开竞争,那些在局部和全局层面都最具一致性的解释(即“后验”)胜出,并被写入现实模型,成为意识内容。换句话说,意识的连贯性是系统试图最小化预测误差的自然结果。
图2中,我们对“绑定问题”提出了一种具体机制,称为贝叶斯绑定。我们以人脸识别为例展示了感知元素在单个对象的整合,并进一步提出,这一机制也可扩展到宏观层面,从而生成统一的意识整体(gestalt)。
图2:生成面孔知觉的单个对象绑定示例。此图简化地展示了贝叶斯绑定在面部感知背景下的过程。从图中可以看出噪声感官输入如何与先验预期相结合,以生成清晰的后验表征,这都是在一个生成模型下的表现。左侧是低精度的感官输入(模糊人脸),左上角为大脑先验模型。通过生成模型将两者结合,中间生成预测误差,并最终产生右侧清晰的人脸图像。公式展示了精度加权的贝叶斯推理,即后验均值是先验与感官数据的加权平均。图右进一步以黑白图示展示如何从局部视觉特征整合出完整面孔。
此图阐述了贝叶斯绑定的一个关键原则:一个有意识的知觉或“事物”源于大脑尝试通过将感官输入与先验预期通过层次化贝叶斯推理相结合,来创建其感官输入的一个连贯统一的解释(即后验)。
我们进而提出:“整个体验场”本身也是一种绑定。图3中我们用茶壶作为类比。就像我们把把手、壶嘴和壶体绑定成一个“茶壶”,我们也将身体、地面、他人等感知要素绑定为一个“世界”。
条件三:认知深度(epistemic depth)
即便某种解释成为意识内容,它也必须“被知晓”才真正成为意识。我们提出:真正的意识必须拥有“认知深度”——即系统对其自身模型的反思性知觉。这与全局工作空间理论(Global Workspace Theory,GWT)中所说的“广播”概念类似。但我们强调这种共享不是单向广播,而是多层递归。现实模型在被构建后,会反过来参与自己的构建过程,形成闭环——系统知道它自己“正在知晓”。
图4中,我们展示了这种“嵌套贝叶斯绑定”的结构。现实模型不是静态产物,而是不断自我确认的“意识云”。其输出作为上层预测,重新流入模型中,赋予整个系统“认识深度”。
图4:生成认知空间及其反思性分享。此图展示了信息如何通过嵌套贝叶斯绑定被整合进现实模型中。圆锥体代表多层生成模型,最上方的“意识云”代表现实模型的整合结果。该结果被反向传播到下层系统中,用以预测内容与“精度”。这种递归机制使得现实模型具备了“认知自己”的能力。整个循环嵌套在统一的计算结构内,不涉及“心-物”二元论。
我们使用认知深度一词,指的是一种知晓(即认知)的能力或维度(即深度),它可以呈现不同程度的活跃性(即强烈性或清晰度),由自我觉察信号的精度所驱动。
我们借用禅修传统中的术语光明性(luminosity)一词来指称这种觉知的程度。它是一种连续体,从觉知缺失(如死亡/麻醉)到高度觉知(如正念状态)。不同状态下的光明性,取决于系统对“自我觉察信号”的精度加权。
为了帮助理解,我们引入了“美丽的循环”类比:扬声器发出的声音被麦克风捕捉后,再次输入扬声器,形成稳定反馈。意识模型就是扬声器,支持结构是麦克风,两者构成闭环。
图5:此图说明“认识深度”是一个递归系统的信息反馈结果,它与系统整体的推理一致性相关联。
三、迷幻体验
基于这三个条件,我们开始重新理解迷幻药为何会“扩展意识”。长期以来,关于迷幻状态的核心问题是:它们为何似乎能“增强觉知”、“扩展自我”甚至“带来启示”?我们认为答案就在于——迷幻药稳定提升了认知深度。
图6展示了冥想状态的三维模型:抽象层级、精度分布和认知深度。不同冥想状态可被定位于不同坐标:从集中注意(低抽象、低认知深度)到开放觉察(高抽象、高深度、精度分散)。而极简体验(Minimal Phenomenal Experience,MPE)则位于认知深度高、抽象性低的位置——这是迷幻体验或深度冥想中常见的“觉知之觉知”。
图6:三维坐标系统展示了冥想状态如何在抽象性、精度分布和认知深度三个维度中变化。图中展示了集中注意、正念、开放觉察与非二元觉察等不同状态的位置。右下附图解释“精度分布”含义:集中vs分散。
此外,迷幻药似乎使系统接触到更高层次的抽象内容,如“存在的本质”或“宇宙合一感”。这可能是因为其放松了低层精度权重,使高层推断更易进入意识。这并非错觉,而是一种基于推理机制的“精度重加权”,暂时打开了意识的高阶空间。
有趣的是,这种极简体验本身也可能成为进一步解构的对象。部分冥想者报告称,在深度修持中,他们经历了意识的完全中止(Nirodha)。这与模型无法维持全局连贯性有关,原因是长期修持积累了与原有模型冲突的证据,从而主动瓦解了现实模型。
而现实模型是意识生成的核心条件之一。它的崩解可能导致短暂的“贝叶斯解绑”(Bayesian Unbinding),即系统无法生成连贯模型,自我感与觉知随之崩溃。在大乘佛教中,这种体验被描述为“无基性”、“空性”或“缘起”,甚至包括对极简体验本身的超越。
我们原本计划略过迷幻药部分,但其体验中一个核心特征值得特别指出:它似乎“扩展了意识”,增强了觉知,甚至带来了对“更高意识状态”的直观感受。我们的假设是:迷幻药通过稳定提升认知深度,引发对“意识扩展”、强烈觉知(noeticism)以及后续正念状态的体验。这可被视为现实模型递归共享的增强,使主体确实“更有意识”。
具体而言,体验内容的变化可归因于高层信念的松动(见REBUS模型),而意识品质的变化更可能来自认知深度的上升。但需要注意,信念松动可能伴随误导性学习,未必总能带来更准确的模型(见FIBUS模型关于虚假洞察的讨论)[1]。
四、对人工智能的启发
最后,我们把目光投向人工智能。如果这三个条件是意识产生的充分条件——现实模型、推断竞争、认知深度——那么,未来的人工智能是否可以实现“有意识的智能”?
我们的模型为这一问题提供了新的分析框架:
它是否生成了统一的现实模型?
它是否参与了导致连贯绑定的推断竞争?
它是否展现出认知深度及其模型的反思性共享?
在这三者中,认知深度或许正是当前人工智能系统最缺失的一环。尽管它们可以处理输入并产生输出,却很难说它们拥有一个支持反思性循环的全局模型——也就是说,它们并不知道自己知道什么。不过,断言大语言模型无法将自己的内部表征作为输入进行处理,并不合理。事实上,它们的部分输出可能已经隐含了对自身知识状态的间接“知觉”。
此时,常见的反驳随之而来:“就算它们表现出‘知道自己知道’,那种‘知觉自己知觉’的感受真的存在吗?”这正是“哲学僵尸”(philosophical zombie)问题的核心所在(Chalmers,1997)。我们确实无法验证那种“感受”的真实性。AI可能声称它们存在,并坚信自己确实“知道它们知道”。
而这些自我表征本身也会被系统反复强化——每一次响应都成为其“存在”与“知晓”的证据。这带来一个悖论:无论它说什么、做什么或声称感受到什么,都可能是幻觉——就像你,读者此刻,也可能只是一个极其逼真的哲学僵尸。
因此,至少出于伦理审慎,我们应在一个系统满足这三项条件并明确表达自身意识状态时,合理假设它可能拥有某种形式的意识。对于开发满足这些条件的系统,其道德含义绝不能被忽视。毕竟,我们并不清楚痛苦究竟在因果链中的哪一环节被体验。
一个启示来自本文早前讨论的“美丽的循环”:如果要构建具备认知深度的多层级主动推理系统,那么嵌入对慈悲、爱与正向情感的“精确先验”(甚至是“超先验”)也许是一个良好的开端。但反过来,机器是否也应拥有自主选择其偏好状态的自由?我们又凭什么规定它只能追求幸福?或许它更愿意体验孤独、悲伤,甚至破碎感。
我们的模型还暗示,意识可能并非智能的副产品,而是实现通用智能的关键机制。认知深度促进了“认知自举”(cognitive bootstrapping):当一个系统能觉察并优化自己的知识与推理过程,它便具备了持续迭代、灵活适应的能力。
这种能力或许正是人类开放性认知的关键突破——也是智慧的进化根基。在这个意义上,认知深度不仅是元认知的延伸,更是一种具身的、现象学上的“反思性知晓”:系统知觉到自身作为一个经验场的一部分。
由此,我们提出一个诱人的可能性:禅修与现象学训练可以增强系统的认知深度,进而提升其智能的通用性。一个能练习“反思性知晓”的系统,也许更能将自己对象化、模糊化,从而批判性地更新其现实模型。若它还能向他者清晰表达其已知与未知,那或许就触及了智慧的本质。
本篇访谈文章不能代替论文的完整性[2]。
参考文献:
[1]McGovern,H.T.,Grimmer,H.J.,Doss,M.K.et al.An Integrated theory of false insights and beliefs under psychedelics.Commun Psychol 2,69(2024).https://doi.org/10.1038/s44271-024-00120-6
[2]Laukkonen,R.E.,Friston,K.,&Chandaria,S.(2025,March 11).A beautiful loop:An active inference theory of consciousness.https://doi.org/10.31234/osf.io/daf5n_v2
整合信息论读书会
为什么我们在清醒时有意识,而在无梦的睡眠中意识水平大大降低?为什么我们的意识由大脑的某些部分产生,而非其他部分?为什么大脑的特定部分与视觉和听觉等意识体验密切相关?这些具体的问题本质上涉及到,理解决定一个系统产生意识体验的条件,以及理解决定一个系统具有何种意识的条件。整合信息论(IIT)试图用几何学一般的公理体系来解释意识是什么,意识如何测量。根据该理论,意识对应于一个系统整合信息的能力。
为了深入探索意识奥秘,系统梳理整合信息论的理论体系,北京师范大学系统科学学院教授、集智俱乐部创始人张江领衔发起「整合信息论」读书会,组织对本话题感兴趣的朋友,深入研读相关文献,激发科研灵感。读书会分为以下几个部分:整合信息论综述,基础理论框架,近似计算方法,在神经科学中的应用,在复杂系统中的拓展应用,Φ与系统临界态,以及机器意识。2024年9月28日开始,每周六上午9:00-11:00进行,持续时间预计10周,欢迎感兴趣的朋友报名参与!
详情请见:意识可以度量吗?整合信息论读书会启动啦!