从通用人工智能到假想火星人:为机器情感辩护

作者:Kevin Zhang,UHHC合作组织关注伦理与人类价值观的开放季刊《时代精神》Zeitgeist: An Open Quarterly for Ethics and Human Values,本文作者来自惠州

引言

2022年,谷歌工程师 Blake Lemoine 因声称其AI聊天机器人LaMDA已发展出感受情感的能力而被停职。[1] 此类例子让许多人推测,未来智能机器可能会像我们一样,拥有丰富的情感生活。

我认为这种直觉是合理的。具体来说,令 M 为“类人机器能够像我们一样体验情感”这一命题,我认为 M 是成立的,前提是我们最终能创造出这样的机器。为简便起见,我将统称类人机器为人工通用智能(AGI)。

我的论证分为三部分。首先,我定义“AGI”和“情感”的含义。其次,我表明,如果我们遇到仅在物质构成上与我们不同的火星人,我们应当相信它们能够感受情感。第三,我认为,如果这个条件句成立,那么了解 AGI 的特性将给我们足够的理由认为 M 是成立的,因为 AGI 与火星人之间存在相关的相似性。[2]

定义

首先,我们必须澄清我论证中的两个概念:AGI 和情感。

AGI 我将通用人工智能(AGI)定义为行为和功能上与典型人类相似的机器。“行为”是指 AGI 能够执行行为任务(例如,驾驶汽车),至少与训练有素的人类一样好。“功能”是指 AGI 具有一个在抽象层面上类似于人类神经网络的内部功能组织。[3]

有两点需要从一开始就注意。第一,本文中使用的 AGI 概念纯粹是行为和功能性的,这留下了 AGI 是否具有意识、自我意识或情感的问题。第二,我为 M(机器能够体验情感)所做的论证假设了 AGI 的最终创造。为简洁起见,我不会在此考虑技术细节,但我认为我们至少应该对这个假设的真实性有一定的信心,因为大多数 AI 研究人员对创造 AGI 持乐观态度。[4]

情感:尽管情感无法以一种既精确又可行的方式来定义,但我们大多数人对情感是什么都有一个直观的概念。我们认为,诸如喜悦、恐惧和希望等情感本质上由三个方面构成:行为、意向和现象学体验。[5] 这第三个组成部分对于围绕人工情感的辩论尤为关键,因为它要求 AI 能够感受情感的“感觉起来像什么”的方面。[6]

现在,感受情感的能力大概不是随机或偶然的事情。也就是说,我们可以预期自然界中存在可靠的规律性,使得在法则学上必然地,如果一个物理系统满足某些条件,它就会体验情感。鉴于这些澄清,M 大致相当于这样一个假设:AGI 将满足体验情感的某个法则学上充分的条件。[7]

类比论证

想象一下:在探索这颗红色星球时,我们遇到了一个繁华的火星人村落。这些火星人会烦恼、抱怨、为朋友欢呼,在危险时胆怯地颤抖。假设我们还了解到,它们的内部功能组织在所有相关方面都与我们相似。它们拥有复杂的神经系统,以在抽象层面上类似于人类神经处理的方式处理和存储信息。然而,一项科学研究发现,火星人是由一种奇特的硫酸粘液构成的。尽管如此,我认为我们大多数人会欣然宣布,我们发现了具有情感能力的同类生命,并张开双臂欢迎我们的火星朋友。这引出了我论证的第一个前提:

前提 1那些在物质构成上与我们不同,但在高层次功能方面与我们相似,并表现出看似情感行为的火星人,(很可能)能够体验情感。

前提 1 的动机在于其直观的吸引力。诚然,如果有人认为拥有碳基基质是体验情感的必要条件,那么他应该拒绝前提 1。但没有理由认为碳在法则学上比硫或硅等元素与情感更相关。[8] 也许非碳生物化学无法维持生命,但这并不与以下主张相矛盾:如果这样的外星人——根据设定,它们满足了功能上定义的生命条件——存在,它们很可能能够感受情感。事实上,我认为大部分辩论将取决于我的第二个前提:

前提 2 如果前提 1 为真,那么一个在行为和功能上足够类似人类的机器(即 AGI)能够体验情感。也就是说,假设 AGI 最终被创造出来,则 M 成立。

我们应该接受前提 2,因为火星人和 AGI 在拥有情感的法则学充分条件方面是密切类似的。在这两种情况下,我们都有一个在行为和功能上与典型人类非常相似,但在物质基质上与我们不同的存在。如果物质构成的差异不是拒绝火星人能感受情感观念的好理由,那么它也不是拒绝 M 的好理由。

反对意见与回应

那些想要拒绝前提 2 的人必须指出火星人和 AGI 之间的一个相关差异,该差异能证明相信火星人能感受情感而 AGI 不能是合理的。具体来说,需要识别出某种属性 F,使得 (i) F 是拥有任何情感能力的法则学必要条件(所以我们拥有 F),[9] (ii) 火星人拥有 F(所以它们能感受情感),但 (iii) AGI 缺乏 F(所以它们不能感受情感)。任何不满足条件 (i) 的 F 都是不相关的,任何不满足条件 (ii) 和 (iii) 的 F 都不是 AGI 与火星人之间的差异。

找到一个合适的 F 是困难的。一方面,F 不能是关于低层次物质构成的,否则它会将人类和火星人区分开来。[10] 另一方面,F 不能是关于高层次行为或功能能力的,否则它无法区分人类和 AGI(后者在行为和功能上可以与人类任意相似)。[11] 尽管存在这种困难,一些 F 的候选者值得考虑。

* F = 通过正确的因果历史被创造。 这种反对意见认为,虽然人类和火星人源于无目的的自然进化,但 AGI 是由人类为某种目的智能设计的。并且由于情感能力只能通过自然过程形成,因此 AGI 与火星人有相关差异。然而,这种反对意见不成立,因为人们不应认为只有由无目的过程创造的生物才能感受情感。假设我们发现我们仅仅是某个更高文明的行星实验的产物。虽然令人震惊,但这一发现不应使我们怀疑自己体验情感的能力。但即使进化被证明是情感能力所必需的,AGI 仍然可以通过进化算法被创造(从而拥有正确的进化历史)。[12] 因此,因果历史不是一个相关的差异。

* F = 在社会环境中成长。 这种反对意见诉诸我们的直觉,即在成长阶段的社会互动(与父母、长辈、同伴等)对于培养健全的情感能力至关重要。[13] 虽然人类和外星人通过此类互动在复杂的社会中被养育,但 AGI 缺乏这种社会发展的经验。我的回答是双重的。一方面,如果我们以弱意义解释“社会”,不要求社会互动涉及情感联系或投入,那么我认为 AGI 可以通过执行参与这些互动所必需的认知和行为任务而在社会环境中被“培养”。另一方面,如果我们以强意义解释“社会”,要求社会互动具有情感维度,那么我认为这种反对意见是在乞题,因为它已经在试图反驳 M 时假定了 M(机器能够体验情感)为假。[14] 无论哪种方式,这种反对意见都不成立。

最后,有人可能会反对,即使机器能够体验情感,它们也永远无法以与我们相同的方式体验情感。这是一个合理的担忧,因为情感所涉及的特定社会、功能和心理机制在生物系统和计算系统之间大概会有所不同。然而,请回想情感有三个方面,并且 AGI 可以在行为和意向维度上被设计得渐近地接近人类。例如,我们可以创造出与典型人类具有相同身体脆弱性、认知局限性和道德弱点的 AGI。当我们这样做时,鉴于在人类中观察到的情感方面的统一性,[15] 我们应该预期第三个现象学方面也会近似于人类。

结论

在本文中,我为 M 进行了论证,即机器能够像我们一样体验情感,前提是我们最终创造出一种复杂的、类似人类的机器,我称之为人工通用智能(AGI)。我的论证基于 AGI 与火星人之间的类比,后者是作为直觉泵的设定存在。[16] 具体来说,我论证道,如果我们遇到行为和功能像我们的火星人,我们应该相信它们能够感受情感。根据同样的道理,如果我们创造出在行为和功能上与我们足够相似的机器,我们也应该认为这些机器能够感受情感。因此,我的结论是,随着越来越类似人类的 AGI 的出现,机器能够像我们一样体验情感。

参考文献:

[1] Ruiz (2022).

[2] This argument is largely adapted from Brian Cutter’s argument from analogy for AI ensoulment (Cutter, Forthcoming).

[3] The particular resemblance may be abstract, since AGI, being machines, is based on computational architecture and inorganic substrate.

[4] Specifically, the most comprehensive survey of AI research found that the median credence in the creation of an AI that can outperform humans on every task by 2061 is 0.5 (Grace et al., 2018).

[5] Pace Vaidya (2024).

[6] Misselhorn et al. (2023).

[7] This modification allows us to make claims about phenomenal states without committing ourselves to a specific theory of consciousness. Cutter (Forthcoming) suggested this strategy.

[8] The multiple realizability of emotions across biochemical substrates is debated (Tahko, 2020). Those who deny non-carbon-based emotions usually do so on the grounds that non-carbon systems cannot exhibit certain behavioural-functional properties, which simply amounts to rejecting AGI. However, in this paper, I take the prospect of AGI for granted on expert testimonial evidence, so I will not engage with such objections.

[9] Or, more precisely, that F belongs to a set of properties S, and the nomologically necessary condition for emotions must contain some elements or combination of elements in S. This is because if a physical system lacks a property in S, it is prima facie less likely to experience emotions than a system with that property.

[10] Supposing that the property is not ad hoc.

[11] The structure of this part follows (Cutter, Forthcoming).

[12] See Gent (2020).

[13] For example, some psychopathologists argue that the acquisition of affective capacities requires “scaffolding,” or support, in the form of bodily, social, and material resources (Krueger, 2018).

[14] In other words, for this objection (so interpreted) to work, one must already have some independent reason to think that M is false, since the thought that AGI cannot engage in emotion-laden social interactions presumably gains its plausibility from the prior notion that AGI cannot feel emotions.

[15] For example, see Goffin and Viera (2024).

[16] See Dennett (2013).

(本文来自UHHC独立成员Kevin Zhang,他同时也是UHHC合作组织关注伦理与人类价值观的开放季刊《时代精神》Zeitgeist: An Open Quarterly for Ethics and Human Values 创始人,因此,本文在Zeitgeist网站(https://zeitgeistmag.org)上也可以被找到。本文由UHHC运营处Peter Tian编辑,图片来自网络,如有侵权我们将立刻删除。本文全部版权属于作者,如有侵权,UHHC和作者将追究到底。)