看清大模型本质,纾解“人工智能狂躁症” | 展卷

2025-04-20 16:00:05   阅览:434

【导语】在漫长的40亿年生命进化史中,心智从无到有,逐步发展。复旦大学哲学学院教授徐英瑾在《心智简史》一书中,以生物心智进化为镜,深刻剖析了当前AI大语言模型的局限性。他指出,大语言模型缺乏身体感知、生存意志和社会协作,与生物心智的进化逻辑相悖。本文基于徐英瑾教授的观点,探讨大语言模型与生物心智的差异,以及心智进化的三大原则,为AI狂热者开出“清醒剂”,也为哲学思考者提供新的视角。

大概40亿年前,生命从非生命中产生,物种开始进化。

10亿年后,目标从无目标中产生,心智之旅拉开帷幕。最终,这趟旅程将产生一种新型心智,它具有按照自身意愿来重塑宇宙的力量与性情。

复旦大学哲学学院教授徐英瑾借《心智简史》一书,以生物心智进化史为镜,犀利批判当前AI发展对大语言模型的“狂热”。

书中提炼心智三大原则:具身思维(身心合一,生存驱动)、团队协作(群体互动塑造个体智能)、大都市原则(模块协同进化催生新层级),直指大语言模型"无心"本质——其无身体感知、无生存意志、无社会协作的纯数据模式,实为"统计学平均的祛团队化产物",与生物心智层层递进的进化逻辑背道而驰。

《心智简史》这本书从源头对心智之旅进行回溯。

既为AI狂热者开出“清醒剂”,亦为哲学思考者架起连通黑格尔、柏格森等生命哲学与认知科学的桥梁。

撰文 | 徐英瑾(复旦大学哲学学院教授、博士生导师)

奥吉·奥加斯与赛·加达姆合著的这本《心智简史》是一本恰逢其时的好书。恰逢其时,说的是这本书正好能被用作一方解毒剂,以便用于对抗正弥漫于学界与业界的“人工智能狂躁症”。

这种“狂躁症”的“患者”一般坚信:只要不停地搜寻数据、购买图形处理器,并投入大量的人力与物力,通用人工智能的理想很快就能实现。这些“患者”甚至把已经投入的那些大语言模型视为通用人工智能的雏形:瞧,它们能像人一样与你交谈,安慰你的心灵;或者像秘书一样帮你规划行程,像家教老师一样帮助你的孩子完成数学作业……一部分“患者”由此陷入了恐慌:瞧,它们可能马上就要产生自己的意识,并接管我们人类了……好害怕啊……

治疗这些“患者”的第一步是让他们看看,大语言模型是否能为其做顿饭,或者更简单一点,泡一碗方便面。是的,大语言模型或许会告诉你怎么泡碗方便面,但是它自己不会泡。你得给它安装一个身体,但将抽象的规则变成准确的身体动作并不是那么简单,正如很多飞机设计师未必是优秀的飞行员一样。

至于治疗的第二步,则是让他们好好读读这本书。

这是一本用浅显易懂的语言,介绍心智在自然界中如何进化的科普书,涉及的物种从古菌、变形虫到苍蝇、青蛙、哺乳类,不一而足。很多人会问:此类知识,别的科普书也会涉及,这本书又有何新奇呢?

这本书的可贵之处是从更抽象的角度提出了心智运作的四个原则。而下面对前三个原则的重述已揉入了我自己的理解。

第一,具身思维原则

该原则换言之,心身不分离,有身才有心。身体的任务有两个:

1.通过感受器从环境获取与生存相关的信息。

2.通过执行器给出动作,解决特定问题。

心智,就是连接二者(zhě)的(de)关键。请(qǐng)注(zhù)意(yì),上(shàng)面(miàn)所(suǒ)说(shuō)的(de)“接(jiē)受(shòu)信(xìn)息(xi)”与(yǔ)“动作执行”,可不是当下大语言模型所从事的信息输入与信息输出,因为大语言模型的信息处理活动与生存无关,其输出也不指导其所在的物理硬件的位移。因此,按照具身思维原则,大语言模型是“无心”的。而富有讽刺意味的是,按照同一个原则,甚至连某些古菌也是“有心”的,因为这些细菌也有特定的细胞膜,以便确立“身体”与“环境”的边界,由此使得“生存意志”得以存在的第一个哲学前提本身得到确立——身体是有限的。

反之,无限的(de)身(shēn)体(tǐ)是不需要生存意志的,因为无限性就意味着在“我”之外的虚无,所以此种无限的“我”的存在是不需要一种“生存意志”来加以捍卫的。也正因为具有这种与“身”密切相关的“心”,古菌就是能“动”的,即为了觅食而能自主位移,并因此具备了向真正的“动物”演化的可能。

与之相比,貌似能够处理复杂文本的大语言模型却是不能“动”的,也因此与真正的“动物”差距甚远。再考虑到驱动一个古菌运动所需要的能量远少于一个常规大语言模型之能耗这一点,大语言模型是不是实现“机器之心”的明智选择,就更为可疑了。

第二,篮球比赛原则

该原则或许也可以被理解为“团队原则”。按照该原则,一个篮球运动员的心智不仅仅(jǐn)由(yóu)其(qí)脑(nǎo)壳(ké)里(lǐ)发(fā)生(shēng)的(de)事(shì)情(qíng)决(jué)定(dìng),更(gèng)是(shì)由(yóu)别(bié)的(de)篮(lán)球(qiú)运(yùn)动(dòng)员(yuán)的(de)现(xiàn)场(chǎng)表(biǎo)现(xiàn)与(yǔ)他(tā)本(běn)人(rén)的(de)当(dāng)下(xià)活(huó)动(dòng)共(gòng)同(tóng)构(gòu)成(chéng)。

说(shuō)得(de)俗(sú)一(yī)点(diǎn),即(jí)使(shǐ)是(shì)优(yōu)秀(xiù)的运动员,也会在赛场上被“猪队友”所害。需要注意的是,这里的“猪队友”可不是一个固定的标签,因为一个优秀的队友偶尔失常的表现,也会影响你当下心智的发挥。换言之,心智不仅仅是个体的事情,而且是群体的事情,否则我们就很难解释“孟母三迁”这个故事的合理性——孟母显然希望通过自主选择一个良好的社会微环境,使得该微环境中的团体智能得以协助孟子的个体智能的成长。

与之相较,使得大语言模型得以运作的语料来自对互联网上的海量数据的平均化,却无法针对微环境内的信息进行精妙的互动,遑论根据微环境内的信息变更随时调整“猪队友”的标签。大语言模型的行为模式貌似是对大量人类行为进行统计学平均后的产物,但恰恰是这种平均化导致了其“祛团队化”。

换言之,不同真实人类团队的问题处理语境与行动(dòng)目(mù)标(biāo)之(zhī)间(jiān)的(de)微(wēi)妙(miào)差(chà)异(yì),都(dōu)在(zài)这(zhè)种(zhǒng)平(píng)均(jūn)化(huà)机(jī)制(zhì)中(zhōng)被(bèi)消(xiāo)灭(miè)了(le)。作(zuò)为(wèi)这(zhè)种(zhǒng)消(xiāo)灭(miè)的(de)结(jié)果(guǒ),大(dà)语(yǔ)言模型很难在说一堆车轱辘废话之外,就个体的处境提出切中要害的建议,并由此为提高个体心智能力做出真正的贡献,正如经验丰富的篮球队长对其队员所做的那样。

大语言模型的平均化机制也顺便导致了《心智简史》提出的第三条心智原则难以在硅基基础上得到实现,除非大语言模型进路本身被其他更好的人工智能设计进路所取代。

第三,大都市原则

根(gēn)据(jù)该(gāi)原(yuán)则(zé),不(bù)同(tóng)的(de)心(xīn)智(zhì)组(zǔ)件(jiàn)的(de)聚(jù)集会(huì)自(zì)动(dòng)衍(yǎn)生(shēng)出(chū)新(xīn)的(de)心(xīn)智(zhì)处(chù)理(lǐ)层(céng)次(cì),由(yóu)此(cǐ)为(wèi)整(zhěng)个(gè)心(xīn)智(zhì)机(jī)器(qì)的(de)精(jīng)密(mì)化(huà)做(zuò)出(chū)贡(gòng)献(xiàn)。此过程正如大都市的形成:城市各个功能组件的良好运作与彼此配合,能够催生出新的城市服务模块,由此使得整座城市(shì)变(biàn)得(de)更(gèng)加繁荣。

但需要指出(chū)的(de)是(shì),按(àn)照(zhào)黑(hēi)格(gé)尔(ěr)在《法哲学原理》中提出的观点,复杂城市生活的构成(在他的文本里被说成是“市民社会”的构成)是基于“需要”原则的,也就是说,消防队的存在是因为城市需要消防队灭火来保证安全,而消防队员之所以愿意冒险干这份工作,也是因为这份工作本身带来的工资能够让他们自己在城市里生活下去。因此,都市生活就具有一种“我为人人且人人为我”的特征,而使得这一特征得以浮现的基础,恰恰是各个更小的城市组件自身的生存意志。

与之相较,使得目前的大语言模型得以运行的各种机制,无论是预训练模块、微调模块,还是记忆缓存模块,都是以一种与其自身的生存目的无关的方式被设置的。比如,之所以需要微调模块,是因为经由预训练模块产生的输出无法符合人类用户的期待,这一点与系统自身的生存无关。在这种情况下,我们就很难期待对于这些模块的设置能够像城市市场经济的勃发一样,以一种令人惊喜的方式自动实现模块分工的进一步细化。

需要指出的是,以上说的这些,绝不意味着我们无法在硅基基础上做出通用人工智能,而仅仅意味着:我们无法依赖主流的大语言模型的进路做出通用人工智能。毋宁说,只要遵循上述给出的三条心智原则,通用人工智能之路依然没有被封闭,因为上述三条原则的抽象性使得其自身(shēn)也具有了针对“硅基智能体”的延展性。当然,这三条原则本身依然需要一些细节来加以细化。而即使在讨论这些细节时,《心智简史》这本书也时时刻刻在暗示不同发展阶段的心智体运作原则的“可计算性”,并由此使得心智进化史本身就具备了引导通用人工智能研究的巨大参考意义。譬如:

· 你是否知道古菌的心智就具备了初步的记忆能力?

· 你是否知道水螅的心智就能进(jìn)行(xíng)多(duō)任(rèn)务(wu)处(chù)理(lǐ)?

· 你(nǐ)是(shì)否(fǒu)知道苍蝇就具有了初步的表征能力?

· 你是否知道对于空间位置模块的确定,需要晚到老鼠的心智阶段才能出现?

· 你是否知道要了解人脑的时间模块是如何运作的,你得先了解鸟脑的时间模块的运作方式?

对了,你是否知道人类的语言能力,要晚到这本书第20章才出现,就好比司马炎的名字只会在《三国演义》的末尾出现?好了,知道这一切后,你还会认为大语言模型绕开这20章之前的所有内容,直接模拟人类语言能力的做法,是一条靠谱的进路吗?

在本文的末尾,我还想发表一点感想。最近我曾听人工智能学界的一位资深学者说,在统计学进路的人工智能成为这个行当的名门正派之前,人工智能曾在“符号主义进路”中浪费了20年,而现在人工智能总算走上了“生物学模拟”的正道。我对他的这一判断有多重不赞同之处,而其中与本书内容特别相关的一条不赞同意见就是当下流行的大语言模型进路与生物学意义上的心智进化路线实在是毫不相关。

若硬是要说这一进路多少与生物学有关,主要是因为作为该进路之技术基础的人工神经元网络技术的确是对人脑机制的某种片面模仿。然而,这种模仿毕竟是片面的,因为它并没有涉及心智各个模块是如何在进化历程中以怎样的逻辑次序而被组合在一起的,而只能用还原主义的方式将一切平摊到神经元的层面上去看待。好吧,如果这种做法是正确的话,那么罗贯中先生就只好这样改写许攸投靠曹操后二人的对话了:

曹:许兄,袁绍在官渡作战的兵策究竟是怎样的?

许:丞相您看,他昨天神经元活动的动态图谱是这样的,这是小弟我的数学建模。他的词向量矩阵里的这些节点经常被激活,这里有一些有趣的统计学规律……

曹:但这究竟是啥意思?说人话。

许:得算,不过,这需要更多的图形处理器。对了,只有打败了袁绍,我们才能获得这些处理器。

曹:滚……

谨将此书献给一切“大语言模型痴迷症患者”,此类“患者”的职业包括但不限于科技投资人、IT从业者与各类媒体人。而对于有哲学基础的读者来说,我想说的是,虽然这不是一本哲学书,但是假若你事先涉猎过黑格尔、尼采、叔(shū)本(běn)华(huá)、柏(bǎi)格(gé)森(sēn)和(hé)西(xi)田(tián)几(jǐ)多(duō)郎的哲学思想的话,相信你能从中看到一些与他们的核心哲学观点相互印证的科学材料。

2025年2月19日于沪上寓所

本文的写作基于(至少)30亿年演化的人类心智,而非任何大语言模型。

特(tè) 别 提 示

1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。

2. 『返朴』提供按月检索文章功能。关注公众号,回(huí)复(fù)四(sì)位(wèi)数(shù)组(zǔ)成(chéng)的(de)年(nián)份(fèn)+月(yuè)份(fèn),如(rú)“1903”,可(kě)获(huò)取(qǔ)2019年(nián)3月(yuè)的(de)文章(zhāng)索(suǒ)引(yǐn),以(yǐ)此(cǐ)类(lèi)推(tuī)。