能像人类一样“理解”事物！中国科学家首次证实→

2025-06-11 11:01:28 阅览：386

【导语】近日，中国科学院自动化研究所的科研人员首次证实，多模态大语言模型在训练中能自行“理解”事物，且方式与人类相似。这一突破性发现不仅为探索AI的“思考”机制开辟了新途径，也为构建具备人类般理解能力的AI系统奠定了基础。相关研究成果已发表于《自然·机器智能》杂志，揭示了AI的“心智维度”与人类存在共通之处，展示了AI在理解现实世界概念上的非随机性进步。

记者10日从中国科学院自动化研究所获悉，来(lái)自(zì)该(gāi)所(suǒ)等(děng)单(dān)位(wèi)的(de)科(kē)研(yán)人(rén)员(yuán)首(shǒu)次(cì)证(zhèng)实(shí)，多(duō)模(mó)态(tài)大(dà)语(yǔ)言(yán)模(mó)型(xíng)在(zài)训(xun)练(liàn)过(guò)程(chéng)中(zhōng)自(zì)己(jǐ)学(xué)会(huì)了(le)“理(lǐ)解(jiě)”事(shì)物(wù)，而(ér)且(qiě)这种理解方式和人类非常类似。
这一发现为探索人工智能如何“思考”开辟了新路，也为未来打造像人类一样“理解”世界的人工智能系统打下了基础。相关研究成果在线发表于《自然·机器智能》杂志。

核心发现：AI的“心智维度”与人类殊途同归

研究人员从海量大模型行为数据中提取出66个“心智维度”，并为这些维度赋予了语义标签。研究发现，这些维度是高度可解释的，且与大脑类别选择区域（如处理面孔的FFA、处理场景的PPA、处理躯体的EBA）的神经活动模式显著相关。

研究还对比了多个模型在行为选择模式上与人类的一致性（Human consistency）。结果显示，多模态大模型（如 Gemini_Pro_Vision、Qwen2_VL）在一致性方面表现更优。此外，研究还揭示了人类在做决策时更倾向于结合视觉特征和语义信息进行判断，而大模型则倾向于依赖语义标签和抽象概念。本研究表明大语言模型并非“随机鹦鹉”，其内部存在着类似人类对现实世界概念的理解。