AI还在一本正经地“胡说八道”？它可能被“投毒”了

2025-08-09 08:30:09 阅览：326

【导语】人工智能（AI）时不时“一本正经地胡说八道”让人恼火？这可能是AI训练数据被“投毒”所致。近日，国家安全部发布安全提示，指出AI训练(liàn)数(shù)据(jù)存在良莠不齐问题，虚假信息和偏见性观点导致的数据“污染”给AI安全带来挑战。专家呼吁加强数据监管，提高数据质量，同时提醒公众日常使用AI时应持谨慎态度，避免因AI错误导致严重后果。

还在为人工智能（AI）时不时“一本正经地胡说八道”恼火？

或许，你的AI被“投毒”了。8月5日，国家安全部发布安全提示，AI训练数据存在良莠不齐的问题，虚假信息、虚构内容和偏见性观点导致的数据“污染”，给AI安全带来挑战。

“训练数据之于AI，就像教科书之于学生。”中国科学院计算技术研究所工程师刘延嘉将AI比喻成勤奋好学的学生，“AI正是通过学习文本、图像、行为等数据构建认知模型，形成对世界的(de)理(lǐ)解(jiě)与(yǔ)判(pàn)断(duàn)能(néng)力(lì)。若(ruò)教(jiào)科(kē)书(shū)内(nèi)容(róng)存(cún)在(zài)错(cuò)误(wù)或(huò)偏(piān)见(jiàn)，学(xué)生(shēng)的(de)知(zhī)识(shi)体(tǐ)系(xì)必(bì)然(rán)扭(niǔ)曲(qū)。”

研(yán)究(jiū)显(xiǎn)示(shì)，当(dāng)训(xun)练(liàn)数(shù)据(jù)中(zhōng)仅(jǐn)有(yǒu)0.01%的(de)虚(xū)假(jiǎ)文本(běn)时(shí)，AI模(mó)型(xíng)输(shū)出(chū)的(de)有(yǒu)害(hài)内(nèi)容(róng)会(huì)增加11.2%；即使是0.001%的虚假文本，有害输出也会上升7.2%。“训练数据的细微瑕疵，也可能导致AI输出错误、偏见甚至危险的结果。”刘延嘉说。

AI的训练数据为何会被“污染”？

“数据被污染的情况较复杂，既有人为故意‘数据投毒’的可能，也可能因数据收集、整理过程缺乏严格规范和审核所致。”同盾人工智能研究院执行院长董纪伟说，受到数据污染的AI生成的虚假内容，可能成为后续AI训练的数据源，形成具有延续(xù)性(xìng)的(de)“污(wū)染(rǎn)遗(yí)留(liú)效(xiào)应(yīng)”。

董(dǒng)纪(jì)伟(wěi)认(rèn)为(wèi)，“数(shù)据(jù)放(fàng)大(dà)效(xiào)应(yīng)”或(huò)是(shì)更(gèng)大(dà)的(de)隐(yǐn)性(xìng)风(fēng)险(xiǎn)，“AI可(kě)能(néng)通(tōng)过(guò)算(suàn)法(fǎ)强(qiáng)化(huà)，将(jiāng)数(shù)据(jù)中(zhōng)的(de)一(yī)些(xiē)偏(piān)见(jiàn)演(yǎn)变(biàn)为(wèi)系(xì)统(tǒng)性(xìng)偏(piān)见(jiàn)，并(bìng)在(zài)输(shū)出(chū)时(shí)将(jiāng)其(qí)奉(fèng)为(wèi)‘真理’。”

如今，网上AI生成内容数量已(yǐ)超(chāo)过(guò)人(rén)类(lèi)生产的真实内容，大量低质量及非客观数据充斥其中。“当AI训练数据中的错误信息逐代累积，必然会扭曲AI本身的认知能力。”董纪伟提醒。

“毒”数据对AI输出的影响，远不止“一本正经地胡说八道”这么简单，往往还具有“隐性但致命”特征。试想，当“涉毒”AI广泛应用于日常，人们可能因AI的错误诊断延误治疗；投资者可能被AI推荐的虚假高收益项目欺骗；汽车可能因AI的错误导航而迷失方向……

这样的AI，谁敢放心用？

目前，《生成式人工智能服务管理暂行办法》和新版《数据安全法》已经将AI训练数据纳入监管。但专家认为，要从技术层面解决AI训练数据污染问题，还有待AI开发者在数据筛选验证机制、数据实时监测和数据溯源等方(fāng)面(miàn)付(fù)出(chū)更(gèng)多努力。正如中国工程院院士邬贺铨所言：“AI的安全边界，最终取决于数据的质量底线。”

面对并不完美的AI，我们又该如何应对？

董纪伟建议，日常使用AI时应持谨慎态度，如果AI给出的回答涉及重要决策，务必向专业人士核实。“当然，也可用多个AI工具对同一问题进行询问，通过对比答案来判断AI的可靠性。若发现AI频繁给出不合理或错误回答，可直接更换AI工具。”

（科普时报记者陈杰）