全国科技工作者日 | 仰望星空的“AI巨脑”:中国科研者在路上

2025-05-30 12:00:05   阅览:397

【导语】在智能助手和AI生成技术日益普及的今天,大语言模型作为人工智能领域的最前沿技术之一,正深刻改变着我们的生活。从ChatGPT到文心一言,这些“超级语言大脑”背后,凝聚着成千上万名中国科研工作者的智慧与汗水(shuǐ)。他(tā)们(men)在算力受限、生态不完整的条件下,从零开始,自主研发出属于中国自己的AI语言大脑。本文将带您(nín)深(shēn)入(rù)了(le)解(jiě)大(dà)语(yǔ)言模型的炼成之路、国产大模型的破局挑战、动人的科研者故事,以及AI如何融入中国语言和文化。在第九个“全国科技工作者日”之际(jì),让(ràng)我(wǒ)们(men)向(xiàng)这(zhè)些(xiē)默(mò)默(mò)奉(fèng)献(xiàn)的(de)科(kē)技(jì)工(gōng)作(zuò)者(zhě)致(zhì)敬(jìng)。

“你(nǐ)好(hǎo),我(wǒ)是(shì)你(nǐ)的(de)智(zhì)能(néng)助(zhù)手(shǒu),请(qǐng)问(wèn)有(yǒu)什(shén)么(me)可(kě)以(yǐ)帮(bāng)您(nín)?”

也(yě)许(xǔ)你(nǐ)早(zǎo)已(yǐ)习(xí)惯(guàn)了(le)和(hé)智(zhì)能(néng)手(shǒu)机(jī)、客(kè)服(fú)机(jī)器(qì)人(rén)“对(duì)话(huà)”的(de)场(chǎng)景(jǐng);也(yě)许(xǔ)你(nǐ)用(yòng)过(guò)ChatGPT、文心(xīn)一(yī)言(yán)这(zhè)样(yàng)的(de)AI生(shēng)成(chéng)文字(zì)、翻(fān)译(yì)、写(xiě)代(dài)码(mǎ)。它(tā)们(men)背(bèi)后(hòu)的(de)核(hé)心(xīn)技(jì)术(shù),叫(jiào)做(zuò)大(dà)语(yǔ)言(yán)模(mó)型(xíng)。这(zhè)是(shì)当(dāng)今(jīn)人(rén)工智能最前沿的代表之一——能读、能写、能答题,甚至能“讲故事”,像一个永不疲倦的智慧图书馆。

图片来源:百度文心一言首(shǒu)页(yè)

而(ér)你(nǐ)或(huò)许(xǔ)不(bù)知(zhī)道(dào),在(zài)它(tā)们(men)顺(shùn)畅(chàng)回(huí)应(yīng)你(nǐ)的(de)那(nà)一(yī)刻(kè),藏(cáng)着(zhe)成(chéng)千(qiān)上(shàng)万(wàn)名中(zhōng)国(guó)科(kē)研(yán)工(gōng)作(zuò)者(zhě)夜(yè)以(yǐ)继(jì)日(rì)的(de)努(nǔ)力(lì)。他(tā)们(men)在(zài)没(méi)有(yǒu)顶(dǐng)级(jí)算(suàn)力(lì)、没(méi)有(yǒu)完(wán)整(zhěng)生(shēng)态(tài)的(de)条(tiáo)件(jiàn)下(xià),从(cóng)零(líng)构(gòu)建(jiàn)出(chū)属(shǔ)于(yú)中(zhōng)国(guó)自(zì)己(jǐ)的(de)“AI语(yǔ)言(yán)大(dà)脑(nǎo)”,用(yòng)技(jì)术(shù)和(hé)汗(hàn)水(shuǐ)书(shū)写(xiě)下(xià)这(zhè)个(gè)时(shí)代(dài)的(de)科(kē)技(jì)答(dá)卷(juǎn)。

1、超(chāo)级(jí)“语(yǔ)言(yán)大(dà)脑(nǎo)”是(shì)如(rú)何(hé)炼(liàn)成(chéng)的(de)?

所(suǒ)谓(wèi)“大语言模型”,指的是一种通过学习大量文本数据,从而具备语言理解与生成能力的人工智能(néng)系(xì)统(tǒng)。它(tā)不是真正“懂”语言,而是通过庞大的参数和复杂的训练机制,让机器学会了“预测下一个词”。这个过程,需要成百上千亿级的模型参数、千万本书的总信息量、数周甚至数月的训练时间。

比如ChatGPT,背后是OpenAI花费数亿美元、使用几千张高端GPU显卡和超大语料训(xun)练出的成果。而在中国,自主研发出拥有数百亿甚至千亿参数的语言模型,是科研者面对的一场“硬仗”。

2、国产大模型,破局之路走得很难

研发大语言模型,最难的不是“写代码”,而是“通盘突破”:

01语料难

中文的语言结构更复杂、歧义性更强,公开高质量中文语料少。科研者不得不从网页、书籍、论文、论坛中手动清洗出语料,还要过滤“低质文本”和“敏感内容”。一个模型的训练语料,往往需要上百人投入数月筛选处理。

02算力紧

大模型训练是资源密集型工程。以千亿参数模型为例,动辄需要数千张GPU服务器支持,而在芯片领域,我国受制于供应链“卡脖子”。于是科研者用“模型压缩”“并行调度”等方式做减法,用最少的资源跑出最好的效果。

03对标高

ChatGPT带来的震撼让世界意识到:谁掌握了大模型,谁就能在人工智能时代的中占据重要地位。中国必须有自己的AI底座,自己的语言理解系统。为此,“悟道”“ChatGLM”“文心一言”“天书”“百川”“DeepSeek”等国产大模型接连问世。

根据国家互联网信息办公室最新披露的数据显示,截至2025年4月,已成功通过备案的人工智能大模型数量达到了346家——从通用模型,到金融、医疗、教育等行业专用模型,这背后,是无数科研团队昼夜鏖战的成果。

3、那些让人动容的科研者故事

2023年,天数智芯的天垓100国产GPU加速卡迎来了一场硬仗——为北京智源研究院训练70亿参数的Aquila语言模型提供算力支持。面对国产GPU与国际顶尖产品的性能差距,天数智芯产品线总裁邹翾带领团队展开了一场技术攻坚战。他们日夜兼程,重构IXCCL通信库,优化混合精度训练方案,硬是将多卡通信效率提升至98%,最终实现了连续19天的稳定训练。当Aquila语言模型如期完成训练并达到预期效果时,这支团队用行动证明:在算力自主化的道路上,中国人的创新精神永远不会被硬件条件所限制。

图源:pexels

在高校、研究所、企业、实验室,从“算法调优”到“数据治理”,从“推理优化”到“模型压缩”,每一个细节都凝聚着无数人沉默却坚定的努力。他们或许不在镜头前,不在热门话题里,却正是AI革命的无名英雄。

4、把AI写进中国语言和文化

“我们希望让AI用中文思考。”这是很多国产大模型团队的共同目标。

不仅仅是翻译得通顺,更要理解中国语言的语境,理解我们的典故、成语、对联、诗词,甚至是“一个眼神”的情感含义。科研者正在将这些“文化基因”注入AI中。

有人用模型进行古文翻译,有人训练AI生成中医问(wèn)诊(zhěn)语(yǔ)言,还有人尝试用AI保护濒危方言。AI不是替代人类,而是服务社会、传承文明的新工具。大语言模型正逐渐从科研实验室走进医疗、教育、司法、工业、文旅等多个领域,为人类解决实际问题,也为中国讲好自己的故事提供了新的载体。

5、写在“全国科技工作者

2025年5月30日,是第九个“全国科技工作者日”。我们将目光投向那些或许无名却做着意义非凡的事情的科技工作者,他们在国产AI道路上,仰望星空,脚踏实地。

在大模型这场没有硝烟的科技竞赛中,他们不仅是工程师,更是文化守望者,是时代的记录者。他们用代码构筑语言的秩序,用数据打造理解的基石,用算法塑造思维的逻辑。

他们是这个时代最可敬的人之一。

致敬中国每一位科技工作者,向你们说一(yī)声(shēng):节(jié)日(rì)快(kuài)乐(lè),未(wèi)来(lái)可(kě)期(qī)。

供(gōng)稿(gǎo)单(dān)位(wèi):重(zhòng)庆(qìng)理(lǐ)工(gōng)大(dà)学(xué)计(jì)算(suàn)机(jī)科(kē)学(xué)与(yǔ)工(gōng)程(chéng)学(xué)院(yuàn)

作(zuò)者(zhě):重(zhòng)庆(qìng)理(lǐ)工(gōng)大(dà)学(xué) 张(zhāng)佳雯

审核专家:倪伟

声明:除原创内容及特别说明之外,部分图片来源网络,非商业用途,仅作为科普传播素材,版权归原(yuán)作(zuò)者(zhě)所(suǒ)有(yǒu),若有侵权,请联系删除。