写在DeepSeek爆火之后：AI发展得如此之快，未来会越来越快吗？

2025-03-16 08:31:25 阅览：475

出品：

作者：王琛（中国科学院计算技术研究所在读博士）

监制：中国科普博览

编者按：为展现智能科技动态，前沿科技项目推出“人工智能”系列文章，一窥人工智能前沿进展，回应种种关切与好奇。让我们(men)共(gòng)同探究，迎接智能时代。

最近，DeepSeek作为AI界一位“新顶流”，凭借强大的功能在社交媒体上引发热议(yì)。有(yǒu)人(rén)说(shuō)它(tā)是(shì)未(wèi)来(lái)的(de)生(shēng)产(chǎn)力(lì)工(gōng)具(jù)，有(yǒu)人(rén)好(hǎo)奇(qí)它(tā)能(néng)为(wèi)生(shēng)活(huó)带(dài)来(lái)哪(nǎ)些(xiē)改(gǎi)变(biàn)，也(yě)有(yǒu)人(rén)担(dān)心(xīn)它(tā)会(huì)抢(qiǎng)走(zǒu)自(zì)己(jǐ)的(de)饭(fàn)碗(wǎn)……

为(wèi)了(le)让大家更加了解这个备受关注的智能帮手，我们邀请了中国科学院计算技术研究所在读博士王琛，用10个问题全面解答关于DeepSeek的核心原理、使用技巧以及未来趋势等疑问。无论是AI小白还是科技达人，这篇文章都能为你答疑解惑！让我们一起看看，这个“智能帮手”能否成为我们生活中的真正伙伴吧！

DeepSeek在春节期间受到全球的关注，现在许多平台都表示已经接入DeepSeek大模型，它究竟是什么？

DeepSeek是一家位于杭州的人工智能初创公司，由幻方量化联合创始人梁文峰于2023年7月创立，专注于大语言模型的研发。

在(zài)春(chūn)节(jié)前(qián)，DeepSeek相(xiāng)继(jì)发(fā)布(bù)了(le)两(liǎng)款(kuǎn)同(tóng)名的(de)开(kāi)源(yuán)大(dà)语(yǔ)言(yán)模(mó)型(xíng)：DeepSeek-V3（2024年(nián)12月26日）和DeepSeek-R1（2025年(nián)1月(yuè)20日(rì)）。它(tā)们(men)的(de)性(xìng)能(néng)可(kě)以(yǐ)与(yǔ)OpenAI的闭源模型GPT-4o和o1等其它大语言模型相媲美，且成本明显低于其它模型。

DeepSeek-V3模型旨在提供高性价比的服务，能够快速地响应用户的需求，满足自然语言处理、问答翻译、内容生成等日常任务的需求。DeepSeek-R1模型专注于(yú)复(fù)杂(zá)的(de)推(tuī)理(lǐ)任(rèn)务(wu)，特(tè)别(bié)是(shì)在(zài)数(shù)学(xué)问(wèn)题(tí)、代(dài)码(mǎ)生(shēng)成(chéng)、逻(luó)辑(ji)推(tuī)理(lǐ)等(děng)领(lǐng)域具(jù)有(yǒu)更(gèng)强(qiáng)的(de)能(néng)力(lì)，但(dàn)响(xiǎng)应(yīng)时(shí)间(jiān)也(yě)相(xiāng)对(duì)较(jiào)长(zhǎng)。

DeepSeek为(wèi)什(shén)么(me)会(huì)受(shòu)到(dào)如(rú)此(cǐ)大(dà)的(de)关注(zhù)？

DeepSeek-V3和(hé)DeepSeek-R1在(zài)春(chūn)节(jié)前(qián)发(fā)布(bù)后(hòu)，凭(píng)借(jiè)其(qí)与(yǔ)OpenAI为(wèi)首(shǒu)的(de)顶(dǐng)尖(jiān)大(dà)模型相当的性能以及低廉的训练成本和推理费用，迅速引发了全球的广泛关注。DeepSeek的高性价比挑战了美国大模型的垄断地位，它的推出使得更多企业和用户能够以更低的价格体验到最先进的AI成果。

DeepSeek开源了其技术细节和模型权重，使得更多人能够利用其成果进行创新和研发。与此同时，DeepSeek还免费开放了在线服务，吸引了大量用户体验，形成了前所未有的热潮。在DeepSeek-R1正式发布7天后，DeepSeek超越ChatGPT登上了AppStore免费应用下载排行榜的榜首。DeepSeek的成功标志着中国在AI领域的重大进展，提升了中国在全球AI技术竞争中的地位。目前，多个企业和高校已经开始自主部署DeepSeek模型，进一步证明了它的广泛应用潜力。

它为什么能用这么低的(de)成(chéng)本(běn)、这(zhè)么(me)有(yǒu)限的算法实现这么强大的能力？是只在中文表达上强大，还是各种性能都还不错？

DeepSeek能够以较低的训练成本实现强大的能力，主要得益于DeepSeek长期以来在模型架构和算法层面的持续创新。

具体来说，DeepSeek通过使用混合专家架构（MoE）和多头潜在注意力（MLA）等技术有效降低了推理成本。同时，借助数据蒸馏、分布式训练优化、以及硬件层面的精细调优，DeepSeek进一步提升了资源利用率，从而降低了训练成本。多种创新的优化技术的融合使得DeepSeek在仅拥有较低的训练和(hé)推(tuī)理(lǐ)成(chéng)本(běn)的(de)同(tóng)时(shí)，能(néng)够(gòu)提(tí)供(gōng)强(qiáng)大(dà)的(de)性(xìng)能(néng)。

在(zài)中(zhōng)文的(de)理(lǐ)解(jiě)和(hé)应(yīng)用(yòng)方(fāng)面(miàn)，DeepSeek有(yǒu)着突出的表现，它不仅能够理解古文，创作诗词，还能准确掌握时下流行的网络用语。而相比之下，ChatGPT的中文虽然语法通顺，却显得较为生硬。不过，DeepSeek的强大能力并不仅限于中文表达，在官方公布的多项标准评测中，DeepSeek在英文、百科知识、长文本、代码、数学能力等领域均达到了顶尖水平。

DeepSeek在不同领域的性能表现

（图片来源：参考资料2）

在AI的范畴内，使用中文是否代表着更高的效率？

在AI领域，“效率”更高往往意味着处理速度更快，或者理解的准确性更高，或者生成的内容质量更好。

首先，中文和英文在结构上有很多不同。中(zhōng)文是表意文字，一个字可以表达很多意思，而英文是字母文字，每个单词由多个字母组成。中文相比英文在表达上更简洁、高效，信息密度更高。在表达相同的意思时，中文往往能更简洁地传达内(nèi)容(róng)。因此在AI领域，使用中文可以提高表达效率，进而降低成本。

但同时，中文多样的语义和复杂的语法结构也对AI的理解能力提出了挑战。比如，在中文中，“花”可以是植物，也可以是花费，这可能让AI在理解上下文时更难。而英文虽然也有同义词和多义词的问题，但结构上可能更清晰一些。所以，处理中文的时候，AI需要更多的上下文信息来准确理解意思。

此外，数据量和模型的设计与优化也应当纳入考虑范围。如果AI模型在训练时使用了大量的中文数据，那么它可能在处理中文任务时表现更好。反过来，如果数据主要来自英文或者其他语言，那么AI在处理这些语言的时候效率可能会更高。某些模型可能是专门为某种语言而设计的，在这种情况下，在该语言上的效率自然就会更高。

关于中文在AI领域是否具有显著(zhe)的(de)优(yōu)势(shì)，目前尚无定论(lùn)，未(wèi)来(lái)如(rú)何(hé)挖(wā)掘(jué)中(zhōng)文的(de)潜(qián)在(zài)优(yōu)势(shì)可(kě)能(néng)将(jiāng)成(chéng)为(wèi)重(zhòng)要(yào)的(de)研(yán)究(jiū)方(fāng)向(xiàng)。

为(wèi)什(shén)么(me)在(zài)回(huí)答(dá)用(yòng)户(hù)问(wèn)题(tí)的(de)时(shí)候(hou)，DeepSeek可(kě)以(yǐ)展(zhǎn)示(shì)其(qí)“深(shēn)度思考过程”？

DeepSeek-R1在回答用户问题时可以展示其深度思考过程是因为它使用了思维链（Chain of Thought, CoT）技术。思维链技术模仿人类的思考方式，它要求模型将复杂任务分解成简单步骤然后再逐步解决，从而增强模型在复杂推理任务中的能力。

OpenAI的o系列模型也使用了思维链技术，但OpenAI并未向用户公开模型的原始思维链，而是仅提供了一个思维链的总结。而DeepSeek-R1作为开源模型，则完全开放了思维(wéi)链(liàn)，用户可以清晰地看到模型在解决问题时的全部推理过程。

ChatGPT与DeepSeek分别有哪些特点？它们是否代表AI大模型以后的两种发展方向，还是会融合发展？

ChatGPT基于OpenAI的GPT系列模型，使用了大量多语言数据进行训练，支持多语言、多模态，能够跨语言和跨领域提供服务。作为闭源模型，它由OpenAI为用户提供在线服务。

DeepSeek则在中文领域进行了优化，拥有较低的训练和推理成本。DeepSeek是开源模型，用户可以根据需要自行部署并进行定制化修改。目前它们的技术架构和市场定位都有所不同，但随着技术的发展，未来可(kě)能(néng)会(huì)出(chū)现(xiàn)更(gèng)多相互借鉴融合的趋势，例如DeepSeek可能会借鉴ChatGPT的多模态能力，ChatGPT也可能会优化其本地化服务以应对DeepSeek等竞争对手的挑战。

DeepSeek发布的是开源模型，开源以后，后面应当如何保持领先？

DeepSeek的创始人梁文锋表示，现在的生成式人工智能并不是终点，未来的目标是朝着实现通用人工智能迈进。在AI技术快速发展的当下，大家都没有碾压对手的技术优势，即使闭源也无法阻止被别人赶超。为了应对这一挑战，他们希望将价值沉淀在团队的成长之中，通过持续的创新来保持领先。开源的决策正是基于这一考量，开源可以打破技术垄断，降低技术门槛，激发更广泛的技术合作与创新。开源能够吸引更多的开发者共同参与贡献，构建一个开放与多元化的技术发展环境。DeepSeek希望通过这种方式推动技术的长远发展，保持领先地位，成为AI技术的引领者。

打开使用页面，有“深度思考（R1）”和“联网搜索”选项，二者在使用上有何区别？如何能更好地使用这种推理型大模型？

打开深度思考（R1）选项后，后台会切换到DeepSeek-R1模型，这个模型专注于需要复杂推理的场景，如数学或编程方面的问题。它能够展示详细的思维过程，提供推理步骤与最终结果。

联网搜索选项则允许模型获取实时互联网搜索的结果，适用于时效性较强、需要获取最新信息的问题，模型可以根据搜索结果提供实时更新的答案。

在使用深度思考（R1）功能时，在提问中用户无需额外引导模型进行思考，只需要明确表达自己的需求，避免模糊不清的表述，以便模型更好地理解并提供准确的答案。在深度思考模式下，除了模型的最终答案外，用户还可以关注模型给出的思考过程(chéng)，从(cóng)而(ér)更(gèng)好(hǎo)地(de)掌(zhǎng)握(wò)解(jiě)决(jué)问(wèn)题(tí)的(de)详(xiáng)细(xì)方(fāng)法(fǎ)。

哪(nǎ)些(xiē)领(lǐng)域的(de)工(gōng)作(zuò)受(shòu)到(dào)DeepSeek的(de)可(kě)能(néng)冲(chōng)击(jī)最(zuì)大(dà)，甚(shén)至(zhì)能(néng)被(bèi)取(qǔ)代(dài)？

DeepSeek等(děng)大(dà)语(yǔ)言(yán)模(mó)型(xíng)可(kě)能(néng)会(huì)对(duì)那(nà)些(xiē)依(yī)赖(lài)信(xìn)息(xi)检(jiǎn)索(suǒ)、数(shù)据(jù)分(fēn)析(xī)、重(zhòng)复(fù)性(xìng)高(gāo)且(qiě)目(mù)标(biāo)明(míng)确(què)的(de)行(xíng)业(yè)产(chǎn)生(shēng)冲(chōng)击(jī)。例(lì)如(rú)内(nèi)容(róng)创(chuàng)作(zuò)、数(shù)据(jù)处(chù)理(lǐ)、翻(fān)译(yì)校(xiào)对(duì)、人(rén)工(gōng)客(kè)服(fú)、人(rén)力(lì)资(zī)源(yuán)管(guǎn)理(lǐ)和(hé)财(cái)务(wu)审(shěn)计(jì)等(děng)领(lǐng)域，可(kě)能(néng)会(huì)被(bèi)自(zì)动(dòng)化(huà)的(de)AI技(jì)术(shù)所(suǒ)替(tì)代(dài)。AI可(kě)以(yǐ)高(gāo)效(xiào)地完成用户需求的任务，从而减少对人工的依赖。

然而，对于一些需要创造性、情感智力和人际沟通的工作来说，人工的参与仍然不可或缺。在AI技术飞速发展的当下，人们需要不断提升这些难以被AI轻易替代的能力。这些能力可以帮助个人在职场中保持竞争力，确保在未来的工作环境中，人与AI能实现更好的协作和互补，共同推动社会进步。

AI发展的速度怎么这么快？会越来越快吗？

AI在过去几年中迅速发展，这得益于多个因素的推动。

首先，计算能力的大幅提升，尤其是GPU等硬件技术的发展，使得AI模型能够处理更大规模的数据，训练出更复杂的模型，从而提升了整体性能。

其次，互联网技术的飞速发展为AI训练提供了丰富的数据库。同时，深度学习领域算法架构的突破，也使得AI的能力不断增强。近年来，科技公司和投资者纷纷看到了AI的潜力，并在资金和技术上给予了大力支持，这些因素共同促进了AI技术的飞跃发展。

虽然许多专家认为AI将在未来继续快速发展，但是否能够保持当前的速度仍然存在不确定性。乐观者认为，AI的进步将会呈现指数爆炸的趋势，随着AI智能的增长，AI迭代的速度将会越来越快，最终完全超越人类。然而，算力和数据可能会成为制约AI技术发展的瓶颈，大型模型的训练需要越来越多的算力，而计算能力的发展目前已经不足以完全满足AI训练的需求。同时，人类现有的数据在未来几年内可能会被耗尽。

未来AI技术如何突破算力和数据的瓶颈，继续飞速发展，仍然需要全世界科研人员的共同努力。此外，AI可能引发的伦理、法律与社会问题也逐渐引起了人们的担忧，一些科学家已经呼吁暂停开发更强大的AI系统，直至人们可以确保其安全性和可控性。

参考资料：

1.https://en.wikipedia.org/wiki/DeepSeek

2.https://api-docs.deepseek.com/zh-cn/news/news1226

3.https://api-docs.deepseek.com/zh-cn/news/news250120

4.Liu, A., Feng, B., Xue, B., Wang, B., Wu, B., Lu, C., ... & Piao, Y. (2024). Deepseek-v3 technical report. arXiv preprint arXiv:2412.19437.

5.Guo, D., Yang, D., Zhang, H., Song, J., Zhang, R., Xu, R., ... & He, Y. (2025). Deepseek-r1: Incentivizing reasoning capability in llms via reinforcement learning. arXiv preprint arXiv:2501.12948.