能预测一千种疾病的AI，会改变医学的未来吗？

2025-10-29 19:00:33 阅览：245

【导语】人一生健康状况动态变化，疾病间关联复杂，科学家一直寻求更早、更准预测疾病的方法。今年9月《自然》发表研究，展示名为Delphi-2M的AI模型，它基于GPT架构，能依个体情况预测超千种疾病未来风险。该模型虽在疾病预测领域潜力巨大，但目前尚处科研探索阶段，仍面临诸多挑战，未来(lái)走(zǒu)向(xiàng)值(zhí)得(de)关注(zhù)。

在(zài)人(rén)的(de)一(yī)生(shēng)中(zhōng)，健(jiàn)康(kāng)状(zhuàng)况(kuàng)始(shǐ)终(zhōng)处(chù)于(yú)动(dòng)态(tài)变(biàn)化(huà)之(zhī)中(zhōng)，并(bìng)且(qiě)许(xǔ)多(duō)疾(jí)病(bìng)之(zhī)间(jiān)也(yě)存(cún)在(zài)着(zhe)复(fù)杂(zá)的(de)关联(lián)，比(bǐ)如(rú)慢(màn)性(xìng)病(bìng)常(cháng)常(cháng)伴随其他健康问题一起出现。这些健康变化和疾病发生与人的遗传特征、生活习惯以及所处的社会环境都有关系。科学家们一直在努力寻找方法，希望能更早、更准确地预测疾病的发展趋势，不仅帮助个人保持健康，也为公共卫生决策提供依据。

人工智能正在从语言、图像的理解领域，逐步进入医学预测的核心地带。今年9月，《自然》杂志发表了一项由德国癌症研究中心、欧洲分子生物学实验室和哥本哈根大学等机构合作完成的研究，展示了一个名为Delphi-2M的人工智能模型。该系统基于生成式预训练变换模型（GPT）架构，能够根据个体的健康记录、生活习惯和既往病史，预测超过一千种疾病在未来数年甚至数十年内的发生风险。

发表在《自然》上可预测疾病的AI模型（图片来源：参考文献[1]）

AI如何学习疾病的时间规律

传统上，医生在诊断时往往关注当前的症状或某一类疾病，但事实上，健康是一条不断变化的时间线。很多疾病并不是突然出现的，它们之间存在复杂的先后关系——比如肥胖可能增加糖尿病的风险，而糖尿病又会影响心血管健康。

研究团队开发的Delphi-2M模型，尝试让人工智能去学习这种疾病的时间规律。它的原型来自GPT语言模型，也就是支撑聊天机器人的那种人工智能。GPT能通过分析句子中词语的前后关系，预测下一个词；而Delphi-2M则把这种逻辑迁移到医学领域——根据一个人的病史、体检结果和生活习惯，去预测他未来最可能出现的疾病以及大致的时间。

健康轨迹示意图（图片来源：参考文献[1]）

为了训练这个模型，科学家使用了英国生物样本库的大规模数据，涵盖约40万人从年轻到老年的诊疗记录。这些数据包括上千种疾病，从感冒、哮喘到糖尿病、癌症，还有个人的性别、体重、吸烟饮酒等信息。模型学习的目标，是找到不同疾病之间的时间顺序与联系。

研究结果显示，Delphi-2M不仅能预测常见疾病的风险，准确度与现有的临床评估工具相当，甚至在某些疾病上更高；它还可以发现疾病之间的隐性关系，比如代谢问题可能与神经系统疾病的发生有关。更重要的是，它能基于一个人的健康记录，模拟未来20年的疾病变化趋势，为早期干预和预防提供参考。

潜在价值与现实挑战

Delphi-2M的研究成果展示了人工智能在疾病预测领域的潜在价值。它不仅能识别个体层面的健康风险，还能在群体尺度上推算未来的疾病负担。

研究团队利用模型模拟不同体重指数、吸烟与饮酒水平人群的(de)健(jiàn)康(kāng)轨(guǐ)迹(jī)，结(jié)果(guǒ)显(xiǎn)示(shì)这(zhè)些(xiē)生(shēng)活(huó)方(fāng)式(shì)因(yīn)素(sù)与(yǔ)疾(jí)病(bìng)风(fēng)险(xiǎn)的(de)变(biàn)化(huà)趋(qū)势(shì)高(gāo)度(dù)一(yī)致(zhì)，说(shuō)明(míng)模(mó)型(xíng)能(néng)够(gòu)反(fǎn)映(yìng)现(xiàn)实(shí)中(zhōng)的(de)流(liú)行(xíng)病(bìng)学(xué)规(guī)律(lǜ)。这(zhè)种能力使其有望成(chéng)为(wèi)公(gōng)共(gòng)卫(wèi)生(shēng)规(guī)划(huà)与(yǔ)资(zī)源(yuán)配(pèi)置(zhì)的(de)重(zhòng)要(yào)辅(fǔ)助(zhù)工(gōng)具(jù)。

在(zài)医(yī)学(xué)研(yán)究(jiū)层(céng)面(miàn)，Delphi-2M提(tí)供(gōng)了(le)新(xīn)的(de)分(fēn)析(xī)维(wéi)度(dù)。通(tōng)过(guò)可(kě)解(jiě)释(shì)人(rén)工(gōng)智(zhì)能(néng)方(fāng)法(fǎ)，研(yán)究(jiū)者(zhě)能(néng)够(gòu)追(zhuī)踪(zōng)不(bù)同疾病之间的时间依赖关系。例如，模型揭示出恶性肿瘤在诊断后的数年内仍显著提高死亡率，而败血症或急性心肌梗死的风险则会在短期内逐步下降。这种时间分层的风险评估，有助于改进疾病监测和随访策略。

然而，研究团队也明确指出该模型目前仍处于科研探索阶段。首先，训练数据的代表性不足可能导致偏差。英国生物样本库的参与者以中老年白人群体为(wèi)主，健(jiàn)康状况相对较好，模型在其他族群或社会经济群体中的适用性仍需验证。其次，模型的可解释性有限。虽然使用了可视化和因果权重分析方法，但其内部决策机制仍难以完全理解。最后，伦理与监管问题尚未解决。如何在保护隐私的同时利用健康预测结果，如何避免预测信息在保险或就业等场景中的误用，都是未来必须面对的关键议题。

总体来看，Delphi-2M展示了人工智能在医学预测与疾病建模中的前沿能力，但要真正进入临床与公共卫生实践，还需要在数据多样性、算法透明度与伦理监管方面建立更完善的体系。

结论

Delphi-2M的出现代表了人工智能在疾病预测领域的一次重要尝试。通过对数百万条健康数据的分析，它能够在个体和群体层面揭示疾病之间的时间规律和潜在联系。这种以全生命周期为视角的健康建模，为未来的精准预防、早(zǎo)期(qī)筛(shāi)查(chá)和(hé)医(yī)疗(liáo)资(zī)源(yuán)规(guī)划(huà)提(tí)供(gōng)了(le)新(xīn)的(de)思路。

但研究者也强调，任何预测模型都不能取代临床判断。Delphi-2M目前仍需更多人群验证和长期随访数据来完善性能。在医疗体系真正采用此类技术之前，如何保证数据的公平性、透明性与安全性，是必须解决的问题。

参考文献：

[1] Shmatko, Artem, et al. "Learning the natural history of human disease with generative transformers." Nature (2025): 1-9.

[2] Zhu, Zhihong, et al. "Causal associations between risk factors and common diseases inferred from GWAS summary data." Nature communications 9.1 (2018): 224.

[3] Kraljevic, Zeljko, et al. "Large Language Models for Medical Forecasting--Foresight 2." arXiv preprint arXiv:2412.10848 (2024).

策划制作

作者丨张玮杰中国科学院大学博士；杨超中国科普作家协会

审核丨邵文亚福建医科大学副教授