能预测一千种疾病的AI,会改变医学的未来吗?
2025-10-29 19:00:33 阅览:245
【导语】人一生健康状况动态变化,疾病间关联复杂,科学家一直寻求更早、更准预测疾病的方法。今年9月《自然》发表研究,展示名为Delphi-2M的AI模型,它基于GPT架构,能依个体情况预测超千种疾病未来风险。该模型虽在疾病预测领域潜力巨大,但目前尚处科研探索阶段,仍面临诸多挑战,未来(lái)走(zǒu)向(xiàng)值(zhí)得(de)关注(zhù)。
在(zài)人(rén)的(de)一(yī)生(shēng)中(zhōng),健(jiàn)康(kāng)状(zhuàng)况(kuàng)始(shǐ)终(zhōng)处(chù)于(yú)动(dòng)态(tài)变(biàn)化(huà)之(zhī)中(zhōng),并(bìng)且(qiě)许(xǔ)多(duō)疾(jí)病(bìng)之(zhī)间(jiān)也(yě)存(cún)在(zài)着(zhe)复(fù)杂(zá)的(de)关联(lián),比(bǐ)如(rú)慢(màn)性(xìng)病(bìng)常(cháng)常(cháng)伴随其他健康问题一起出现。这些健康变化和疾病发生与人的遗传特征、生活习惯以及所处的社会环境都有关系。科学家们一直在努力寻找方法,希望能更早、更准确地预测疾病的发展趋势,不仅帮助个人保持健康,也为公共卫生决策提供依据。
人工智能正在从语言、图像的理解领域,逐步进入医学预测的核心地带。今年9月,《自然》杂志发表了一项由德国癌症研究中心、欧洲分子生物学实验室和哥本哈根大学等机构合作完成的研究,展示了一个名为Delphi-2M的人工智能模型。该系统基于生成式预训练变换模型(GPT)架构,能够根据个体的健康记录、生活习惯和既往病史,预测超过一千种疾病在未来数年甚至数十年内的发生风险。

发表在《自然》上可预测疾病的AI模型(图片来源:参考文献[1])
AI如何学习疾病的时间规律
传统上,医生在诊断时往往关注当前的症状或某一类疾病,但事实上,健康是一条不断变化的时间线。很多疾病并不是突然出现的,它们之间存在复杂的先后关系——比如肥胖可能增加糖尿病的风险,而糖尿病又会影响心血管健康。
研究团队开发的Delphi-2M模型,尝试让人工智能去学习这种疾病的时间规律。它的原型来自GPT语言模型,也就是支撑聊天机器人的那种人工智能。GPT能通过分析句子中词语的前后关系,预测下一个词;而Delphi-2M则把这种逻辑迁移到医学领域——根据一个人的病史、体检结果和生活习惯,去预测他未来最可能出现的疾病以及大致的时间。

健康轨迹示意图(图片来源:参考文献[1])
为了训练这个模型,科学家使用了英国生物样本库的大规模数据,涵盖约40万人从年轻到老年的诊疗记录。这些数据包括上千种疾病,从感冒、哮喘到糖尿病、癌症,还有个人的性别、体重、吸烟饮酒等信息。模型学习的目标,是找到不同疾病之间的时间顺序与联系。
研究结果显示,Delphi-2M不仅能预测常见疾病的风险,准确度与现有的临床评估工具相当,甚至在某些疾病上更高;它还可以发现疾病之间的隐性关系,比如代谢问题可能与神经系统疾病的发生有关。更重要的是,它能基于一个人的健康记录,模拟未来20年的疾病变化趋势,为早期干预和预防提供参考。
潜在价值与现实挑战
Delphi-2M的研究成果展示了人工智能在疾病预测领域的潜在价值。它不仅能识别个体层面的健康风险,还能在群体尺度上推算未来的疾病负担。
研究团队利用模型模拟不同体重指数、吸烟与饮酒水平人群的(de)健(jiàn)康(kāng)轨(guǐ)迹(jī),结(jié)果(guǒ)显(xiǎn)示(shì)这(zhè)些(xiē)生(shēng)活(huó)方(fāng)式(shì)因(yīn)素(sù)与(yǔ)疾(jí)病(bìng)风(fēng)险(xiǎn)的(de)变(biàn)化(huà)趋(qū)势(shì)高(gāo)度(dù)一(yī)致(zhì),说(shuō)明(míng)模(mó)型(xíng)能(néng)够(gòu)反(fǎn)映(yìng)现(xiàn)实(shí)中(zhōng)的(de)流(liú)行(xíng)病(bìng)学(xué)规(guī)律(lǜ)。这(zhè)种能力使其有望成(chéng)为(wèi)公(gōng)共(gòng)卫(wèi)生(shēng)规(guī)划(huà)与(yǔ)资(zī)源(yuán)配(pèi)置(zhì)的(de)重(zhòng)要(yào)辅(fǔ)助(zhù)工(gōng)具(jù)。
在(zài)医(yī)学(xué)研(yán)究(jiū)层(céng)面(miàn),Delphi-2M提(tí)供(gōng)了(le)新(xīn)的(de)分(fēn)析(xī)维(wéi)度(dù)。通(tōng)过(guò)可(kě)解(jiě)释(shì)人(rén)工(gōng)智(zhì)能(néng)方(fāng)法(fǎ),研(yán)究(jiū)者(zhě)能(néng)够(gòu)追(zhuī)踪(zōng)不(bù)同疾病之间的时间依赖关系。例如,模型揭示出恶性肿瘤在诊断后的数年内仍显著提高死亡率,而败血症或急性心肌梗死的风险则会在短期内逐步下降。这种时间分层的风险评估,有助于改进疾病监测和随访策略。
然而,研究团队也明确指出该模型目前仍处于科研探索阶段。首先,训练数据的代表性不足可能导致偏差。英国生物样本库的参与者以中老年白人群体为(wèi)主,健(jiàn)康状况相对较好,模型在其他族群或社会经济群体中的适用性仍需验证。其次,模型的可解释性有限。虽然使用了可视化和因果权重分析方法,但其内部决策机制仍难以完全理解。最后,伦理与监管问题尚未解决。如何在保护隐私的同时利用健康预测结果,如何避免预测信息在保险或就业等场景中的误用,都是未来必须面对的关键议题。
总体来看,Delphi-2M展示了人工智能在医学预测与疾病建模中的前沿能力,但要真正进入临床与公共卫生实践,还需要在数据多样性、算法透明度与伦理监管方面建立更完善的体系。
结论
Delphi-2M的出现代表了人工智能在疾病预测领域的一次重要尝试。通过对数百万条健康数据的分析,它能够在个体和群体层面揭示疾病之间的时间规律和潜在联系。这种以全生命周期为视角的健康建模,为未来的精准预防、早(zǎo)期(qī)筛(shāi)查(chá)和(hé)医(yī)疗(liáo)资(zī)源(yuán)规(guī)划(huà)提(tí)供(gōng)了(le)新(xīn)的(de)思路。
但研究者也强调,任何预测模型都不能取代临床判断。Delphi-2M目前仍需更多人群验证和长期随访数据来完善性能。在医疗体系真正采用此类技术之前,如何保证数据的公平性、透明性与安全性,是必须解决的问题。
参考文献:
[1] Shmatko, Artem, et al. "Learning the natural history of human disease with generative transformers." Nature (2025): 1-9.
[2] Zhu, Zhihong, et al. "Causal associations between risk factors and common diseases inferred from GWAS summary data." Nature communications 9.1 (2018): 224.
[3] Kraljevic, Zeljko, et al. "Large Language Models for Medical Forecasting--Foresight 2." arXiv preprint arXiv:2412.10848 (2024).
策划制作
作者丨张玮杰 中国科学院大学博士;杨超 中国科普作家协会
审核丨邵文亚 福建医科大学副教授
