AI赋能新药研发需破解临床试验难点

 医药网6月22日讯 虽然基因组学、蛋白质组学、生物信息学等现代分子生物学科的发展为药物研发理论带来了长足进步,但由于药物分子在人体发生生化反应的复杂性,新药研发并没有摆脱经验主义色彩。
 
  传统的药物研发以药化专家为主导,通常情况下,药化专家根据经验每提出5000~10000种化合物做药物筛选,最终只有1种化合物能通过临床测试并最终上市。据《Nature》(英国自然出版集团旗下周刊)统计,一款新药从研发到获批上市,平均需要10~15年时间,耗费约26亿美元,但临床成功率不到10%。研发周期长、成本高、成功率低已经成为新药研发的“三座大山”。AI技术在自然语言处理、图像识别、深度学习和认知计算等方面的优势可应用到新药研发的各个环节。据估算,从靶点确定到临床候选药物环节,通过AI辅助计算的方法,可以把传统研发方法需要的时间从3~6年压缩到1~2年,从而大幅提升效率并节省成本。
 
  因此,AI+新药研发成为当前药学研究和前沿医学创业的热点。据统计,2020年全球AI+新药研发领域的投资已经超过18.3亿美元,是2015年投资额的5.4倍。
 
  AI在临床试验环节应用不足
 
  药物研发有十余个环节,但受限于数据可获得性等方面的因素,AI目前只能应用于少数环节。据统计,近10年来,AI在新药研发领域的应用主要集中在药物发现阶段,占比超过2/3,为66例(见图),例如靶点及生物标记物的选择与确定、先导化合物的确定、构效关系的研究与活性化合物的筛选、先导化合物的优化、候选药物的选定等环节。而在临床试验阶段,例如药物依从性、预测治疗结果、数据分析、病理研究、疾病诊断等场景的AI应用不足1/4。
 
 
  实际上,临床试验阶段的效率提升或成本降低对新药研发投入的影响要远超过药物发现阶段。据英国剑桥大学化学系分子信息研究中心Andreas Bender博士测算,在临床试验阶段,降低试验失败率带来的收益是提升药物发现速度或降低成本的2~5倍。但如前所述,AI应用主要集中在药物发现环节,在该环节的应用节省的新药研发成本非常有限。在临床试验环节的应用,特别是通过AI降低临床试验失败率才是其最大用武之地。
 
  Andreas Bender模拟了通过AI技术手段加速药物发现速度、降低成本和提升全流程各环节成功率(提升质量)的三种情况(假设AI对速度、成本和阶段成功率的改进皆为20%)对一个成功推向市场的新药在成本方面的影响,得出以下结论:提高成功率(特别是在所有临床阶段)对整个研发项目价值的影响最大,远远超出了提高各自阶段的研发速度和降低成本带来的收益。
 
  生物学复杂性限制AI应用
 
  AI应用集中于药物发现环节,是因为该环节以化学过程为主,研究人员对候选化合物数据的完整性及可重复性、化学稳定性、理论认知度等都有较好的把握,有利于AI建模。
 
  但临床试验阶段是以生物学过程为主,其复杂性在数据和AI建模两方面都带来巨大挑战。在数据方面,需要将临床数据加以结构化处理,而诸如病历、随访记录目前还很难标准化、数字化;由于涉及患者隐私,目前尚无能充分保障数据安全的有效措施,这也限制了临床数据的灵活运用。因此,目前行业内还严重缺乏真实可信、覆盖临床各环节的完整临床数据库。在AI建模方面,化合物与人体靶点的反应过程非常复杂,目前理论认知不足,受环境因素影响很大,数据稳定性和可重复性差,不利于AI建模,对疗效和安全性的影响也难以把控。当前AI药物研发模型通常是从简出发,很少一开始就考虑生物学的复杂性,因而常常在临床测试时遭遇失败。这种简化的AI模型仅在单因果疾病的情况下才是有效的,例如某病毒感染人体,需要复制某种蛋白酶或者受体才能进入细胞,基于这类单一靶点有效并已经产生了很多获批上市药物。但是,大多数疾病难以靠单一靶点调控进行有效修复,导致许多基于单一靶点的药物在临床试验中失败。此外,AI系统中往往会简化模型而忽视其他问题,例如化合物是否到达其预期的靶点,是否能够治疗疾病的某种表型,以及它的副作用是否在可接受范围内等。
 
  AI系统要取得成功,需要建立明确的“化合物-靶点-表型”联系。虽然近年来出现了一些更具临床相关性的模型(其中部分模型是针对特定患者群体的),对未来药物的发现具有积极意义,但现阶段可用AI进行挖掘的数据相对较少。此外,一个模型越针对特定患者人群,其通用性越差,这就需要生成足够多的数据才能具有实用价值,这也是AI应用于新药研发所面临的巨大挑战。
 
  总之,受限于生物学的复杂性和临床数据库的缺乏,AI在药物研发领域的应用主要集中在前端药物发现环节,但这为药物研发带来的收益相对有限。未来,只有临床数据极大丰富完善,在“化合物-靶点-表型”三者之间建立更明确的药理关系,AI更多应用到临床试验环节,才能对新药研发产生真正的推动作用。