新闻中心
News center
高分SCI解读|临床试验知识图谱
来源: | 作者: | 发布时间: 653天前 | 1267 次浏览 | 分享到:

 


 


今天为大家介绍的是一篇发表在nature computational science上,关于临床试验知识图谱的高分SCI文章。

·概述·

  有效和成功的临床试验是开发新药和推进新疗法的关键。然而临床试验非常昂贵,且很容易失败。临床试验的高成本和低成功率促使研究从现有的临床试验中推断知识,以创新的方式设计未来的临床试验。文中展示了了一个公开可用的临床试验知识图,称为CTKG。CTKG包括代表临床试验中的医疗实体的节点(如研究、药物和条件),以及代表这些实体之间关系的边(如研究中使用的药物)。文中的嵌入分析显示了CTKG在各种应用中的潜在效用,如药物再利用和相似性搜索等。

·背景·

  临床试验是一种旨在确定干预、治疗或研究药物对人体的安全性和有效性的研究。有效和成功的临床试验是开发新药物和推进新疗法的关键。知识图(KG)是一种图表,其中信息实体被表示为节点,它们的关系被编码为连接相应节点的边。建立临床试验数据的KG对推进临床试验的分析和研究至关重要。文中介绍了称为临床试验知识图谱(CTKG),并将CTKG发布给研究界,以促进使用临床试验数据的高级研究。CTKG包括表示医学实体(如研究、药物和条件)的节点和表示这些实体之间关系(如研究中使用的药物)。CTKG包括更多的医学实体(如不良事件和结果)以及这些实体之间的关系。在临床试验中,CTKG丰富的信息可以在生物医学中有更多应用(如药物不良事件预测、结果预测)。图1展示了CTKG的模式。

图(1)


  目前CTKG是科学研究界第一个公开的临床试验知识图谱。对CTKG的嵌入分析结果表明,它在药物再利用和相似度搜索等方面具有潜在的应用价值。

·方法·

  CTKG嵌入了丰富的文本信息(如标题和描述)和异构数据类型(如数值、分类和文本数据)作为节点属性,这鼓励了更广泛的研究范围(如深度图嵌入、链接预测)和更复杂的方法来开发利用这些信息来更好地进行转化临床试验设计。图2展示了CTKG的发展概况。

图(2)

CTKG模式

  该模式展示了临床试验中涉及的不同信息实体,用节点表示,它们之间的关系用边表示。CTKG中有18种节点和21种边。每个节点和边类型都有描述节点和边属性的属性。不同节点和边的统计情况分别见表1和表2。

表(1)

表(2)

CTKG节点

   每个研究节点代表一个临床试验,并作为节点属性与该临床试验的主要属性相关联。。每个药物术语节点代表临床试验中使用的药物,并通过提取的药物来识别。每个结果节点代表一个用于评估临床试验中干预措施有效性的结果指标,并以结果指标的名称和描述作为属性。每个结果节点都连接到一个研究节点,表示该特定结果在研究中使用。每个组节点代表一个研究分支或一个比较组,即一组接受特定干预的参与者。组节点类型有以下几种:

1.事件组节点

  每个事件组节点所描述的信息是组内受特定类型不良事件影响的参与者数量。每个事件组节点与多个药物节点相连,每个不良事件节点还连接到一个器官系统节点,代表受影响的器官系统。

2.基准组节点

  每个基线组节点代表一组具有人口统计学属性或研究特定属性的参与者。每个基线组节点连接到一个或多个基线记录节点。

3. drop-group节点

  每个下拉组节点代表一组参与者及其退出信息。每个drop-record节点包含一个退出原因,并记录在一段时间内因该原因退出的群组参与者的数量。

4.outcome-group节点

  结果组节点有研究干预对参与者的有效性的信息。采用不同的疗效指标评价疗效,并采用不同的统计检验方法对疗效进行分析。其他与干预措施有效性措施相关的节点如下:

①节点的方法。每个方法节点代表一种统计假设检验方法。

②结果测评节点。每个结果测量节点代表了对相应参与者组的特定结果测量。

③结果分析节点。每个结果分析节点都表示通过使用统计检验方法对多个结果组进行比较,对某一具体结果指标进行统计分析。

  在一项研究中,不同类型的组节点可以代表具有不同信息的同一参与者组。因此使用不同类型的组节点来代表不同类型的临床试验信息。

·应用·

  文中进行嵌入分析来评估CTKG的质量,并展示了它在各种重要应用中的效用。

CTKG用于药物再利用

本文评估了CTKG在药物再利用中的效用,特别评估了条件节点嵌入和药物-术语节点嵌入之间的高度相似性是否表明相应的药物在治疗该条件方面具有很高的潜力。为进行评估,文中计算了所有状态节点和药物-术语节点之间的余弦相似度,并确定了最相似的10对。发现其中5对具有文献证明的潜在可重用性的证据,如表3所示。

表(3)

CTKG用于类似的医学实体检索

  在本分析中评估了CTKG是否能够为类似的医学实体检索任务提供高质量的节点嵌入。尤其关注相似研究的检索,以及相似条件、药物、不良事件和结果的检索。

CTKG可以支持类似研究的检索

  为证明这一点,首先确定最相似的5对研究节点的嵌入。在每一对识别的研究中,随机选择一个研究节点,并识别其最相似的5个研究节点。表4列出了所选的研究节点及其最相似的前5个研究节点。

表(4)

  如表4所示,所确定的类似研究都调查了类似的药物或条件这些结果表明,CTKG在检索类似研究方面具有一定的实用价值,为新的临床试验设计提供了依据。

类似的医学概念检索

  CTKG还可以支持其他类似医学概念的检索。文中确定了前10对最相似的状态节点、药物-术语节点、不良事件节点和标准结果节点,分别如表5、6、7和8所示,利用其嵌入的余弦相似性。如表5所示,确定的类似条件节点都有一些共性。

表(5)

表(6)

表(7)

表(8)

CTKG用于其他应用

  CTKG还可以实现其他潜在的应用,如药物不良事件预测和结果预测等。

  对于药物不良事件的预测,可以对CTKG采用知识推理方法,利用已有的或预测的路径从CTKG中的药物项节点到不良事件节点,推断出新的药物不良事件。

  在结果预测方面,可以利用链接预测方法在CTKG中已有的研究节点和结果节点之间的新边推断。

  总的来说CTKG可以促进新的知识发现,有利于新的临床试验的设计,也可以提高未来临床试验的成功率。

·临床实验数据·

CTKG的临床试验数据来自AACT数据库。文中选择所有有药物干预、条件和结果分析的研究纳入CTKG。排除没有药物干预的研究、没有结果分析的研究、没有条件的研究,得到了8210项CTKG研究。没有考虑非药物发明的临床试验,如物理疗法、行为疗法或医疗设备。表9总结了CTKG中包括和不包括的AACT表。

表(9)

·展望·

  目前,CTKG只包括药物干预和报告结果的研究。然而不完整的研究(例如,未开始的研究或未报告结果的研究)和没有药物干预的研究(例如,医疗设备的研究)也可能包含对未来临床试验设计的宝贵知识。因此在未来的研究中,将通过更多的研究来丰富CTKG。

  此外,目前的CTKG并没有包含药物发现和开发的所有重要信息。例如,CTKG不存在药物/分子和蛋白质/疾病之间的相互作用,也不存在蛋白质之间的相互作用。缺乏这些信息可能会限制CTKG在更广泛应用方面的潜力(例如,预测一种疾病的新分子是否能从临床试验中存活下来)。在未来的研究中将把CTKG与其他知识库结合起来,并将更多和多样化的信息整合到CTKG中,使更多的应用能够使用CTKG。