影像组学是一种从标准医学影像图像中高通量挖掘定量图像特征的技术,能够在临床决策支持系统中提取和应用数据,以提高诊断、预后和预测的准确性,在癌症研究中变得越来越重要。影像组学分析利用先进的图像分析方法,快速训练和验证医学成像数据,基于医学图像的特征进行精确诊断和治疗,为现代医学提供了强大的工具。在此,我们综述了影像组学的流程、它的局限、挑战、机遇,以及它改善临床决策的能力,强调了它对癌症患者的效用。目前,由于影像组学领域的快速发展,该领域缺乏对大量已发表影像组学研究的科学完整性和临床相关性的标准化评估。为了使影像组学成为一门成熟的学科,需要制定严格的评估标准和报告指南。在此,我们为研究提供指南,以满足影像组学研究领域的这一迫切需求。

成像是医学科学中的一项重要技术,在临床实践中用于辅助决策。然而,医学影像的作用正在迅速发展,从最初的诊断工具,发展到在个性化精准医疗环境下的核心作用。在影像组学中,与肿瘤病理生理学相关信息的数字医学图像被转换为可挖掘的高维数据。这些信息可以通过定量图像分析进一步挖掘,并通过临床决策支持系统(CDSS)加以利用,以辅助医疗决策。影像组学方法建立在数十年的计算机辅助诊断、预后和治疗研究的基础上。影像组学实现的流程包括识别数字图像中大量的定量特征,将此类数据存储在数据库(即,多个独立数据库作为一个实体运行的系统)中,以及随后挖掘数据以进行特征提取和应用。现在,可以使用高通量计算从CT、MR和或PET等医学图像中提取无数定量特征。创建连接获得的数百万患者影像组学数据(理想情况下与所有其他相关数据一起)的数据库,将形成巨大的快速学习医疗保健(RLHC)网络,但存在相当大的数据管理障碍。

影像组学并不是临床决策的唯一决定因素。影像组学特征(如强度、形状、纹理或小波)提供了关于癌症表型以及肿瘤微环境的信息,这些信息与其他相关数据源(包括临床获得的、治疗相关的或基因组数据)不同且互补。当影像组学数据与其他相关数据相结合,并与结果数据相关联和/或推断时,可以产生准确可靠的临床决策系统(CDSS)。

影像组学技术改善CDSS的潜力是毋庸置疑的,该领域正在迅速发展。主要的挑战是以定量的方式对多模态数据源进行优化收集和集成,以提供明确的临床预测,从而准确、可靠地进行结果预测。许多已发表的预测模型可以解释与疾病和治疗相关的因素,但这些模型缺乏对其性能、再现性和/或临床效用的标准化评估。因此,这些模型不适用CDSS。

在本文中,我们描述了影像组学的流程以及该领域的最新发展。重点介绍了影像组学在改进个性化精确肿瘤学CDSS(临床决策支持系统)方面存在的局限、挑战和机遇,并强调了影像组学预测模型开发和验证的方法学。我们探索先进和创新的信息技术,这些技术对于不同多模式数据源的数据管理至关重要。最后,我们提供了必要步骤的建议,以确保影像组学和CDSS的持续发展和广泛接受。本文发表在Nature Reviews Clinical Oncology杂志。

影像组学工作流程

影像组学方法被定义为定量映射,即提取与预测目标相关的许多医学图像特征如临床和基因组特征并建模分析。影像组学研究可分为五个阶段:数据选择、医学成像、特征提取、探索性分析和建模(图1)。为了评估影像组学研究的质量,我们提出了影像组学质量评分(RQS)。

数据选择

影像组学分析首先选择成像方案、感兴趣区域的体积(VOI)和预测目标——希望预测的事件。通常,对整个原发肿瘤进行分析,并将其与治疗结果(如生存率)的可用数据联系起来。影像组学可以在肿瘤感兴趣区、转移病灶以及正常组织中应用。对这些区域的分析可能会产生辐射敏感性,这对治疗计划方案产生影响。然而,影像组学分析并不局限于影像治疗,可以应用于临床环境中生成的任何图像(图2)。

影像组学:医学影像学与个性化精准医疗的桥梁-编程之家

图1:描述影像组学实现流程图和RQS应用的流程图。

该流程包括影像组学分析中的必要步骤。RQS对研究方法和分析进行评分,从而鼓励最佳科学实践。RSQ,影像质量评分;VOI,感兴趣区。

影像组学:医学影像学与个性化精准医疗的桥梁-编程之家

图2,心脏的影像组学

目前,量化CT上可见冠状动脉钙化的金标准是“阿加斯顿”法(基于强度和体积)。放射学特征可以改善量化,区分钙化和非钙化斑块,从而预测主要不良心脏事件(MACE)。

使用标准化成像协议能够消除不必要的混杂变异性;然而,非标准的成像协议很常见。因此,再现性和可比性可以通过广泛统一标准化成像协议实现。我们希望强调这一点,并提供在未来的影像组学研究中应如何报告协议的示例。

医学图像

分割:感兴趣区可以通过手动或半自动分割实现。这种分割决定了要分析图像中的哪些体素,因此,分割的可变性可能会在评估衍生的影像特征时引入偏差。多重分割是一种避免这种偏差程度的方法。能够实现稳健特征的方法包括:由多名临床医生进行评估、用噪声干扰分割、多种算法的组合,或使用呼吸周期的不同阶段。关键因素是考虑如何进行分割,以及影像组学分析对不同分割方法的敏感性。例如,半自动分割方法可以产生不同于手动分割的影像特征。

体模研究

在影像组学研究中,考虑扫描仪之间和供应商之间的特征可变性非常重要。在影像组学研究依赖于来自多个扫描仪的数据的情况下,忽略这种可变性可能会影响研究分析结果——也就是说,如果在不同的扫描仪上获取新数据,基于影像组学训练的预测模型可能无法在外部数据集上充分执行。由于在多个设备上扫描的患者数据稀少,且存在不确定性(如器官运动或不同的成像协议),因此体模研究是衡量这些不确定性并确定不同供应商特点的合适方法。实质上,体模研究提供了一种风险缓解策略,有助于从当前的临床成像场景到理想的最佳成像场景。

在多个时间点成像

影响影像组学特征变化的其他来源是器官运动或靶体积的扩大或缩小。强烈依赖于这些因素的影像组学特征具有有限的适用性。为了解释这些可变性的来源,可以利用测试-再测试数据来评估影像组学特征的稳定性。例如,在一小段时间内从患者队列中获取的两组图像数据集。

特征选择

影像组学的本质是高通量提取定量图像特征来表征感兴趣区域(VOI)。特征值取决于图像预处理(例如,滤波或强度离散化)和重建(例如,滤波反投影或迭代重建)等因素。此外,应用的特征提取算法在特征命名、数学定义、方法和软件实现方面存在差异。为了促进影像特征的互操作性,必须阐明术语、算法、软件实现以及其他方法方面的差异。

探索性分析

影像性和非影像性特征应与预测目标相结合,以创建单个数据集。这种方法可以评估特征之间的关系。通过聚类可以识别出一组高度相关的影像组学特征,这些特征可以简化为每个聚类的单一类型特征。与常规临床特征(如肿瘤分期)密切相关的影像特征不能提供额外信息。从多个分割、多个成像和模型研究中收集的辅助特征数据可用于评估特征稳健性。可以识别易变或稳健的特征,并随后将其排除在模型构建之外。例如,对于预测给定数据集的肺癌总生存率(即,以特定方式成像和分割)而言,稳健的特征对于预测给定数据集的肺癌肺炎(以其他方式成像和分割)而言可能是不稳定的。因此,应该清楚地描述特征降维和选择的过程。

模型构建

影像建模涉及三个主要方面:特征选择、建模方法和验证。特征选择应该是数据驱动的,因为感兴趣区内可能存在大量的影像组学特征;此类分析应以稳健和公开的方式进行。为了实现模型的完整性,还应纳入影像组学以外的特征(如来自临床记录的数据、治疗期间获得的数据、生物和/或基因数据)。关于建模方法的选择,为影像应用确定最佳的机器学习方法是迈向稳定和临床相关CDSS(临床决策支持系统)的关键一步;因此,在理想情况下,应采用多种机器学习方法,并应全面记录建模情况。一个未经验证的模型是没有意义的,验证是完整影像组学分析不可或缺的组成部分。模型必须经过内部验证,最好是经过外部验证。

特征选择

根据滤波器的数量、特征类别和其他可调参数,可以从图像中提取的影像特征的数量几乎是无限的。在模型中包含所有可能的特征将不可避免地导致过度拟合,这将危及之前未评估的患者的模型性能。为了避免过度拟合,应消除对可变性源缺乏鲁棒性的特征,并通过降维技术(如主成分分析或聚类)选择原型特征。例如,对于预测给定数据集(以特定方式成像和分割)肺癌患者的总体生存率而言,某个典型特征对于预测给定数据集(以其他方式成像和分割)肺癌患者的肺炎可能是多余的。

建模方法

选择的建模方法通常是一种单一技术,根据研究人员的偏好和经验进行选择。不同的技术具有不同的固有局限性,包括logistic回归中特征的独立性假设、贝叶斯网络中特征离散化的需要,或深度学习中的网络配置依赖性。建模方法的选择已被证明会影响影像生物学中的预测性能。因此,多种建模方法的实现是可取的,但不是必要的。选择建模方法的关键在于,报告时,方法必须完全可复制。理想情况下,可以通过提供软件代码(例如,通过github)来实现这一目标。

模型验证

验证技术是评估模型性能的有用工具,因此,必须进行内部和/或最好是外部验证。研究人员必须评估该模型是否对目标患者群体具有预测性,还是仅对分析的特定样本子集具有预测性。模型性能通常通过显著性分析和校准来衡量。可以根据受试者工作特性(ROC)曲线或ROC曲线下的面积(AUC)评估。AUC量化了模型的敏感性和特异性,并表示预测模型为符合结果的随机选择患者分配该结果的概率,其事件概率大于不符合结果的随机选择患者。校准是指观测结果和模型预测之间的一致性,通常基于预测分组。例如,预测根据高、中或低概率进行分组。如果高概率组中肿瘤复发的平均预测值为25%,则该组中观察到的肿瘤复发频率理想情况下应为100名患者中有25名。可以使用校准图报告校准结果。衡量整体表现的一个指标是Brier分数,即均方预测误差。有效的模型应显示训练集和验证集之间的统计一致性。Bootstrapping方法可用于估计上述统计数据的置信区间,并应予以报告。外部验证的模型比内部验证的模型更可靠,因为使用前一种方法获得的数据被认为更独立,这加强了验证。

公开科学数据的获取

验证是模型在科学界和临床界被接受的第一步。对结果进行独立验证是必要的额外步骤。重复意味着独立研究人员使用相同的技术、相同的数据集和/或患者队列重复分析,验证结果,确保分析无误。重现意味着独立研究人员使用相同的技术和不同的(但经过适当选择的)数据集和或患者队列重复分析,对结果进行独立验证,目的是更有力地肯定这一发现。影像组学研究涉及多个复杂的子过程(如数据选择、图像采集、特征提取或建模),每个子过程都受到广泛决策、使用非标准术语、建立参数和软件选择的影响。如果研究人员不公开这些复杂之处,影像组学的再现性和可复制性是不可能的。必要信息的数量远远超过了传统手稿的限制。我们建议未来的发表成果,包括研究结果,应提供以下补充材料:成像协议、分析扫描、VOI的分割、特征提取的详细说明(包括公式),以及所使用的建模方法(理想情况下,代码)。为了便于复制和再现,需要这种程度的严谨性。此外,还提供多个radiomics软件包,以及这些软件包的更新或版本控制。我们认识到,公布来自患者的数据可能并非在所有情况下都可行。作为一种最低限度的比较手段,并为了缓解这种缺乏透明度的情况,我们建议研究人员公布在本手稿补充材料中描述的数字模型上计算出的研究特征的数值。

为了比较不同软件实现影像组学特征提取的算法,我们举了一个例子,其中CT获得的四名肺癌患者的原发肿瘤区域和相应肿瘤轮廓的数据作为“真实”数字模型(图3)。利用预处理后的图像数据,我们计算了一组常用的特征,以作为特征数据集参考。

影像组学:医学影像学与个性化精准医疗的桥梁-编程之家

图3,影像组学体模数据

a,数字体模CT图像的代表性图像,肿瘤轮廓显示为绿色。

b,肿瘤区域的3D渲染。

影像组学质量评分

随着影像组学的发展,迫切需要同质的评估标准和报告指南,以使影像医学发展成为一个领域。我们提出了影像组学质量评分(RQS),以帮助评估过去和未来的影像组学研究。

编辑、评审员和读者应该能够确定一项影像研究是否符合最佳实践程序,或者研究人员是否有充分理由证明不符合指南。出版物应明确说明该研究如何通过明确需求来推进影像医学领域。关于鲁棒性和普遍性的过于乐观的说法会削弱科学和临床影响,应该避免。研究期刊应广泛报告研究设计、方案、详细的质量保证过程和标准操作程序。尽管影像组学的细微技术的细节令人乏味,但它们可以极大地影响稳健性、普遍性和混淆meta分析。严格的报告指南对于影像组学方法的成熟是必要的。

RQS(影像组学质量评分)的标准

大量证据表明,预测模型研究的研究报告质量目前很差。预测模型的各个方面都需要完整、清晰的报告,以最大限度地减少偏差,提高预测模型的实用性。一个很好的例子是个体预后或诊断多变量预测模型(TRIPOD)倡议的公开报告。在该倡议中,建立了一套建议,用于报告开发、验证或更新预测模型的研究,无论该模型是否用于诊断或预测目的。我们在特定于影像组学的背景下模拟了这种方法,并建议应通过RQS对研究进行评估,为此我们确定了16个关键组成部分;根据表1中详细说明的各个部分的重要性,每个环节都分配了若干点。

影像组学:医学影像学与个性化精准医疗的桥梁-编程之家

影像组学的潜力

自本世纪初以来,影像组学研究取得了显著进展,揭示了这一学科在大幅改善临床护理方面的潜力(表2)。硬件和软件的进步使组织病理生理学的临床可行性定量成像得以实现。

表2 影像组学实践

影像组学:医学影像学与个性化精准医疗的桥梁-编程之家

影像组学:医学影像学与个性化精准医疗的桥梁-编程之家

影像基因组学

影像基因组学与两个密切相关但又截然不同的科学问题有关:一个是研究种系基因型变异与影像治疗后观察到的临床变异性之间的联系;另一个是研究特定成像特征和特定基因表达模式之间的联系,这些模式为潜在的细胞病理生理学提供信息。在影像生物学界,一个常见的假说是,感兴趣表型的一部分变异可归因于基因型变异。在临床背景下,这一假设在少数患者出现严重治疗的风险中得以实现,从而将潜在治疗剂量的处方限制在大多数患者身上。我们认为影像基因组学的总体目标是分离等位基因和相应的影像特征,这些特征是表观遗传差异的基础。各种人类组织的基因表达谱丰富了我们对细胞通路和许多病理条件的理解。与非恶性组织样本相关的不同癌组织研究阐明了肿瘤发生过程,并有助于各种恶性肿瘤的增强分期和亚分类。基因表达特征由几十到数百个基因组成,可以有意义地改善诊断、预后和对治疗反应的预测。基因影像组学研究强调了癌症患者的影像特征和基因表达模式之间的联系。一项利用公开的非小细胞肺癌患者基因表达数据集中的生存数据进行的研究能够识别预后成像生物标志物。这种用于识别成像生物标志物的影像基因组学方法可能会使新的成像方式得到更快速的评估,从而加速其融入个性化医疗方法。另一项研究将从肝细胞癌患者对比增强CT图像中提取的临床医生定义的特征与使用神经网络机器学习的基因表达模式进行了比较。据报道,28个特征的组合可以重建78%与细胞增殖、肝脏合成功能和预后相关的整体基因表达谱。在另一项研究中,从磁共振图像中提取的用于预测多形性胶质母细胞瘤患者整体基因表达模式的特征显示,浸润性表型与生存率显著降低相关。然而,基因表达谱分析依赖于手术获取与多种风险和潜在并发症相关的组织样本,因此对许多癌症患者不可行。与基因图谱研究形成鲜明对比的是,影像组学特征以非侵入性三维方式捕捉肿瘤内异质性,并可作为常规临床护理的一部分获得。例如,全球确诊的三阴性乳腺癌中,约有15%与治疗后的不良预后相关。评估HER2表达的可靠技术(通常是荧光原位杂交(FISH))既昂贵又耗时。在一项考虑了肿瘤及其周围实质的研究中,DCE–MRI影像图像分型为诊断三阴性乳腺肿瘤提供了有用的信息。目前,影像基因组学领域正在迅速发展,从筛选数量有限的候选基因的努力,转向一种开放的发现方法。

影像基因组特征提供了有价值的生物标志物;这些因素包括预后和结局预测因素,例如肿瘤对治疗的反应以及非恶性组织对相同治疗的耐受性。尽管有这些优点,影像基因组学生物标记物的试验容易受到实验和成像不一致的影响;因此,如果影像基因组学生物标记物要成为肿瘤学中有效的诊断、预后和预测工具,那么分析标准、图像采集、分割、试验设计和分析方法的标准化至关重要。

放射敏感性与原发肿瘤

放疗后的肿瘤控制取决于以下标准:肿瘤中存在的肿瘤干细胞数量(其特征与预处理肿瘤体积有关)、干细胞固有的放射敏感性、缺氧分数、肿瘤附近的再氧合以及整个治疗过程中的或再增殖能力。肿瘤微环境的影像基因分析有能力解决与上述标准相关的知识。例如原发性透明细胞肾癌患者的微血管密度与PET-MR衍生影像组学特征之间的强相关性。总的来说,肿瘤在影像敏感性方面表现出相当大的变异性,甚至影响类似起源或组织学类型的肿瘤细胞。目前,人类肿瘤影像敏感性的量化是基于离体肿瘤存活率和未修复DNA双链断裂的检测进行的。临床前(包括前列腺癌、肺癌和脑癌)和临床(如宫颈癌和头颈癌)研究已经证明,肿瘤细胞影像敏感性是预测前列腺癌、肺癌、脑癌、宫颈癌或头颈癌患者放疗结果的关键特征。

总的来说,这些方法受到了实质性实验变异性的影响,而不是患者间影像敏感性变异的影响。非恶性组织是影像肿瘤学的剂量限制因素;因此,全面的CDSS(临床决策支持系统)应建立在剂量、肿瘤控制与非恶性组织并发症概率比以及成本效益的预测基础上,以促进患者个体化治疗的升级或降级。

免疫疗法

在肿瘤学领域,一个很有前景的研究领域是生物标记物,尤其是免疫治疗和成像生物标记物。影像治疗对抗肿瘤免疫反应的刺激已被充分证明。为了激发强大有力的免疫反应,需要激活抗原特异性T细胞并产生记忆效应。这种免疫反应依赖于肿瘤细胞上特异性抗原(新抗原)的表达,随后由免疫系统识别。新抗原来自肿瘤细胞内的突变蛋白质。研究结果表明,免疫治疗的成功率取决于新抗原特异性T细胞的存在。此外,许多人类肿瘤类型的突变负荷与自然杀伤细胞和T细胞的细胞溶解活性相关。当肿瘤有可能被免疫系统识别时,可以适当调节免疫反应。重要的是,新抗原必须被抗原呈递细胞(APC)或树突状细胞(DC)吸收,然后被激活传递给T细胞。然后,T细胞转化为杀伤肿瘤的细胞毒性T细胞。辐射增强免疫反应的能力似乎在很大程度上取决于肿瘤局部环境中DC的数量和质量。

肿瘤有各种各样的方法来屏蔽大量的细胞毒性T细胞反应;例如,通过干扰几个免疫检查点,例如PD-L1,一种具有生物标记潜力的蛋白质。肿瘤的突变负荷与抗PD-1介导的免疫治疗的临床反应相关,例如,非小细胞肺癌患者。这种生物和基因特征具有潜力;影像基因分析无疑将在未来的CDSS(临床决策支持系统)中发挥重要作用。还有待测试的基本假设是,与低突变负荷的肿瘤相比,高突变负荷的肿瘤具有更多的新抗原,因此在影像分析中会更不均匀,对免疫治疗更敏感。放疗或化疗的反应则恰恰相反;在这些情况下,增强影像组学评估的肿瘤异质性是一个不利的预后因素。关于影像治疗和/或化疗和免疫治疗的结合,目前还没有明确的迹象表明哪种效应将占主导地位。

技术方面

应建立经认证的影像基因组中心。学术、临床、行业和监管领域的利益相关者必须合作创建、维持和标准化所需的最佳实践框架。影像学研究很难始终如一地进行,因此,认证对影像学的发展至关重要。影像组学的工作流程技术应该独立于供应商,以及硬件和/或软件的升级。由于影像研究具有有益的伦理、经济和后续影响(例如:告知计算成本和所需样本大小、多中心试验持续时间和试验成本)。最佳的重复性和稳定性使多中心研究能够最大限度地提高经验证的影像特征适合常规临床使用的可能性。有足够能力将影像组学数据与适当患者群体的临床结果联系起来的前瞻性研究至关重要。事实上,许多研究在敏感性和特异性方面缺乏动力;然而,研究人群不应该因为只选择那些比普通人群更能遵守复杂成像协议的患者而发生倾斜。所有研究结果都应该公布,包括真阴性、假阴性和假阳性,负面结果带来的负面影响有所缓和,因为包含大量偏见可能会影响影像组学的前景。

经济因素

共享、存储和管理数据需要多中心、协作和联合的努力。数据共享能够启动高效的前瞻性研究,并加速从新数据和现有数据中得出的影像特征的开发和验证。结果研究应包括健康和经济方面的考虑。此外,经成本-质量-调整-生存率的比较应在有无影像组学的情况下进行,以更准确地确定此类研究的经济潜力。

虚拟活检

在癌症患者中,肿瘤的不同部位具有不同的分子特征;这种差异会随着时间的推移而改变。由于不可能在多个时间点对每个肿瘤的每个部分进行活检,因此无法使用活检样本实现肿瘤的最佳表征(图4)。

影像组学:医学影像学与个性化精准医疗的桥梁-编程之家

图4,影像基因组学分析可以揭示成像表型和基因表达模式之间的关系。

这种关系可以包括单个基因的表达,以及总结特定基因亚群表达的度量。

Delta影像组学

已发表的工作主要集中在单个时间点获得的成像数据,主要是在治疗开始前对肿瘤进行成像。Delta radiomics引入了时间成分,包括从治疗过程中获取的图像集中提取定量特征,这提供了关于特征值演变的信息(图5)。Delta影像组学有望改善诊断、预后、预测、监测、基于图像的干预或治疗反应评估。

影像组学:医学影像学与个性化精准医疗的桥梁-编程之家

图5,临床决策支持系统图形用户界面示意图概述

图5说明了delta radiomics的概念。在本例中,临床医生要求基于组合的纵向PET-CT图像对患者进行影像组学分析,这可能有助于改善诊断、早期反应预测、改善临床决策,从而改善预后。

影像组学的基础配置

影像组学显示出巨大的潜力,可以加深知识,拓宽成像视野,从而实现更高的精确度和活体生物信息的提取。为了充分发挥影像组学的潜在优势,研究和临床必须接受精密医学的跨学科共同愿景。提取的影像特征必须存储在可搜索的数据库中,以实现常规标准护理成像所代表的RLHC(快速学习医疗保健系统)前所未有的潜力。因此,RLHC网络可以动态地捕获多模态数据,并跨部门和机构边界共享知识,以便积累足够的数据集,在模型开发和验证中发挥重要的统计作用。

大数据

理想的RLHC(快速学习医疗保健系统)需要满足“大数据”的4个特点:数据量、多样性、速度和准确性。数据量很重要:首先,从研究中获得的信息质量与患者数量相关;其次,更大的数据量可以在模型开发阶段获取更多变量;第三,与罕见疾病变异患者相关的知识更容易从更大的数据集中获得。治疗和患者特征方面的各种数据对于决定哪种治疗对每个患者来说是最佳的至关重要。数据获取的速度对于确保尽可能快速、永久地收集知识非常重要,而数据的准确性对于所获得知识的可信度至关重要。

数据分享

获取高质量的数据对于RLHCs至关重要。但我们也迫切需要接受信息和数据共享技术,它超越机构和国家推动研究和临床发展。在医学领域,数据共享的以下阻碍显而易见:人力资源不足或时间不足、文化和语言困难、数据记录方法、数据的政治和学术价值、对声誉的危害,或法律和隐私考虑等等。这些问题虽然不容易克服,但必须加以解决。

实现这一目标的一个举措是CancerLinQ,即ASCO数据集中方法。另一项倡议是worldCAT,它包括一种新的数据联合方法,成功地将荷兰、德国、比利时、意大利、丹麦、澳大利亚、中国、印度、南非、爱尔兰、英国、美国和加拿大的影像治疗机构连接起来(图6)。其他重要链接包括:癌症成像档案(TCIA)、定量成像网络(QIN)、定量成像生物标记物联盟(QIBA)和癌症定量成像:细胞过程与治疗的联系(QuIC-ConCePT).

影像组学:医学影像学与个性化精准医疗的桥梁-编程之家

图6,CAT系统示意图

多个中心通过学习连接器连接。连接器是机器学习算法(从学习协调器发送)从本地数据学习模型的接口连接。值得注意的是,隐私敏感信息仍保留在该研究所。合作伙伴的网站分布在荷兰、德国、比利时、意大利、丹麦、澳大利亚、中国、印度、南非、爱尔兰、英国、美国和加拿大。该系统由开源信息通信技术组合而成,可以通过SQL查询本地传递数据,或通过SPARQL端点传递到更广泛的CAT网络。CAT:计算机辅助诊断性电子病历;电子病历;PACS:图像存档和通信系统;SPARQL;简单协议和RDF查询语言。

RLHCs要取得成功,需要创建具有语义互操作性的数据,也称为“机器可读”数据,其中本地术语与定义良好的本体(如NCI同义词库或ICD-10)的概念相协调。利用这种技术,本体术语作为每个机构站点数据的通用参考,允许通过数据的语义网关实现信息检索的统一过程。这种方法的一个好处是,它促进了数据管理方面的标准化(例如特定疾病的“伞式”协议:NCT01855191)。

影像组学在未来的发展

未来的图像存档和影像组学信息系统(PARKS)将识别、分割和提取感兴趣区域的特征。如果可以访问与同一患者相关的先前图像,PARKS软件将自动识别先前识别的感兴趣区域。图像存档和影像组学信息系统将定量图像特征自动提取上传到共享数据库并与之前图像进行比较,以增强CDSS的诊断、预后和治疗,从而改进个性化和精确医学(图7)。这些功能是从技术、科学和临床的角度来看的,因为大多数当前的图像存档和通信系统都能够将当前图像与以前的图像共同注册,并执行用户交互分割。在不久的将来,影像组学通信领域将专注于为强大的RLHC网络创建合适的基础设施,以促进模型的开发和验证。

影像组学:医学影像学与个性化精准医疗的桥梁-编程之家

图7,RLHC的方法学过程概述,以及影像组学工作流程如何适应CDSS的开发。

数据选择、发现、收集和准备、模型开发验证和实施、临床效用评估以及通过持续重复过程最终完善(整个过程中都需要质量控制和保证协议)。

结论

我们对影像组学的愿景是广阔。在不久的将来,我们设想,应用从全球RLHC网络(由标准医疗成像填充)中挖掘的影像组学特征中获得的知识的CDSS将能够增加个性化的药物交付。为了在常规临床环境中实现这一愿景,必须激励临床医生和医学物理学家参与这一过程。此外,标准化对这项工作至关重要,主要是在获取高质量数据方面。标准化为一致的临床指南提供了基础,包括商定的图像采集和分析标准,以及利用匹配本体的数据共享技术。持续重新评估和证明CDSS(临床决策支持系统)的临床效用与标准化临床试验设计的开发和验证同样重要。这些关键步骤是CDSS成功的基础。RLHC和影像组学的同步和协同进步将推动个性化和精确医学的下一个重大突破。