食管癌新辅助治疗后的病理评估

中国胸心血管外科临床杂志 | 2022, 29

食管癌是全球最常见的恶性肿瘤之一,发病率和死亡率分别居所有恶性肿瘤的第7位和第6位[1],患者总体预后差,5年生存率仅为20%[2]。中国是食管癌的高发地区,每年新发和死亡人数约占全球的50%[3-4]。多数食管癌患者在确诊时已处于局部进展期,单纯手术治疗预后不佳。近年来新辅助化学治疗(化疗)或新辅助放射治疗和化学治疗(放化疗)联合食管癌根治术逐渐取代单纯手术治疗,成为局部进展期食管癌的标准治疗方式。研究[5-7]表明,与单纯手术相比,新辅助联合手术治疗显著改善了局部进展期食管癌患者的长期生存率。约70%~98%的患者在接受新辅助治疗后出现不同程度的肿瘤退缩,退缩反应程度与患者预后息息相关,并影响患者后续的治疗决策[8]。目前,新辅助治疗疗效可以通过几种不同的方法评估。实体瘤反应评价标准(response evaluation criteria in solid tumours,RECIST)是评价实体瘤治疗疗效的金标准,但它要求存在可测量的病灶。2000年发布的RECIST(Ver1.0)对可测量病灶的要求为肿瘤病灶最大径≥10 mm(CT层厚≤5 mm)[9],当前版本的RECIST(Ver1.1)则增加了单个转移淋巴结短径≥15 mm的新要求[10]。由于新辅助治疗后的食管癌病灶和转移淋巴结的大小常常难以达到RECIST的测量要求,另外RECIST本身也指出其对消化道原发肿瘤测量的可重复性较差[11],因此对于新辅助治疗后的食管癌疗效评估,RECIST并非最佳手段,许多证据已表明通过组织病理学角度评估肿瘤退缩分级(tumor regression grading,TRG)是更好的评估方法,而且部分研究[7,12]表明TRG是患者生存的独立预后指标。本文主要介绍食管癌新辅助治疗后的组织病理学改变,回顾性总结目前食管癌新辅助治疗疗效评估常用的TRG标准,并讨论不同标准的应用情况和局限性。

1   食管癌新辅助治疗后的病理改变

食管癌在新辅助治疗后会呈现多种组织形态学改变,可归纳为以下几个方面。

1.1   肿瘤实质与间质的改变

肿瘤细胞改变包括细胞胞界消失、细胞质肿胀,发生空泡化、嗜酸性变等。肿瘤细胞胞核出现多形性,核增大、分叶增多、形状怪异,核染色质呈空泡状,可伴单个或多个嗜酸性核仁[13-15]。肿瘤间质改变包括肿瘤床和周围组织间质纤维化、钙化、坏死、伴炎症反应、胆固醇结晶沉积等,其中纤维化是最常见的病理改变,被用作一些TRG的评价参数[15-17]

1.2   其它特殊改变

1.2.1   黏液湖

黏液湖由组织间隙黏液细胞分泌的大量黏液聚积形成,多见于由黏液细胞构成的肿瘤,如黏液腺癌、黏液性囊腺癌、印戒细胞癌等,消化道腺癌治疗后也可以出现[13]。约10%~20%新辅助治疗后的食管或食管胃结合部腺癌肿瘤床中存在黏液湖,其中23%~33%为无细胞黏液湖,可累及食管壁任何一层。这些出现黏液湖的肿瘤大多在新辅助治疗前的活检中就表现为黏液样或印戒细胞分化[13]。黏液湖或周围组织中存在残留肿瘤细胞时,视为肿瘤残留,无细胞的黏液湖则视为肿瘤完全退缩。有研究[18]表明,在病理完全缓解的患者中,伴无细胞黏液湖的患者预后好于不伴无细胞黏液湖的患者。此外,肿瘤切缘处发现无细胞黏液湖不应视为切缘阳性,淋巴结内的无细胞黏液湖也不应视为淋巴结转移[13]

1.2.2   神经内分泌分化

部分新辅助治疗后的残留肿瘤细胞可发生神经内分泌分化,以单个细胞或癌巢的形式散在分布,表达突触素、嗜铬粒蛋白等神经内分泌标志物[19]。目前神经内分泌分化对新辅助治疗后食管癌患者预后意义的报道较少,Wang等[20]发现新辅助治疗后食管腺癌中出现神经内分泌分化与预后较差相关,并推测可能的原因是神经内分泌分化的肿瘤细胞对新辅助治疗抵抗性更强。值得注意的是,神经内分泌分化并不等同于神经内分泌癌,这种改变可能只是一种治疗反应,其意义需要更多的研究来阐明。

1.2.3   胃上皮异型增生样不典型性改变

胃上皮异型增生是胃癌主要的癌前病变[21-22]。Brien等[23]发现接受新辅助治疗的食管癌患者中,7.5%的患者胃上皮出现了类似异型增生的不典型性改变。与异型增生的不同点在于,这些上皮具有斑片状分布、表面成熟、胞质高度嗜酸性、核极性存在、核仁明显、核分裂象及MIB-1阳性仅局限于胃小凹、缺乏非典型核分裂象、p53阴性等特征。作者认为胃上皮的这种不典型性改变是对新辅助治疗损伤的修复,病理医生应警惕这一形态陷阱,避免过度诊治。

1.3   食管鳞状细胞癌特有的形态学改变

包括巨细胞肉芽肿、无细胞的角蛋白或碎片、无活细胞核的癌细胞(鬼影细胞)、黏膜下腺体的鳞状上皮化生等。其中,仅有角化物无癌细胞时,不视为肿瘤残留。此外,鳞状化生的上皮具有完好的分叶状结构和周围间质缺乏结缔组织反应有助于其与真正的鳞状细胞癌残留相鉴别[13]。有报道[24]称鳞状细胞癌鬼影细胞周围有大量淋巴细胞浸润,可能与新辅助治疗用药相关。

2   食管癌的肿瘤退缩分级

TRG旨在利用客观的组织病理学结果对新辅助治疗后肿瘤的退缩变化进行分级,以评估新辅助治疗的疗效。尽管新辅助治疗后肿瘤的组织形态学改变多样,但作为评判肿瘤退缩情况的标准,TRG应采用简便易行、便于重复的参数。目前评价食管和食管胃结合部癌的TRG标准主要分为两类,即对“残留肿瘤和治疗诱导纤维化之间关系的描述性评估”及对“残留肿瘤占原肿瘤床百分比的比例评估”。以下是对TRG标准的具体介绍。

2.1   残留肿瘤与纤维化程度比较的描述性评估标准

2.1.1   Mandard标准(5级)

于1994年提出的Mandard标准[16]是最早用于食管鳞状细胞癌同步放化疗后肿瘤退缩分级的标准。根据镜下残留肿瘤细胞与纤维化反应的关系,Mandard标准将肿瘤退缩反应分为5级:TRG 1级=无癌细胞残留,由大量纤维化取代;TRG 2级=纤维化中散在少量癌细胞;TRG 3级=纤维化多于残留癌细胞;TRG 4级=纤维化少于残留癌细胞;TRG 5级=无肿瘤退缩改变。自提出以来,Mandard标准被广泛应用于多种消化道肿瘤新辅助治疗后的病理评估,也为之后的许多TRG标准提供了参考。

2.1.2   Ryan标准(3级)

在Mandard 5级标准的基础上,2005年Ryan等[17]基于247例术前接受5-FU化疗+放射治疗(放疗)的局部进展期直肠癌病例提出了Ryan标准:TRG 1级=无存活癌细胞(完全缓解)或单个或小簇癌细胞残留(接近完全缓解),相当于Mandard标准1级和2级;TRG 2级=肿瘤消退明显,残留肿瘤组织多于TRG 1级(部分反应),相当于Mandard标准3级;TRG 3级=无明显肿瘤消退,大量癌细胞残留(反应不良或无反应),相当于Mandard标准4级和5级。相较Mandard标准,Ryan标准观察者间一致性更好(κ值由0.64提高到了0.84)。

2.1.3   美国病理学会标准(4级)

为了增加实用性,减少主观判断的偏差,美国病理学会(College of American Pathologists,CAP)从Ryan标准中划分出TRG 0级,建立了4级标准:TRG 0级=无存活癌细胞(完全反应);TRG 1级=单个或小簇癌细胞残留(中度反应);TRG 2级=残留癌灶伴间质纤维化(轻度反应);TRG 3级=少量或无肿瘤退缩改变,大量癌细胞残留(反应不佳)[25]。中国临床肿瘤学会(Chinese Society of Clinical Oncology,CSCO)食管癌诊疗指南2020版也采用CAP标准用于新辅助治疗后的病理评估[26]

上述三种TRG标准是依据治疗诱导的纤维化和残留肿瘤组织之间“此消彼长”的关系进行病理评估。但在临床实践中,病理医生们有时需要定量标准来解决各亚组之间分界不清的问题,这一需求催生了对残留肿瘤占原肿瘤床百分比进行评估的定量TRG标准。

2.2   残留肿瘤占瘤床比例的定量评估标准

2.2.1   Becker标准(4级)

2003年,Becker等[27]基于36例接受新辅助化疗的局部进展期胃癌病例,根据残留肿瘤组织占整个肿瘤床的比例,提出Becker标准:TRG 1a级=无肿瘤残留(肿瘤完全退缩);TRG 1b级=残留肿瘤小于肿瘤床的10%(肿瘤次全退缩);TRG 2级=残留肿瘤占肿瘤床的10%~50%(肿瘤部分退缩);TRG 3级=残留肿瘤占瘤床的50%以上。Schneider等[28]评估了85例接受新辅助化疗的局部进展期食管癌患者,发现Becker的TRG分级与患者生存预后存在独立相关性。然而,Chirieac等[29]对235例接受新辅助化疗食管癌患者进行了TRG分级与生存预后的相关性分析,发现1%~10%残留肿瘤组(相当于TRG 1b级)和11%~50%残留肿瘤组(相当于TRG 2级)的无病生存期和总生存期(overall survival,OS)无显著差异,因此提出将这两组合并。

2.2.2   Swisher标准(3级)

在Chirieac提议的基础上,2005年Swisher等[30]提出了三级TRG标准,即:P0级=无肿瘤残留(完全反应);P1级=1%~50%肿瘤残留(部分反应);P2级=超过50%肿瘤残留(无反应)。采用这一标准对239例接受新辅助治疗后的食管癌患者进行分组,P0、P1及P2组患者的3年生存率分别为74%、54%及24%(P<0.001),具有极好的区分度,表明该标准有潜力成为新辅助治疗后食管癌患者生存的独立预测因子。为了进一步比较Becker标准和Swisher标准的优劣,2007年Wu等[31]按照Becker标准纳入60例(每级15例)接受新辅助放化疗的食管癌患者,再按照Swisher标准重新分级,比较两者对患者长期生存差异的区分度,结果显示Swisher标准在更加简单易行的同时展现了极佳的OS预测价值,病理医师间一致性也极好,而将1%~50%肿瘤残留进一步细分为1%~10%和11%~50%肿瘤残留的Becker标准可重复性较差。

2.2.3   JSED标准(4级)

2017年,日本食管疾病学会(Japanese Society for Esophageal Diseases,JSED)发布了4级TRG标准,其分级与Becker标准类似,同样基于残留肿瘤细胞占瘤床的比例,但分级节点不同[32]。TRG 0级=无退缩证据(无效);TRG 1a级=残存肿瘤细胞占瘤床面积的2/3以上(疗效微弱);TRG 1b级=1/3以上但小于2/3的瘤床内仍残存肿瘤细胞(疗效轻微);TRG 2级=小于1/3的瘤床残存肿瘤细胞(疗效显著);TRG 3级=瘤床内无残存肿瘤细胞(完全反应)。值得注意的是该标准的分级节点与日本胃癌学会2011年发布的TRG标准相同[33]

目前几种常用的TRG标准比较见表1

1 级无癌细胞残留无存活癌细胞(完全缓解)或单个或小簇癌细胞残留(接近完全缓解)单个或小簇癌细胞残留(中度反应)TRG 1a 级:无肿瘤残留(肿瘤完全退缩)P1 级:1%~50% 肿瘤残留(部分反应)TRG 1a 级:残留肿瘤细胞占瘤床面积的 2/3 以上(疗效微弱)
TRG 1b 级:残留肿瘤小于肿瘤床的 10%(肿瘤次全退缩)TRG 1b 级:1/3 以上但小于 2/3 的瘤床内仍残留肿瘤细胞(疗效轻微)
2 级纤维化中散在少量癌细胞肿瘤消退明显,残留肿瘤组织多于TRG 1 级(部分反应)残留癌灶伴间质纤维化(轻度反应)残留肿瘤占肿瘤床的 10%~50%(肿瘤部分退缩)P2 级:超过 50% 肿瘤残留(无反应)小于 1/3 的瘤床残留肿瘤细胞(疗效显著)
3 级纤维化多于残留癌细胞无明显肿瘤消退,大量癌细胞残留(反应不良或无反应)少量或无肿瘤退缩改变,大量癌细胞残留(反应不佳)残留肿瘤占瘤床的 50% 以上瘤床内无残留肿瘤细胞(完全反应)
4 级纤维化少于残留癌细胞
5 级无肿瘤退缩改变
TRG:肿瘤退缩分级;CAP:美国病理学会;NCCN:美国国立综合癌症网络;JSED:日本食管疾病学会

3   肿瘤退缩分级与淋巴结转移

与原发肿瘤部位相似,新辅助治疗后的淋巴结也可观察到肿瘤退缩的病理特征,如纤维化、坏死、钙化、无细胞黏液湖等[34]。新辅助治疗不仅会减少受累淋巴结的数量,也会影响其分布。研究[35]发现接受新辅助治疗后,食管腺癌患者贲门旁淋巴结及食管鳞状细胞癌患者食管周、贲门旁和隆突下淋巴结转移率降低。

淋巴结与原发肿瘤的退缩程度并不相同,受累淋巴结的肿瘤退缩可能对患者的长期生存产生影响[36]。研究[37-39]表明新辅助治疗后淋巴结转移是患者长期生存的独立影响因素,因此有必要将淋巴结退缩的描述纳入TRG分级系统中。Hagi等[38]提出了新辅助治疗后食管癌淋巴结TRG评估标准:计算所有受累淋巴结的残留肿瘤面积之和与瘤床面积之和的比例,采用Becker分级的肿瘤残留50%、10%和无肿瘤残留作为节点分为Ⅰ~Ⅳ四级,其中Ⅲ、Ⅳ级为应答者。Hagi等利用371例局部进展期食管癌病例,比较了Becker标准和淋巴结TRG标准对患者长期生存的预测能力。淋巴结TRG分级应答者的5年无复发生存率明显优于Becker分级的应答者(66.4% vs. 26.5%,P<0.001),与淋巴结未发生转移的患者相似(66.4% vs. 64.5%,P=0.74),淋巴结TRG未应答是患者较差无复发生存率的独立危险因素。其它研究[40]也支持淋巴结退缩反应对患者预后的预测优于原发肿瘤退缩反应。但也有学者[41]提出,部分淋巴结(特别是纵隔淋巴结)的退行性改变或纤维化可能与新辅助治疗无关;另外淋巴结微小转移的肿瘤退缩未必有明显瘢痕,这两个因素可能会限制淋巴结TRG标准的应用。

4   关于肿瘤退缩分级的讨论与争议

尽管TRG分级可以为肿瘤预后提供极有价值的信息,但是目前TRG标准纷乱庞杂,从二分法到五分法,从较为模糊的描述性概念到较为精确的百分比,尚缺乏统一标准,导致难以对使用不同TRG标准的临床研究进行比较。目前病理学家们仍未就TRG系统达成普遍共识,这一问题仍在激烈讨论中。

2020年,Westerhoff等[42]组织的一项包括203名病理学家的大型国际调查显示,在北美和澳洲,最常用的食管癌TRG标准是AJCC/CAP/Ryan分级(71%),而欧洲常用Mandard分级(36%)和AJCC/CAP/Ryan分级(22%)。大多数病理学家认为4级分级法更合理,而残留肿瘤占瘤床百分比作为分类依据的κ值更高,遗憾的是这项研究缺乏东亚国家病理医生的反馈。2021年,Saliba等[43]组织了关于食管和食管胃结合部腺癌TRG评价的Delphi调查。专家小组建议采用类似Schneider和Chirieac提出的4级TRG标准评估原发肿瘤,即:1级=无肿瘤残留(肿瘤组织完全退缩);2级=低于10%肿瘤残留(接近完全退缩);3级=10%~50%肿瘤残留(部分退缩);4级=超过50%肿瘤残留(极少/无退缩)。同时,还建议在目前新辅助治疗后淋巴结病理分期的基础上增加淋巴结的TRG分级评估,标准是:a级=完全退缩(仅存在退缩改变,如纤维化或黏液湖,无残留肿瘤细胞);b级=部分退缩(退缩改变与残留肿瘤并存);c级=无退缩(无肿瘤退缩改变)。这项调查对原发肿瘤和淋巴结TRG标准的建议与更早的一项对胃腺癌的Delphi调查[44]一致。

TRG分级一方面需要使用尽可能少的亚组使其在临床应用中易于使用和重现,另一方面需要有足够的亚组来反映组间生存差异[45]。一般来说,3级标准的优势在于评估简单、重现性高,但由于组别限制,要么没有区分“完全退缩”和“接近完全退缩”,要么没有区分“接近完全退缩”和“部分退缩”,有Meta分析证据[46]支持“肿瘤接近完全退缩”患者的预后要好于“肿瘤部分退缩”的患者,因此4级标准有助于显示更全面的预后信息。采用4级标准的另一个优势在于其与胃癌常用的TRG标准Becker分级以及近期胃癌TRG分级的Delphi调查结果一致[44]。尽管AJCC第8版采用肿瘤中心的位置来区分位于食管胃结合部的食管癌和胃癌,但临床上区分远端食管癌和近端胃癌仍存在困难,特别是对于食管胃结合部的巨大肿瘤。因此,在食管癌和胃癌中采用相同的4级TRG标准更便于病理医生对这类标本进行评估。

“纤维化与残留肿瘤的描述性比例”和“残留肿瘤占原肿瘤床的百分比”代表着目前两类主流的TRG分级体系。Karamitopoulou等[47]基于89例接受新辅助化疗的食管腺癌标本,比较了Mandard标准和Becker标准的观察者间一致性,发现采用残留肿瘤占原肿瘤床百分比的Becker标准一致性更好(前者κ值为0.62,后者为0.78)。Puetz等[8]也认为使用残留肿瘤占原肿瘤床的百分比相较描述性评分系统更准确,他们发现少量残留肿瘤细胞(Mandard 2级)和纤维化超过残留肿瘤(Mandard 3级)两组间区别太模糊,观察者结果难以一致。Westerhoff等[42]的国际调查结果显示,仅有26%接受调查的病理学家认为对残留肿瘤的估算困难,而57%的参与者认为对治疗诱导纤维化的估计很困难。“纤维化与残留肿瘤的比例”分级体系在观察者信度上的缺陷可能在于难以对纤维化的相对数量作出准确评估[47]

近年来,除了传统的放疗、化疗和手术外,新兴的食管癌治疗手段方兴未艾,如以抗血管生成药雷莫卢单抗为代表的靶向治疗,以免疫检查点抑制剂帕博利珠单抗、纳武利尤单抗为代表的免疫治疗等。免疫治疗已成为2020版CSCO食管癌诊疗指南[26]推荐的晚期食管癌二线治疗方案,针对可切除食管癌术前(放)化疗联合免疫治疗的临床试验也正在如火如荼地进行中[48-50]。这些新兴治疗手段会引起哪些特殊的肿瘤组织病理变化,我们了解甚少。有文献[51]报道了Her-2阳性胃癌接受化疗联合曲妥珠单抗治疗后的病理变化,我们需要类似的食管癌领域的研究来揭示新的治疗手段引起的病理改变,并补充和完善现有的TRG标准。

TRG系统在评价食管癌新辅助治疗反应方面作用显著,但目前食管癌TRG系统仍存在局限性,我们需要更加规范统一的TRG标准,并将淋巴结退缩反应的评价纳入其中。TRG系统可以成为新辅助治疗后食管癌预后评价的重要手段,为术后的随访治疗提供依据。

利益冲突:无。

作者贡献:冯希佳负责论文初稿撰写和论文设计;陈晓炎负责论文内容调整、语言修改及润色;李鹤成负责论文总体设想和设计。

展开阅读全文
胸外医生 陆
上一篇

ISDE食管癌大会内容汇总

你也可能喜欢

评论已经被关闭。

插入图片
返回顶部