第一部分 前列腺癌精准诊断
第1章 医学文献的精准解析
临床问题
第一节 为什么要对医学文献进行解析?
医学生在大学本科见习、实习阶段,医学知识来源于教材(纸质、多媒体)和老师面授等。本科生知识体系构建遵循教材的编排顺序,从流行病学、病因、症状、体征、实验室检查、辅助检查、诊断、鉴别诊断,最后到治疗及预后。本科生接受的绝大部分都是具有定论的内容,很少存在争议,此种教材式的完整知识体系有利于学生学习。住院医师、研究生进入临床实践后,知识来源于专业书籍和文献、临床指南以及教授查房等。住院医师或研究生的知识体系完全不同于本科生,专业文献中富有争议的内容非常常见,有时候甚至是完全相左的结论。这才是临床医学的本来面貌,医学就是在争论中得到发展。
医学文献最终得以发表,需要经过研究设计、研究实施、数据分析、文章撰写、同行评议、编辑加工等过程,呈现在杂志上的是其较为完美的一面。文献反映了本领域的最新进展,具有一定临床指导意义。不过,不同杂志上发表的文章,其参考价值并不相同,甚至良莠不齐、差别巨大。为快速、高效地了解本领域的最新进展,有些医师偏好阅读临床指南。临床指南对知识进行了二次利用,较好的指南还附有文献质量评估,能较好地反映本学科的进展。不过,不同专业的学会对同一疾病阐述的侧重点不同,有时可能产生较大差别。同样,同一病情不同医师查房也可能会有不同意见。
2017年夏天,某著名中文媒体微信公众号发布消息:某公司宣布全球首次HIV疫苗人体临床试验结果。志愿者对HIV疫苗耐受性良好,并且100%产生了对抗HIV的抗体。消息很振奋人心!不过,该媒体很快自我更正:前述报道有误。只要是疫苗,进入人体即会产生抗体,有抗体不等于能够预防疾病;该实验不是人体试验,是数年前猴子的试验结果。事情的反转令公众大跌眼镜。作为医学专业人士,不应该满足于仅从大众媒体获取经过编辑加工的医学信息,必须进行信息溯源,对原始文献信息进行评价分析,才能科学地加以吸收应用。本例中查询美国国立卫生院(NIH)网站新闻,即可明确原有消息不准确。当下,各种微信公众号盛行,其中有许多传播专业医学知识的优秀微信公众号,读者在便捷、高效获取最新专业知识的同时,还应该保持对原始文献进行溯源和解析的能力。
所以,从住院医师或者研究生培养阶段开始,就应该学会医学文献解析,养成遍览群书、汲取精华、不偏信、不盲从的学习习惯和能力。
最新进展
第二节 如何对医学文献进行解析?
进行医学文献解析,绕不开一个名词——循证医学。循证医学是指对人群样本进行高质量研究,用数学的方法评估数据利与害的风险,指导临床上对患者的个体化诊断和治疗。
文献分为原创文章和总结其他论文的文献。原创文章有自身数据的支撑,可能为一家机构的数据,也可能涉及数家甚至几十家机构,但均是对原始数据进行分析。总结其他论文的文献包括系统综述和Meta分析(又称荟萃分析),是对原创文章的再加工。Meta分析是定量的系统综述,将研究同一问题的不同文献数据进行整合和统计分析,从而得出结论。理论上,Meta分析结论具有较高证据等级。Meta分析好比一部高效的矿石加工机,采集加工的是金矿,必然产出金子。但是,若送入机器加工的是普通石头,再好的Meta分析出来的也只能是砖头。因此,Meta分析的文献筛选非常重要,带有偏见的选择会有非常大的偏倚。不要轻信Meta分析的结论,一定要详细了解文献筛选过程,阅读Meta分析的原文。
对于原创文章,可以从以下几个方面进行解析:
1.文章的临床意义是什么?能否解决临床中的一个或几个问题?是否具有创新性?
研究的临床意义是文章最为核心的内容。例如药物研究,当新的肿瘤药物研发出来,目前又没有针对此阶段肿瘤的其他药物,就要用安慰剂对照的方法验证新药的有效性。如果有现成的药物,必须与既有药物对照(阳性对照)才能验证新药更好的或者非劣性效果。新术式与旧术式的比较,新诊断方法与旧诊断方法的比较,都是临床研究的意义所在。有少量的文献,描述报道新术式围手术期情况,没有与既往术式比较的结果,也并非完全不行。关键在于术式要新,当此术式大量开展,就不能再以描述性质的形式撰写文章了。文章能够发表的前提是该研究具有创新性或部分创新性。阅读每一篇文章时,不要被满眼的数据迷惑,抓住文章的意义以及创新性进行第一步分析至关重要。如果文章过不了创新性第一关,后续部分再如何精彩也意义不大。
2.作者研究的对象是什么样的患者?这些患者的同质性如何控制?是否有患者基线数据表格?
临床研究的对象多为患有某一疾病的患者。很多文章对患者情况进行了规定,即入组标准。入组标准是研究的基石,结果与干预手段密切相关,患者的基线状态更是影响重大。很多研究同一问题的文章结论不同甚至相左,多数原因在于患者入组标准不完全一样。患者基线数据表格往往是文章的第一个表格,其作用非常重要。患者基线数据一致性越高越好,最后的结果越可信。例如,比较肾癌的靶向药物治疗效果,对患者的肾脏肿瘤病理性质、分期、分级等基线数据进行限定,则患者的同质性就会控制得比较好。但对于前列腺穿刺患者,虽然将前列腺特异性抗原(prostate-specific antigen,PSA)、磁共振等结果控制到一定范围,患者的穿刺结果还是区别很大,这是因为前列腺癌本身异质性较大,外部指标PSA、磁共振等不足以将患者内部特征同质化。因此,深入分析文章基线数据表格的临床意义,比看到表面上整齐划一的数据更有意义。
3.研究的设计是什么?是否合理?是否得到很好的贯彻?
解析一篇医学文献,除了明确研究的意义、研究的对象,还需要明确研究的设计是什么。研究设计分为观察性研究和临床试验设计。观察性研究又分为横断面研究、队列研究、病例对照设计。横断面研究是在某一个时间点对某类患者进行研究。队列研究是对一组队列患者进行随访研究。病例对照设计是将患病者与非患病者对照研究。临床试验设计则是采取干预的手段进行研究。随机对照盲法研究是临床试验设计的“金标准”。但并非所有试验都需要这个“金标准”。第三节实例演示部分会有介绍。
4.研究的终点指标是什么?终点指标是否合理?是否采用了替代指标?
研究方案设计时,主要终点指标即应确定。对于肿瘤研究,疾病无进展生存率(progression-free survival,PFS)、疾病特异生存率(disease-specific survival,DSS)、总生存率(overall survival,OS)是常用的研究指标。疾病特异生存率表明真正与肿瘤相关的生存率,具有较高的评价意义。而总生存率考虑了患者服用药物产生的副作用对寿命的影响,具有更全面的评价意义。有时,PFS、DSS、OS需要随访的时间较长时,往往采用替代指标。一个最为典型的例子就是前列腺癌相关研究中,往往将PSA作为替代指标。由于PSA在前列腺癌诊断和治疗中的优异表现,将其作为替代指标有一定道理,不过,不少研究中不同治疗方法PSA无进展生存率差别较大,但总生存率却是一样。对于此种类型的结果,需要审慎对待,做出符合临床意义的判断。
5.统计学方法是否选用合理?
统计学方法的重要性不言而喻。样本量的估计、统计方法的选用等有相关书籍阐述,在此不详述。建议在研究设计阶段即提交统计专业人士审阅。
6.文章结论是否可以由结果顺利导出?文章结论是否以偏概全?
有些文章,实验方案设计较为合理,结果较为明确,但结论与结果之间逻辑跳跃较大,结论较为牵强。此种情形,读者需要审慎对待结论。
7.作者指出了本文的局限性吗?文章包含致命的缺陷吗?
任何文章都有局限性,文章末尾往往是作者自我陈述局限性的部分。有一点需要引起注意的是,作者陈述的局限性以外是否还隐藏着更大的偏倚、更为重大的缺陷,避免被有些文章的“障眼法”迷惑。
8.摘要是否很好地概括了主要内容?文章题目切题吗?
摘要是文章的窗口,读者通过摘要初步了解文章的主要构架、主要结果、最终结论。阅读完摘要后,细读全文时,需要比对摘要是否很好地概括了全文的内容,是否是全文的浓缩精华,是否与正文内容存在一定偏差?文章的题目与文章要表达的主要思想是否一致,是否会造成歧义?
从以上8个方面进行分析,有助于读者“主动解析”文章,有助于吸收精华思想,有助于摒弃片面结果,最终形成对文章的全面认识和理解。
实例演示
第三节 泌尿外科文献解析实例演示
【适应证】
1.新的诊断方法的验证文章。
2.新的药物或手术效果比较的文章。
【禁忌证】
无。
【所需器材清单】
1.医学文献原文全文(一定要阅读原文全文,只阅读文献的二次利用文章是不够的)。
2.对该疾病诊断与治疗的全面了解。
3.医学统计学、医学伦理学基础知识储备。
【团队要求】
1.泌尿外科医师。
2.泌尿肿瘤内科医师。
3.统计学专业人士。
【操作步骤】
文题:Use of prostate systematic and targeted biopsy on the basis of multiparametric MRI in biopsy-naive patients (MRI-FIRST):a prospective,multicentre,paired diagnostic study
请自行阅读原文(DOI:10.1016/S1470-2045(18)30569-2)[1]。
1.文章的临床意义是什么?能否解决临床中的一个或几个问题?是否具有创新性?
此文章要解决的问题是确立首次前列腺穿刺前多参数磁共振检查的作用。在欧美国家,多参数磁共振主要用于重复前列腺穿刺之前检查。随着前列腺靶向穿刺的兴起和应用,多参数磁共振检查是否对于前列腺靶向穿刺具有指导意义呢?该文章对此进行分析,内容具有创新性,其结论可能会对临床具有很好的指导作用。
2.作者研究的对象是什么样的患者?这些患者的同质性如何控制?是否有患者基线数据表格?
研究对象是首次进行前列腺穿刺的患者。为保证患者的基线数据一致,作者做出了以下限定:前列腺特异性抗原在20ng/ml以内;前列腺直肠指诊没有发现包膜外侵犯;患者没有接受过前列腺穿刺、没有接受过经尿道前列腺电切术、没有接受过前列腺癌内分泌治疗等。以上条件将患者进行了限定,具有一定合理性。
3.研究的设计是什么?是否合理?是否得到很好的贯彻?
该文章的研究设计是前瞻性、多中心、自身对照研究。共有16家中心(11家大学医院,2家肿瘤中心,3家私立医院)参加此项研究。所有符合入组条件的患者先行多参数磁共振检查,再在局麻下行系统穿刺以及靶向穿刺(多参数磁共振阴性者仅行前列腺系统穿刺)。研究对系统穿刺的针数(12针),靶向穿刺的针数(每个靶点3针,最多2个靶点)进行了规定。研究方案获得了当地伦理委员会的批准并在临床试验网站上做了登记(ClinicalTrials.gov)。从总体来看,研究设计较为合理。总共251例患者,其中27例违背方案。作者将251例结果与去除违背方案27例的224例结果比较,二者并无差异。
需要着重指出的是,作者采用自身对照,即同一患者既接受系统穿刺,又接受靶向穿刺(当然,多参数磁共振阴性的患者仅接受系统穿刺)。对于前列腺穿刺研究来说,完全可以在同一患者上既进行系统穿刺又进行靶向穿刺,自身对照在控制患者基线一致性方面比随机对照具有更大的优势。由于是自身对照,文章中患者基线数据表格就相对简略。
不过,该文章方案仍然存在以下偏倚:两家医院入组了超过三分之一的患者,比例太高,对于多中心研究广泛代表性有不利影响;前列腺靶向穿刺的机构采用的方法并不一致:5家采用认知融合,10家采用磁共振-超声融合,1家采用认知融合联合超声增强造影;先系统穿刺,系统穿刺引起的局部小出血灶可能会影响靶向穿刺的定位。在大多数研究中,一般是先进行靶向穿刺,再进行系统穿刺。
由此,我们可以体会到研究设计的重要性。好的研究设计能将无关的影响因素尽量去除,能较好地控制偏倚,能较好地得到执行。阅读临床文章,一定重视研究方案的阅读和理解。
4.研究的终点指标是什么?终点指标是否合理?是否采用了替代指标?
该研究的终点指标定义清楚。鉴于临床有意义前列腺癌(clinically significant prostate cancer,csPCa)的定义不统一,作者先做了3个定义:csPCa-A是指IUSP分级组2或以上的患者;csPCa-B指csPCa-A或IUSP分级组1中穿刺针最大肿瘤长度≥6mm的患者;csPCa-C指IUSP分级组3或以上的患者。由此可见,csPCa-B定义最为宽泛,csPCa-C定义最为严格,肿瘤的恶性程度最高,csPCa-A介于中间。研究的主要终点是csPCa-A的检出率,次要终点是csPCa-B和csPCa-C的检出率,临床无意义前列腺癌(IUSP分级组1,且穿刺针最大肿瘤长度﹤6mm)的检出率。研究终点指标非常清楚,文章的结果部分即是围绕主要终点、次要终点来阐述。因为不涉及到长时间随访,不涉及到主要终点获取难度,研究未采用替代指标。
5.统计学方法是否选用合理?
统计学方法最好提交统计专业人员分析,本章节不做深入讨论。
6.文章结论是否可以由结果顺利导出?文章结论是否以偏概全?
文章结果表明对于IUSP分级组2前列腺癌的检查率,系统穿刺与靶向穿刺相同。两者联合的检出率比单独一种方法为高。结论“首次穿刺前多参数磁共振检查有助于提高临床有意义前列腺癌检出率”很自然由结果推导而出。文章结论较为客观。
7.作者指出了本文的局限性没有?包含致命的缺陷吗?
作者在文末指出了本研究的5点不足。作者指出没有进行可以作为诊断“金标准”的模板穿刺。其实,这不能算很大的不足,因为模板穿刺每隔5mm穿刺一针,很多患者不一定能够接受,在大多数研究中并没有采用模板穿刺。研究采用的先系统穿刺,后靶向穿刺的模式值得商榷,最好将顺序交换。
相比之下,不同机构采用的不同靶向穿刺模式倒是本研究的真正不足。虽然有Meta分析表明磁共振直接引导穿刺、认知融合穿刺、磁共振-超声融合穿刺对于临床有意义前列腺癌的检出率相同[2]。不过作为一个可能证明首次穿刺前多参数磁共振检查有临床意义的研究,最好统一靶向穿刺的方案,这样得出的结论才更有说服力。有8例患者,多参数磁共振阳性,但靶向穿刺结果为阴性,反而是系统穿刺发现前列腺癌,其中可能的原因即是靶向穿刺的准确性不够。
8.摘要是否很好地概括了主要内容?文章题目切题吗?
文章摘要很好地反映了全文内容。文章题目很好地反映了文章的主题。
【要点解析】
1.阅读医学文献一定要读原文全文,不能满足于阅读二次利用的文章。
2.研究的临床意义最为重要,重要性甚至高于研究设计。设计再好的研究如果脱离临床实际、不能很好地解决临床实际问题也是空中楼阁。
3.患者的基线一致性往往是影响结果非常重要的原因。
4.重要文章的统计学部分最好由统计专业人士把关。
5.一定要注意文章的结论是否能从结果顺利导出,避免牵强附会。
6.列出文章的优点、不足,全面评价文章。
(宋 刚)
专家述评
近些年,泌尿临床肿瘤学取得了长足的发展,从靶向药物的问世,免疫治疗取得突破,到肿瘤基因位点的明确化,外科手术精准化、微创化,越来越要求泌尿肿瘤医师具备内外兼修的能力。读书、思考、创新是对医师的要求,其中读书的重要性首屈一指。面对海量的文献资源,如何查询相信在今天都不是问题。如何从文献中提取出有用的资源,如何避免混杂信息的干扰,就需要用到文献解析的方法。循证医学是进行文献解析时重要依据。循证医学是指对人群样本进行高质量研究,用数学的方法评估数据利与害的风险,指导临床上对患者的个体化诊断和治疗。用循证医学研究疾病,结论较为可靠,具备指导临床的意义。针对每一篇医学文献,如果能从以下几个方面进行文献解析则会大有裨益。
1.临床意义及创新性。
2.患者基线表格。
3.研究设计。
4.研究终点指标。
5.统计学方法。
6.结果、结论关系。
7.文章局限性。
8.摘要和文题。
任何时候都要牢记:临床意义是所有临床文献的基石。无论研究设计、统计学方法如何变化,临床意义都具有无可辩驳的重要性。这需要医师对于该领域具有较好的了解和掌握。作为新时代条件下的泌尿肿瘤医师,从读书做起,会读书、会思考,最终才能会创新!
(宋 刚)
参考文献
[1] ROUVIÈRE O,PUECH P,RENARD-PENNA R,et al.Use of prostate systematic and targeted biopsy on the basis of multiparametric MRI in biopsy-naive patients (MRI-FIRST):a prospective,multicentre,paired diagnostic study.[J].Lancet Oncol,2018,Nov 20,[Epub ahead of print].
[2] WEGELIN O,VAN MELICK H H E,HOOFT L,et al.Comparing Three Different Techniques for Magnetic Resonance Imaging-targeted Prostate Biopsies:A Systematic Review of In-bore versus Magnetic Resonance Imaging-transrectal Ultrasound fusion versus Cognitive Registration.Is There a Preferred Technique?[J].Eur Urol,2017,71(4):517-531.