基金项目:国家“十一五”科技支撑课题(No.2006BAI04A21-3);国家重大新药创制专项(No.2008ZX09312-021)
作者单位:广州中医药大学临床药理所DME 中心(广州510405)通讯作者:梁伟雄,Tel :020-36585012,E-mail :liangwx@pub.guang-zhou.gd.cn
·临床试验方法学·
以患者报告结局为疗效评价指标时需注意的问题
许卫华
梁伟雄
温泽淮
摘要
患者报告结局(patient-reported outcomes ,PROs )为临床研究者提供了一个很好的从患者角度评价临床效果的途径。笔者介绍了当以PROs 为疗效评价指标时需着重注意的问题,包括PRO 测量量表的选择、测量实施过程中质量控制、测量结果的解释以及PRO 指标的适用范围。
关键词患者报告结局;量表;质量控制;疗效评价
Problems to Pay Attention to in Taking Patient-reported Outcomes as Clinical Outcomes Assessment
XU
Wei-hua ,LIANG Wei-xiong ,WANG Qi ,et al DME Center ,Guangzhou University of Chinese Medicine ,Guangzhou
(510405)
ABSTRACT
Patient-reported outcomes (PROs )provide clinical researchers with a good means to assess
patient-based outcomes.Yet there are still some problems to pay attention to while using PROs as an
effective-ness assessment index ,including the selection of an appropriate scale of PRO ,quality control in PRO data col-lection ,and the interpretations and application ranges of the PRO results.
KEYWORDS
patient-reported outcome ;scale ;quality control ;clinical outcomes assessment
根据不同的信息来源,临床干预结局评价指标包
括基于医生的结局评价(clinician-based outcomes )和基于患者的结局评价(patient-based outcomes )两大类。基于医生观点的结局评价主要是从医生角度根据实验
室或仪器检查结果、体格检查、功能测试、临床观察等对结局做出判断。而基于患者的结局评价则从患者的角度考察其最关心的问题的变化情况,如症状的改善、功能的恢复及健康相关的生活质量等。相对而言后者的主观性要大于前者,它们均从不同的角度为临床疗效判断提供依据。
随着疾病谱的改变、医学模式的转变以及WHO 健康定义的提出,基于患者的结局评价越来越受到重视。基于患者的结局评价信息收集主要是通过患者报告结局(patient-reported outcomes ,PROs )量表来完成的,对PROs 量表的选择、应用、测量结果的解释恰当与否是正确评价基于患者结局的关键,也是正确评价
干预措施效果的关键。因此以PROs 为疗效评价指标时需着重考虑以下几方面的问题。
1PROs 量表的选择
近几十年来PRO 渐成为人们研究热点,
涌现出大量的PROs 量表。如法国MAPI 研究机构所建立的“Patient Reported and Quality of Life Instruments Data-base (PROQOLID )”目前为止就收录了470个量表,其中普适性量表就多达99个。如何在现有众多的量表中选择1个合适的PROs 量表是研究者首先面临的问题。有学者提出选择量表的8个标准
[1]
:(1)适用性
(appropriateness ),(2)信度(reliability ),(3)效度(va-lidity ),
(4)反应度(responsiveness ),(5)精确度(preci-sion ),(6)可解释性(interpretability ),(7)可接受性
(acceptability ),(8)可行性(feasibility )。这些标准其实也是编制量表时评价其心理测量学特性和应用性的指标。对于一个较成熟的量表来说,信度、效度以及可接受性和可行性多能达到量表的一般要求,
而且在介绍量表特性时均会提供量表的信度、
效度指标的大小,研究者只要查阅相关文献即可获取这方面的信息。因
此在选择PROs 量表时着重点可放在“适用性”方面,从以下几方面考虑:(1)拟选用的量表编制目的是否
与研究者用于疗效评价的目的一致。因为不同的编制目的对量表心理测量学特性要求不尽相同,
用于疾病诊断及鉴别诊断的量表要求有较好的区分效度,能够较准确地区分目标患者与非目标患者以及疾病不
同严重程度;用于预测的量表要求有较好预测能力,能较准确地预测患者的不同结局;而用于效果评价的量表更测重于反应度灵敏性的考察。(2)拟选用量表测量的概念操作化定义是否与研究者对所测指标内涵诠释相似。根据心理测量学原理和方法,量表理论框架的形成是建立在对测量概念操作化定义之上的。不同的测量概念操作化定义则有不同的量表理论框架,最终对测量结果的解释也不完全相
同。如疲劳是一个常见的非特异临床症状,它既可见于正常人,也可是如癌症、帕金森氏病等疾病的临床表现,还可以是某些措施的不良反应。至今为止至少有超过30个疲劳测量量表[2],由于各量表作者对“疲劳”操作化定义的不同,导致这些量表的理论框架各异。如“The Brief Fatigue Inventory(BFI)”[3]将“疲劳”定义为是癌症患者的临床症状,因此量表只有关于疲劳严重程度1个维度。而同样用于癌症患者的“Fatigue Symptom Inventory(FSI)”[4]并不将“疲劳”局限于1个症状,因此除测量疲劳严重程度外,量表还包括了疲劳出现的频率及对日常生活能力、工作能力、精力集中能力等方面的影响。(3)拟选用量表适用人特征与待测人特征是否相似。按量表的适用人可将量表分为普适性和特异性量表两类。普适性量表可适用于不同健康状态的人,如SF-36、WHO-BREF。特异性量表用于特定临床状态人,如用于癌症功能评价的FACT(functional assessment of cancer therapy)。研究者如选用普适性量表作为疗效评价指标时,最好有以往该量表用于待评测目标疾病的相关心理测量学指标证据。如拟用SF-36用于评价类风湿性关节炎患者,则最好有SF-36用于类风湿性关节炎患者测量的信度、效度支持证据。
量表的语言以及版权问题也是研究者在选择量表时需要考虑的因素。尽管目前量表数目繁多,但多为英文,其中同时具有中文版的较少。即使有中文版的亦有大陆版、香港版、台湾版的区别。如PROQOLID 中收录的15个疲劳测量量表中仅有3个有中文版(http://www.proqolid.org)。建立外文量表的中文版并不能简单地认为将外文翻译为中文即可,这需要经过多次翻译与回译、文化调适及各项心理测量学
指标验证等一系列复杂的过程[5]。当确定选用某一量表时,需取得版权所有者同意。这一方面是对版权所有者知识产权的尊重,另一方面可从版权所有者处获得更详细的有关量表的信息。
量表可行性和可接受性主要指量表是否能在较短的时间内完成,问题条目是否清晰易于理解,是否会引起患者的不安,量表的布局是否易于填写等[1]。虽然量表的Cronbachα系数随着量表条目数和答案设置级数的增加而增加[6],但同时也会使量表的可行性和可接受性下降。因此在选用量表时也需加以考虑。
2PROs数据收集及质量控制
PROs数据收集方式主要有患者自填和访谈两种。患者自填是指PROs量表由患者自己填写完成。提供给患者的多为纸质版量表,亦有电子版。而访谈方式是指由调查员将量表问题逐一询问患者并根据其回答完成量表填写。访谈形式包括面对面访谈、借助语音应答系统访谈和调查员通过电话进行访谈。
WHO将PRO定义为任何直接来自于患者的、非经医生及其他人解释的关于患者自身的健康状况的报告[7]。这些与患者自身健康相关的报告可涉及许多方面,如患者的症状、身体功能、生活质量及对接受满意程度等。PROs量表反映的多是患者的主观感觉,是难以用具体的度量单位来衡量的软指标,因此在数据收集过程中尤其应重视质量控制。临床研究中对PROs资料收集工作往往由多个调查员来完成的,无论是采用患者自填方式还是访谈方式,均需重视调查员的培训,以保证每个调查员均能采
用标准化的方式收集PROs资料。对调查员的培训内容可包括:(1)介绍本次研究的目的、内容、实施计划等,以使他们对该项工作有一个整体性的了解,并掌握整个调查流程。(2)如何介绍自己,以使被访患者信任并接受自己。(3)如何向患者介绍填写量表的目的及重要性,使患者乐于参与。(4)如何指导患者填写量表,如强调根据自身情况真实填写以及测量的时间跨度等。(5)采用访谈法时如何用统一标准化的方式(如语速、语气、各条目备选答案间的时间间隔等)向患者朗读量表条目及备选答案,注意避免采用诱导的语言或语气。(6)对量表各条目涵义的理解,以便当患者有疑问时按统一的理解解答。(7)模拟调查。
测量数据的缺失有可能导致选择性偏倚和把握度降低[8],且量表测量的是患者当时的感受,一旦漏填事后难以弥补,所以在实施量表测量时应尽量避免条目应答缺失。条目应答缺失的原因有多种,如患者因身体的原因而无法应答、患者认为问题与其健康无关或过于敏感而拒绝回答,或是因为量表条目过多、字体过小、编排过密等。在回收PROs量表时调查员应认真检查是否有漏填项,如有则提醒患者补填,如患者仍拒绝则给予记录,以便将来数据分析时评估缺失数据对结果的影响。如采用的是纸质版量表由患者自填时,在量表格式布局上也要加以注意,如受访者包括中老
年人则量表尽量采用小四号字体以上、1.5倍行距、单面的格式。另外,给患者提供良好的调查环境回访的时间间隔尽量与复诊的时间间隔一致等也是提高应答率的有效质量控制措施。
3PROs量表测量结果的解释
以患者报告结局为临床疗效评价指标的主要目的是通过比较量表得分变化情况,从而得出某项干预措施的效果。对于一个最高得分为100分、得分越高提示患者健康状况越好的正向量表,当量表得分前后平均差值较对照组提高了2分并具有统计学意义时是否就意味着有效?当然不是!对于一个结果的解释关键在于它的临床意义,如果量表得分的提高对患者来说并不能感觉到健康相关状况的改善,那么这种分值的变化是毫无临床意义的,自然也就不能下有效的结论了。一般而言,临床医生很难想象量表得分变化5分、10分的临床意义有多大,因此有学者提出最小重要差异(minimal important difference,MID)这一概念。MID是指患者察觉的获益或有害的最小的量表得分差异,这一差异将导致措施的改变[9]。目前确定MID的方法有锚定法(anchor-based method)、分布法(distribution-based method)和经验法[10]。锚定法先确定某一外部指标具有重要意义的最小变化标准,然后计算符合这一标准的患者其量表得分平均变化差值,这一差值就是根据这一外部指标而确定的PRO量表的MID。外部指标可以是医生评价、实验室检查结果或是患者对自身健康总体评价等。例如Osoba等[11]根据患者总体评价为“略微好转/变差”为外部评价标准,判断EORTC QLQ-C30量表的MID为5分的变化值。分布法是基于观察样本的量表得分分布来估计MID,常用的指标有效应量(size effect)、测量的标准误(standard error of measurement,SEM)等。经验法指借助德尔菲(Delphi)方法或相关系统评价来确定MID。
3种方法中只有锚定法是估计MID的直接的、同时也是最重要的方法。而锚定法估计MID的关键是外部指
标的选择及其具有最小临床意义的切点的划分。外部指标可以基于医生观点或是基于患者观点的结局指标,应与疾病症状相关并有与PROs测量结果有关联的证据[10]。通常需设定多个外部指标,以便根据各外部指标估计的MID参照互证,并得出一个MID 范围,从而评估MID的精确性。
值得注意的是同一PRO量表其MID值可因患者疾病严重程度、人口特征及接受的干预不同而不同[12],每个研究均可得出一个基于研究自身特性的MID范围,因此并不能过度依赖以往研究结果。鉴于此,为了能较准确的解释量表测量结果,在研究设计时需确定用什么方法来估计MID,当然最好选择锚定法,也可与分布法联合使用(因为并不增加数据收集的工作量),根据疾病特点精心选择外部参照指标并事先确定MID的分界标准。
4PRO指标的适用范围
整体观的思想始终贯穿于中医疾病的整个过程中,其不仅仅注重疾病,更注重患病的“人”。不单单强调疾病驱体症状的减轻或消除,更强调对患者心身整体平衡的调节。这一点与PRO理念提出的出发点是一致的。因此将PRO作为中医药疗效评价指标是完全可行的。PRO的正确使用应能够弥补仅采用单一的客观疗效指标的不足,从而较全面准确地反映中医药的效果。尽管如此,亦需清楚地认识到不是所有疾病干预措施的评价都适合使用PRO这一指标的,而且如前所述,PRO数据的收集与比较结果的解释均较客观指标困难。故应根据研究目的和疾病特点,结合中医药的优势恰当运用PRO这一疗效评
价指标。一般而言,作为疗效评价指标PRO较适合以下几种情况:(1)某些慢性疾病虽有公认的客观疗效评价指标,但不能全面反映的效果。如支气管哮喘干预措施的评价指标有1s用力呼气容积占预计值的百分率和最大呼气峰值流速等客观指标,但这些只能反映对患者的躯体状况的影响,不能反应其对的感受,如对糖皮质激素副作用的担忧。(2)某些疾病本身缺乏客观指标而是以一组症候为临床表现,如慢性疲劳综合征。(3)的目的是改善与某种疾病或相关的患者自觉症状,且这些自觉症状也是患者迫切希望改善的或是其就诊的主要目的之一,如肿瘤患者放疗后的口干、纳差、疲乏等。(4)为了解患者对的总体满意度。另外鉴于PRO信息来源的特点,某些疾病由于患者无法清晰准确地表达自身感受则不宜使用PRO指标,如痴呆。
PRO为我们提供了一个很好的从患者角度评价临床效果的途径。然而PRO量表收集的是患者某一时点与自身健康相关的报告,具有不可回溯性且多属软指标,容易受到测量偏倚、期望偏倚等影响,因此在研究的设计、实施阶段以及结论的推导过程均需注意对各种偏倚的控制。精心挑选与研究目的相符并有良好心理测量学特性的量表、重视测量过程中的质量控制、确定能真实反映测量结果的MID是患者报告结局效应指标真实性的重要保障。
(下转1145页)
中医术语英译是一项艰巨并富有挑战性的工作。它要求译者既要精通英语又要熟悉中医基础理论,也只有这样才能正确翻译中医术语,更好更快地促进中医的对外传播与发展。
参考文献
[1]柴可夫,张庆荣.中医基础理论[M].北京:人民卫生出版社,2007:300.
Chai KF,Zhang QR,editors.Fundamental theory of tradi-
tional Chinese medicine[M].Beijing:People's Medical
Publishing House,2007:300.
[2]刘燕池,刘占文.中医基础理论[M].北京:学苑出版社,1998:279-280.
Liu YC,Liu ZW,editors.Basic theory of traditional Chinese
medicine[M].Beijing:Academy Press,1998:279-280.[3]金魁和.汉英医学大辞典[Z].北京:人民卫生出版社,2004:1789,1858,1862,1898.
Jin KH,editor.Beijing:Chinese-English medical dictiona-
ry[Z].Beijing:People's Medical Publishing House,
2004:1789,1858,1862,1898.
[4]Wiseman N.英汉汉英中医辞典[Z].长沙:湖南科学技术出版社,1996:489,603,609,666.
Wiseman N,editor.English-Chinese/Chinese-English dic-
tionary of Chinese medicine[Z].Changsha:Hunan Scien-
tific and Technical Publishers,1996:489,603,609,666.[5]谢竹藩.新编汉英中医药分类辞典[Z].北京:外文出版社,2002:213.
Xie ZF,editor.Classified dictionary of traditional Chinese
medicine[Z].Beijing:Foreign Languages Press,
2002:213.
[6]欧明.汉英中医辞典[Z].广州:广东科技出版社,1986:503,389,535,425.
Ou M,editor.Chinese-English dictionary of traditional
Chinese medicine[Z].Guangzhou:Guangdong Scientific
and Technical Publishers,1986:503,389,535,425.
[7]WHO International Standard Terminologies on Traditional Medicine in the Western Pacific Region.http://www.
wpro.who.int/NR/rdonlyres/14B298C6-518D-4C00-
BE02-FC31EADE3791/0/WHOIST-26JUNE-FINAL.pdf [8]彭勃,谢建.中医内科学[M].北京:人民卫生出版社,2007:217.
Peng B,Xie JQ,editors.Internal medicine of Chinese
medicine[M].Beijing:People's Medical Publishing
House,2007:217.
[9]Mish FC.Webster's ninth new collegiate dictionary[Z].Massachusetts:Merriam-Webster Inc,1987:1171.
(收稿:2010-09-30修回:2011-03-03)
(上接1137页)
参考文献
[1]Fitzpatrick R,Davey C,Buxton MJ,et al.Evaluating pa-tient-based outcome measures for use in clinical trials[J].
Health Technol Assess,1998,2(14):1-4.
[2]Dittner AJ,Wessely SC,Brown RG.The assessment of fa-tigue:a practical guide for clinicians and researchers[J].J
Psychosom Res,2004,56(2):157-170.
[3]Medoze TR,Wang XS,Cleeland CS,et al.The rapid assess-ment of fatigue severity in cancer patients:use of the Brief Fa-
tigue Inventory[J].Cancer,1999,85(5):1186-1196.
[4]Hann DM,Jacobsen PB,Azzarello LM,et al.Measure-ment of fatigue in cancer patients:development and valida-
tion of the Fatigue Symptom Inventory[J].Qual Life Res,
1998,7(4):301-310.
[5]方积乾.生存质量测定方法及应用[M].北京:北京医科大学出版社,2000:62-69.
Fang JQ.Measurement and application of quality of life[M].
Beijing:Beijing Medical University Press,2000:62-69.[6]安胜利,陈平雁.量表的信度及其影响因素[J].中国临床心理学杂志,2001,9(4):315-318.
An SL,Chen PY.Measurement scales:reliability and affect-
ing factors[J].Chin J Clin Psychol,2001,9(4):315-318.[7]WHO.Guidance for industry patient-reported outcome mea-
sures:use in medical product development to support labe-
ling claims.Geneva:WHO;2009.12.http://www.fda.
gov/downloads/Drugs/GuidanceComplianceRegulatory-
Information/Guidances/UCM193282.pdf
[8]Fayers PM,Hays RD,editors.Assessing quality of life in clinical trials:methods and practice[M].Oxford:Oxford
University Press,2005,167.http://books.google.com.
hk/books?id=wWRLN5U9-3YC&printsec=
frontcover&dq=Assessing+quality+of+life+in+clinical
+trials:+methods+and+practice&source=bl&ots=
P8PKNGw36X&sig=Snyg1apIKN8GmeG-ilBj0bnOle4&hl
=en v=onepage&q&f=false
[9]Guyatt GH,Osoba D,Wu AW,et al.Methods to explain the clinical significance of health status measures[J].
Mayo Clin Proc,2002,77(4):371-383.
[10]Revicki D,Hay RD,Cella D,et al.Recommended meth-ods for determining responsiveness and minimally important
differences for patient-reported outcomes[J].J Clin Epide-
miol,2008,61(2):102-109.reported
[11]Osoba D,Rodrigues G,Myles J,et al.Interpreting the significance of changes in health-related quality of life
scores[J].J Clin Oncol,1998,16(1):139-144.
[12]Revicki DA,Erickson PA,Sloan JA,et al.Interpreting and reporting results based on patient-reported outcomes
[J].Value Health,2007,10(Suppl2):S116-S124.
(收稿:2010-12-19修回:2011-04-13)