Skip to content

EHP Chinese Edition

EHP 中文版

导航指南系统评价方法学: 一种将环境卫生科学转化为良好健康结局的严格而透明的方法

March 10, 2016 评论 Comments Off on 导航指南系统评价方法学: 一种将环境卫生科学转化为良好健康结局的严格而透明的方法

Tracey J. Woodruff, Patrice Sutton

美国加利福尼亚州,奥克兰,旧金山,加利福尼亚大学生殖健康与环境项目

PDF格式


背景:将已知的与健康相关的环境因素进行综合分析将有助于采取预防为主的行动。环境卫生中通常使用的研究综合法与最近20年来在临床科学中发展起来的系统评价法相比已经滞后。

目的:我们试图开展一种系统而透明的环境卫生研究综合法-“导航指南” 法的概念验证。

讨论:“导航指南”法以循证医学与环境卫生研究综合的最佳实践为基础。与目前盛行于环境卫生的专家陈述性评价法不同的关键点是:预定方案、涵盖专家意见在内的标准化而透明的文件的制定、全面检索策略、“风险偏倚”评估,以及将科学与价值观和偏好分开。不同于循证医学的关键点包括将人类观察性研究评级为质量“中等”证据,并将多种证据源结合起来。

结论:“导航指南”法是一种系统而严格的研究综合法,而研究综合法是为减少环境卫生信息评价中的偏倚并使其最大程度地透明化而开发的一种方法。尽管该方法的新颖点尚需进一步开发与验证,我们的已经结果证明国家毒理学项目正在开发的、以及美国环境保护署考虑开发的改良研究综合法是完全切实可行的。系统而透明评价方法的制度化将为科学与及时预防危害行动的衔接提供具体机制。


前言

缩短从科学发现到改善健康结局的时间是一种迫切需求。环境有毒化学物的人群暴露无处不在[Centers for Disease Control and Prevention (CDC) 2014; U.S. Environmental Protection Agency (EPA) 2013c], 此类化学物暴露引起的不良健康结局十分普遍,且在增长之中(Newbold and Heindel 2010; Olden et al. 2011; U.S. EPA 2013c; Woodruff et al. 2010; World Health Organization and United Nations Environment Programme 2013)。业已明确证实,将科学发现转化为预防危害的行动可获得卫生效益与经济效益。例如,去除汽油中铅的全球努力已经产生了估计每年达24,000亿美元的卫生与社会效益(Tsai and Hatfield 2011);根据1990年空气清洁修正法实施的项目,空气质量得以改善,其价值,包括早逝与疾病减少以及经济福利与环境状况的改善,到2020年将达到20,000亿美元(U.S. EPA 2011)。然而,因科学转化为行动的延缓,白白浪费了许多潜在效益(European Environment Agency 2013)。由于目前化学品监管结构的缺陷,疏于采取科学行动或者行动延缓,这意味着当危害证据增加时,有毒化学物的暴露已经持久存在(Vogel and Roberts 2011)。

不采取行动或者推迟采取预防有害环境化学物暴露的行动,并非是一种无关紧要或者中性的政策选择。例如,2008年美国卫生保健系统用于治疗有毒环境暴露相关儿童疾病的开支估计超过760亿美元(Trasande and Liu 2011)。如果暴露普遍存在,即使不去预防低水平的环境暴露也会对全社会产生巨大的不良健康后果 (Bellinger 2012)。

就科学为预防危害公共政策提供信息这点来说,以一种透明而系统的方式,将已知的与健康相关的环境因素进行综合研究的健全的方法,是使科学变为行动的必不可少的基本步骤。科学体量大且质量各异,很大程度上是政策制定者所不熟悉的。危害的早期预警信号可能会被碎片化信息、以及复杂而有时互相矛盾的特性所掩盖,最终削弱我们采取明智行动的能力。然而,关于环境卫生科学如何转化为有证据力的结论,一直以来缺乏统一且透明的规则与描述工具 [Beronius et al. 2010; Gee 2008; National Research Council (NRC) 2009, 2011]。

今天,环境卫生中盛行的研究综合法与40多年前临床医学的情形很相似,当时临床科学主要依据专家陈述性评价来推荐治疗决策(Rennie and Chalmers 2009)。Antman等(1992) 1 9 9 2 年发表在美国《医学学会杂志》(Journal of the American Medical Association )的里程碑式论文,通过比较发表于学术期刊与临床教科书上对心肌梗死的专家治疗建议,与多个随机对照临床试验统计学分析的综合结论,证明了系统评价法的优越性。Antman等人证明专家的建议未能与实验证据及时结合,并证明部分专家评价并未提及有效的治疗方法,而另一些专家推荐的疗法则被证明是无效甚至危险的。

由此,应用专业知识对一个具有清晰定义的问题进行严格、透明和系统性评价的方法产生了。这些方法现今包含在一些经过经验证明卓有成效的方法中,诸如Cochrane协作网(Higgins and Green 2011)与建议评估、发展与评价的分级(Grading of Recommendations Assessment, Development and Evaluation, GRADE) (Guyatt et al. 2008b)。这些方法经常用以指导数十亿美元的卫生保健决策,以实现节省开支并优化健康结局的目的(Fox 2010)。Howells等(2012)估计,临床前证据(例如药物临床试验前的动物研究)的系统评价与荟萃分析的应用,能减少治疗中风药物的开发成本达11~79亿美元之巨。由于提高了药物是否进入临床试验决策证据的有效性,研发成本大为降低。预计美国卫生保健政策会越来越多地依赖于系统评价法;例如,卫生保健改革方案已拨款11亿美元用于有效性的比较研究 (CDC 2009)。

环境卫生领域正步入一条类似的道路。如同科学证据的评价可用于临床医学的治疗决策一样,科学证据的评价也是国家和地方政府机构以及企业界进行环境化学物暴露决策的不可分割的一部分。然而,评价环境卫生证据所使用的主要方法已有30多年历史,其依据是专家意见,且有特别的例外,即除癌症外通常不提供结局的证据强度摘要(Department of Health and Human Services 2006; National Toxicology Program 2013; U.S. EPA 2013b)。美国国家科学院通过《邻苯二甲酸盐与累积风险评估:未来的任务》(Phthalates and Cumulative Risk Assessment: The Task Ahead )(NRC 2008)以及《科学与决策:推进风险评估》(Science and Decisions: Advancing Risk Assessment )(NRC 2009)等文明确表示,改良风险评估法能够更好地反映我们目前对于科学的理解。系统性循证决策的方法能提高我们满足决策者需求的能力。目前国家毒理学项目也在使用这种方法(Rooney et al. 2014),而美国EPA(NRC 2011, 2014a, 2014b)正在考虑使用。以下叙述的是一种系统而透明的环境卫生评价新方法的应用结果,证实了这些进展不仅令人满意而且在我们掌控之中。

讨论

“导航指南”法概述

为加速开发预防有害环境暴露的循证建议,自2009年开始,科学家们与临床医生们着手合作开发系统评价的“导航指南”法。“导航指南”法的开发将临床科学使用的系统评价方法,与国际癌症研究机构使用的研究综合“底线”方法(IARC 2006)结合起来。临床医学使用的系统评价的特点包括提出一个明确的研究问题、进行全面检索、根据前后一致的标准评定证据的质量与强度,并执行荟萃分析以及其他统计学分析。IARC的方法允许将人类与非人类证据的结果综合为一个简明扼要的健康危害情况说明(Woodruff et al. 2011)。

这样,“导航指南”法将过去20年循证医学的成果转化到环境卫生中。

“导航指南”法由以下4个步骤组成:

1. 提出研究问题:提出一个与决策者相关的具体问题,关于人类暴露于一种或一组化学物或其它的环境暴露是否是一种健康风险。

2. 选择证据:对已发表和未发表的证据进行系统检索并记录下来。

3.对证据的质量与强度进行评级:根据预先设定的、透明的标准,评价个体研究的质量以及证据的总体质量。“导航指南”法对人类和非人类证据进行分别评级。因此,该方法包含了将这两类证据中每类证据的质量评价整合起来的额外步骤。最后的结果是关于证据总体强度的五种可能陈述之一:“已知有毒”,“很可能有毒”, “可能有毒”,“无法分类”,或者“很可能无毒”。

4. 对建议强度进行分级:我们是开发该“导航指南”法的科学家团队成员之一,对于“全氟辛酸(PFOA)发育期暴露影响胎儿生长吗?”这一问题,我们应用了步骤1~3进行评价(Johnson et al. 2014; Koustas et al. 2014; Lam et al. 2014)。该方法的步骤4, “建议的强度分级,”涉及毒性证据强度(来自步骤3)与暴露信息的整合,较低毒性替代物的可得性,以及患者的价值观与偏好。由于我们的资源有限,PFOA案例研究未涉及到该步骤。下面我们重点讨论该方法对环境卫生领域的全新特点,及其不同于循证医学所使用方法的特点,比较“导航指南”法与先前PFOA暴露和毒性评价结果的异同,讨论“导航指南”法的局限性以及今后的方向。

“导航指南”法对环境卫生评估的全新特点

为启动“导航指南”法的开发工作,我们组建了来自政府和非政府组织以及学术界的22人新型跨学科团队(Woodruff et al. 2011)。该队两名成员,Daniel Fox (米尔班克纪念基金会名誉总裁)和Lisa Bero (现为Cochrane协作网共同主席)是世界知名的临床科学系统评价方法学专家。七名成员为科学家或者环境健康倡导者,他们来自国际、全国、州和当地政府机构, 以及一个开发应用有证据力结论进行环境化学物决策的非政府组织, 他们是:David Gee(欧洲环境署), Vincent James Cogliano (IARC), Kathryn Guyton (美国环保署),Lauren Zeise (加利福尼亚环境保护署),Julia Quint (加利福尼亚公共卫生署,退休),Karen Pierce (旧金山公共卫生署)以及Heather Sarantis (Commonweal)。十一名成员有妇女、生殖、儿科学和/或环境卫生领域的专家:他们是Jeanne Conry (美国妇产科学会第九区和凯萨医疗机构), Mark Miller (加州大学旧金山分校儿科环境卫生系),Sarah Janssen (自然资源保护委员会),Beth Jordon和Rivka Gordon (生殖卫生专业协会), Sandy Worthington (美国计划生育联合会),Pablo Rodriguez(布朗医学院和罗德岛妇婴保健医院),Michelle Ondeck 和Judith Balk(匹兹堡大学),Victoria Maizes (亚利桑那大学)及Ted Schettler (科学和环境卫生网)。此外,我们自己的专家有在环境与职业卫生以及公共政策交叉部门工作数十年所积累的专业经验。本方法发表时,所有合作者均申明无竞争性经济利益。

为首次应用“导航指南”法,我们组成了一支九名科学家团队,团队成员来自学术界和美国环保署,专业领域包括环境卫生科学、流行病学、毒理学、风险评估、生物统计学以及系统评价科学(Johnson et al. 2014; Koustas et al. 2014; Lam et al. 2014)。一名团队成员,Karen Robinson (约翰霍普金斯大学循证实践中心主任)是证据确认、综合及提交方面的专家,为卫生保健决策与研究提供信息;三名团队成员,Patrice Sutton, Erica Koustas及Paula Johnson曾受过Cochrane和/或GRADE方法学的正规训练。该评价团队均申明无竞争性经济利益。

以上跨学科团队开发与应用的“导航指南”法,是基于循证医学与环境卫生的最佳研究综合实践。“导航指南”法区别于目前环境卫生专家陈述性评价法的关键点有以下几方面。

1 . 方案:在进行评价前制定一份详细方案,以指导“导航指南”的应用(图1)。与之相反,基于专家的陈述性评价法并不提供一份含有预定问题与评价“规则”的文件。一份预定的方案是临床科学系统评价的主体, 因为它减少了评价者的偏倚影响,为方法和程序提供了透明度,减少了重复的可能性,并允许对预定方法进行同行评审(Higgins and Green 2011)。尤其是该方案还提供了一个透明的论坛,综合了受影响人群及健康倡导者等非科学家的意见,提出一个有意义的研究问题。该方案的制定围绕一份“PECO”清单[研究对象、暴露、比较方法与结局]进行,提供据以识别和选择纳入研究的框架。PECO清单类似于美国国家科学院为改进风险评估设计而提出的建议,即通过计划、调查与问题形成,更好地满足决策者需求(NRC 2009)。

2 . 标准化和有透明度的文件包括了专家审核:系统评价并非“自动操作”或者“计算机控制”,或没有经过经审核(Guyatt et al. 2011)。不同于目前环境卫生科学中专家评价法的根本性改变是,“导航指南”的每一步都以周密、前后一致和透明的方式进行,包括审核在内的所有信息均以同样方式记录在案并显示出来。总之, 决策的合理性是可跟踪、可复制、可理解。

3 .“偏倚风险”评估:“偏倚风险”的定义是一项研究具有可在结果的量级或方向上引入系统误差的特点(Higgins and Green 2011)。“偏倚风险”评估是环境卫生的新概念。系统评价法将可在结果量级或者方向上引入系统误差(即偏倚风险或“内部效度”)的研究质量标准与其它方法学质量或报告元素区别开来,后者是实施(例如,遵守受试人及动物保护的要求)或报告(如提供完整信息)一项研究的重要标准,但不会系统性地影响研究结果。一项按最高方法学标准实施的研究仍会有影响该研究结果量级或方向的重要偏倚风险。

偏倚风险域已经开发得很好,并且实践证明偏倚风险会影响人类实验性研究的结果(Higgins et al. 2011; Roseman et al.)。然而,却缺乏同样适用人类观察性研究的偏倚风险域。在PFOA案例研究中,我们把观察性人类研究的偏倚风险域建立在Cochrane协作网与卫生保健研究及质量机构所使用的域的基础上(Higgins and Green 2011; Viswanathan et al. 2012),包括招募策略、盲化、混杂、不完全结果数据, 选择性报告及暴露评估。

动物研究的偏倚风险域也在开发之中。尽管在评价动物研究质量的环境卫生文献中已确定了30项工具,但它们主要由与报告要求相关的域构成,例如符合法规要求,统计模型描述,以及实验动物情况;重要的是, 它们未包括人类实验性研究使用的所有的偏倚风险域(Krauth et al. 2013)。

为了开发将“导航指南”应用于动物研究的偏倚风险域,我们对有实践经验基础的人类实验性研究所使用的偏倚风险域进行了改编,包括a) 序列生成, b)隐蔽分组,c)盲化,d)不完全结果数据,以及e)选择性报告[见Johnson 等(2014)图1与Koustas等(2014)图1]。根据GRADE,这五项标准几乎涉及人类实验性证据质量的所有问题(Balshem et al. 2011)。而且,临床前动物文献已证实这些元素可影响研究的结果(Vesterinen et al. 2010)。我们的理由是非人类实验中的偏倚风险与人类和临床前动物实验的偏倚风险相似。

此外,在人类与动物研究中,我们均纳入了“利益冲突”偏倚风险域。Cochrane和GRADE曾提议(但尚未被采纳)该风险域为重要偏倚风险(Bero 2013)。这是基于烟草对健康的影响(Barnes and Bero 1997, 1998), 药物的安全性与疗效(Bero et al. 2007; Lexchin et al. 2003; Lundh et al. 2012)以及医疗程序(Popelut et al. 2010; Shah et al. 2005)等研究的实验数据,所有这些研究都表明,通常资金的来源影响着研究的结果。

PFOA案例研究中偏倚风险的评估揭示了环境卫生中实验动物研究的实施与报告中令人担忧的事实。尤其是,我们发现纳入的毒理学研究普遍未应用经实践公认的、能够使人类实验研究结果偏倚最小化的方法学对策。尤其是,没有一项研究报告过他们是否和如何应用合适的隐蔽分组, 不管这些研究是否是由企业、或独立研究实验室按最佳实验室管理规范(GLP)进行。临床前文献中实验动物研究的设计与报告未达标的情况非常普遍,给研究结果带来了偏倚。例如,荟萃分析与实验性研究数据评价联合法协作组(CAMARADES)进行的研究表明,相比于其它研究,使用随机化和隐蔽分组的研究报告中NXY059 药物治疗局灶性出血动物模型的心脏反应指标改善得较少(Macleod et al. 2008),并且脑内出血动物模型的神经行为学评分改善较少(Frantzias et al. 2011)。

在我们有关“导航指南”的推广工作中,我们发现众多不同背景的环境卫生研究者报告说,旨在降低毒理学研究中偏倚的方法对策并未得到广泛认可或成为惯例。

PFOA案例研究中对进行偏倚风险评估和定量分析的第二项挑战是:已发表的研究并未报告所有的必要数据。我们联系研究作者以获取所需数据的努力取得了一定的成功[即联系到的28名作者中18名(64%)有回应],这对我们进行该评价的能力至关重要。我们预期在由学术期刊、基金机构、研究注册机构采取行动对报告进行标准化之前,联系研究作者对系统评价者来说仍将是一项必不可少步骤。我们的研究结果指出,改进必要数据的获取途径对于实施科学的、健全的环境卫生科学评价的急迫性(Goldman and Silbergeld 2013),以及改进实验动物研究设计和报告对环境卫生评价工作的重要性(Landis et al. 2012; van der Worp and Macleod 2011; Vesterinen et al. 2011)。

4 . 全面有效的检索策略:导航指南检索法的结果证明,系统评价具有比传统评价更全面的潜力。对于“PFOA健康影响”的评价,我们运用“导航指南”法,比专家组评价法(C8 Science Panel 2011)多评估四项研究。C8专家组未公开收集数据所使用的检索策略。然而,由于这四篇论文没有提供对于评价结论必不可少的数据(即,数据源自小型研究,在荟萃分析中没有占很高权重),本可以被C8专家组纳入的这些论文却未被列入他们的参考文献。我们的全面检索策略捕捉到了PFOA暴露测定值以及胎儿生长发育参数,但是并不能得出两者间的关系。纳入我们评价的这四项额外研究并没有出生体重或胎儿生长指标作为该论文的主要结局或主题(Fromme et al. 2010; Kim S et al. 2011; Kim SK et al. 2011; Wang et al. 2011)。然而,由于我们的检索确认了以上研究,我们纳入了这些研究,联系到研究作者,并从其中两项研究的作者处获得了支持我们评价的更多相关数据(Fromme et al. 2010; Kim S et al. 2011)。经一名作者(Wang et al. 2011)介绍,我们参考了当时正在同行评审、有更多相关数据的同一批研究对象的文章(Chen et al. 2012)。与我们之前非系统文献综述纳入的研究相比,我们多确认了10项非人类研究。通过采用临床前文献使用的动物研究检索过滤器(Hooijmans et al. 2010),极大地加快了开发相关动物研究的检索。

由于PECO清单的开发应用,我们制定出了用于有效筛选标题和摘要的非常明确的标准,加之应用了能使筛选过程提速的程序软件,我们发现对相关研究进行撒网式检索是可行的。就此案例研究而言,我们的检索策略确认了2000多项非人类和3000项人类的潜在相关研究。对于人类数据,一个人花了一天筛选标题与摘要(得到248篇符合全文评价的文章),花了一周时间做全文评价,确认了18项供评估的相关研究。非人类数据的评估时间与之类似。

此外,通过应用一种“提取完全相同信息,以同样透明方式展示”的方法,我们解释和理解研究结果的能力得以提高。随着系统评价应用的扩大,我们预期,通过诸如开发改良检索过滤器、筛选和管理系统,可以获得更高效率。

5. 将科学与价值观和偏好分开:PFOA案例研究演示了“导航指南” 法的步骤1~3,得出关于PFOA毒性的简要评价。然而,毒性仅是环境卫生风险管理决策中的一个方面。在“导航指南”法的步骤4中(效仿GRADE 对治疗建议的评级)(Guyatt et al. 2008a),包含了对预防建议有影响的其它重要因素,例如价值观与偏好、暴露程度、较安全替代选择的可得性,以及成本与效益等。因此,“导航指南”透明而明确地将科学从其它重要影响因素中分离出来。尽管在PFOA案例研究中我们还不具备实施步骤4的资源,但我们希望在今后的案例研究中做到这一点。

“导航指南”不同于循证医学的特点

由于环境科学与临床卫生科学间在有关证据库与决策背景方面存在差异,临床科学中使用的系统评价方法学并不能天衣无缝地应用于环境暴露(Woodruff et al. 2011)。“导航指南” 法不同于循证医学的关键两点如下。

1 . 人类观察性研究主体的质量评级为“中等”:“导航指南”推理性地给予人类观察性证据的主体评级为“中等”质量。这一初始的“中等”质量评级与所评估的具体研究无关。然后根据预先设定的标准,通过升级或者降级“中等”评级,对该人类观察性研究主体的实际质量进行评估。与之相反,临床科学的系统评价,从人类实验性证据的可得性出发,对人类观察性研究推理性地给予“低”质量评级。尤其是,Cochrane和GRADE主要是根据评估随机对照临床试验(RCTs) 开发而来。由于这个原因,相对于随机对照临床试验, GRADE认为人类观察性研究是“低”质量证据(Balshem et al. 2011)。

我们给予人类观察性研究主体评级为“中等”而非“低”质量证据的依据,是基于人类观察性数据在环境卫生与临床卫生科学循证决策中的绝对和相对价值。总的说来,人类观察性研究被认为是临床科学的可靠证据来源,因为并非所有卫生保健决策都是依据或者能够依据RCTs得来的。2008年医学研究所(IOM)专家组的总结,强调了观察性研究对于某些卫生保健决策的贡献,该总结发现观察性研究是评估疾病病因,包括环境因子作用的优先方法。IOM专家组指出,观察性和实验性研究两者都能够提供有效而可靠的证据,其相对价值取决于该临床问题(IOM2008)。由于这个原因,IOM报告(IOM2008)阐述道:观察性研究通常最适合回答有关预后、诊断准确性、发病率、患病率和病因学等问题。

此外,人类观察性数据对循证临床决策绝对价值的认识正在不断提高。这有几个原因。例如,新的医学干预措施和科学知识的创建速度与复杂性,使得不可能仅利用RCTs建立各亚人群的治疗和高性价比卫生保健所需的证据库(Peterson 2008)。同样,电子医疗记录将引起医学研究的革命(Halvorson 2008),它使得在瞬间得到全面、纵向观察性数据成为可能。最后,处于伦理学考虑,实验性人类数据实际上在环境卫生证据流中被排除。因此,对于可用于环境卫生决策的证据而言,人类观察性研究是证据库的“金标准”。

2 .多来源证据相结合:体外试验、体内试验、电脑模拟试验、以及人类观察性研究全都为环境化学物暴露的决策提供信息。然而,同时评价不同证据流的证据在临床医学中目前尚无一致认可的标准方法。因此,我们改编了一种将IARC的整合人类与非人类证据的方法(IARC 2006)与美国EPA(1991,1996) 使用的证据强度描述方法相结合的混合法。尽管这样显然产生了一条清晰、简明且可识别的底线(即“已知有毒”、“很可能有毒”、“可能有毒”、“无法分类”或者“很可能无毒”),但随着方法学的进步,深入开发满足各种不同决策者需求的证据强度的严格标准、定义和术语将会是一项重要任务。

“导航指南”法与以往PFOA与胎儿生长的评价方法之比较

运用“导航指南”法进行评价, 作者得出的结论是“根据人与非人哺乳类动物胎儿生长减缓的充分证据, 发育期PFOA暴露对人类健康可产生不良影响”(Lam et al. 2014)。为了将以上结果与以往评价进行比较,我们在PubMed(http://www.ncbi.nlm.nih.gov/ pubmed)上不设日期或者语言限制对“PFOA”或者“全氟辛酸”的评价进行检索。在确认的48篇文献中,12篇含有关于生殖或者发育健康的讨论。另有两篇评价(Butenhoff et al. 2006; Stahl et al. 2011)是在我们项目之初就已确认,因而也被纳入。14篇评价中除未编入PubMed索引的一篇(Stahl et al. 2011)外,其他所有评价均被我们PFOA案例研究的检索策略所识别(Johnson et al. 2014)。

图1.“ 导航指南”方案中的步骤。PECO、研究对象、暴露、比较方法与结局。表1将我们检索到的14篇关于PFOA 暴露与毒性的评价文献,与系统而透明的评价方法(即Cochrane和GRADE) 的七个主要特点进行比较。所有14篇评价全都使用非系统性、专家陈述性方法撰写。14篇评价中,13篇定义了研究问题,9篇含结果摘要表,3篇说明了研究纳入标准,2篇含关于检索策略的有限信息,2篇进行了数据分析, 1篇评估了单个研究的质量。14篇评价中没有一篇系统性地或者透明地评估单个研究的偏倚风险,没有一篇将人类和非人类证据整合起来的证据强度进行全面评述(Butenhoff et al. 2004; DeWitt et al. 2009; Hekster et al. 2003; Jensen and Leffers 2008; Kennedy et al. 2004; Kudo and Kawashima 2003; Lau et al. 2004, 2007; Lindstrom et al. 2011; Olsen et al. 2009; Post et al. 2012; Stahl et al. 2011; Steenland et al. 2010; White et al. 2011)。以上14篇评价或者对于PFOA的毒性问题得出模糊或者不确定的答案,或者虽提供了明确答案(即“PFOA是一种已知的发育有毒物”)(White等人. 2011)但未说明检索方法,研究入选标准或统计学方法。我们对以上专家陈述性评价的方法和结果与“导航指南”法进行比较,证实了与目前环境卫生应用的专家陈述性评价方法相比,应用“导航指南”法可以为实施步骤提供更多的透明度,并提供了引向明确答案的前后一致的路径。我们的结果表明,国家毒理学项目(Birnbaum et al. 2013; Rooney et al. 2014)正在开发中的,以及美国 EPA(NRC 2011, 2014a, 2014b; U.S. EPA 2013a)考虑开发的研究综合改进法是完 全能够实现的。

局限性

“导航指南”系统评价法的局限 性是,虽然其总体架构是基于经验证 实的和/或经过时间考验的方法(即 Cochrane、GRADE、IARC、以及美国 EPA使用的方法),但仍需要对该方法 的新颖性作进一步的开发与验证,包 括 a ) 对非哺乳类动物试验以及体外试 验和电脑模拟试验证据流的质量和强 度进行评级;b ) 对于人类观察性研究 和非人类研究的偏倚风险域达成一致 意见;c ) 开发用于降级环境卫生证据 质量(即间接性,不一致性,不精确 性,及发表偏倚)以及 d )升级人类证 据质量(即剂量反应,大量级效应以 及最小混杂影响)的定义明确,可测 量的证据直方图;以及 e )探讨如果我 们将人类观察性研究整体评级为“中 等”,然后降级为较低质量研究设 计,或者,如NTP的框架所提议的,从 一开始我们就为不同类型人类观察性 研究评为不同等级(即横断面研究、 病例对照研究、以及病例系列或报告 被评级为“低”质量,而队列研究和 嵌入式病例对照研究则被评级为“中 等”质量),是否会改变最终质量评 级(Rooney et al. 2014)。改进的数 据分析与整合的统计学工具将促进系 统评价方法在环境卫生中的应用。我 们的最终证据强度评级命名法的应用 (即“已知有毒”,“可能有毒”, 等等)是否对决策者有用尚未经测 试,就非癌症健康结局证据强度的分类方法达成共识是一项关键研究和政策需求(Gee 2008)。

表1. 根据Cochrane 与 GRADE系统而透明评价法的主要特点比较PFOA评价的方法此外,与任何专家陈述性评价一样,“导航指南”法的应用也可能会执行欠佳。例如,可以实施一篇未提出决策相关问题的系统评价,或者由于检索策略欠完备而未能发现与该评价相关的信息。然而,执行欠佳的系统性评价比较容易被发现,因为其方法均被透明地显示出来。

环境卫生研究综合改进法能否及时地推动卫生防护决策也受限于现有证据流的缺陷,这些证据流是由现有科学知识系统产生的。一个重要例子是对无利益冲突潜在证据流的需求。正如JAMA 杂志副主编(West)2010年评论的那样,“ [科学]诚信的最大威胁是经济利益冲突”(Rennie 2010)。此外,偏倚风险评估并未解决产生假阴性的环境科学方法学中的固有偏倚,依靠证据强度标准的固有偏倚是胜任不了解决复杂且多因素的疾病病因学任务的(Gee 2008)。最后,对于预防为主的行动还有许多其他艰难的、非科学的、社会的和政治的障碍(European Environment Agency 2013; Michaels 2008)。

今后方向

缩短从科学发现到预防有毒环境化学物暴露的时间,与私立和公共部门倡导使用有毒化学物的更安全和可持续性替代物的成功密不可分。毒性评估是这些工作的重要基础(Edwards 2009; Malloy et al. 2013; Matus et al. 2012; Park et al. 2014; U.S. EPA 2012)。因此,“导航指南”法具有广泛适用性, 可以支持企业、政府和消费者使用一种标准化的、严格的方法比较和选择各种化学物。

如同系统评价的临床应用一样,系统而透明的环境卫生研究综合法的开发将是一个持续不断的过程。一些亟需解决的方法学需求涉及如何将关键性概念常规整合到数据解释中,包括低剂量效应,物种间反应的一致性, 以及人类差异性(包括年龄与合并症)。PECO问题以及PFOA案例研究的统计学分析考虑到了以上这些问题, 但仍需构建在系统评价中整合这些概念的更为彻底的总体框架。例如,未使用有临床相关合并症,如高血压的中风模型动物,被证实会使药物疗效评估产生偏倚(Macleod et al. 2008; Sena et al. 2010)。然而,我们可以预期到,纳入有慢性病的动物可能会影响环境化学物的研究结果。评估环境卫生科学中发表偏倚的健全方法也是一种需求,因为科研人员可能会有促进反向偏倚的经济和/或其他冲突。

运用系统而透明的评价方法也反映了环境卫生科学中的一种新方式。现实的出发点是需要认识到在临床医学中使用系统评价所遇到的许多甚至所有的挑战(即,对医师自主权的威胁,患者选择等等)都有可能成为我们的挑战。我们需要克服每一重要目标受众对环境卫生科学和研究综合法知识的缺乏。系统评价在环境卫生中的应用本质上是一项跨学科的“团队科学”,取得成功需要规范必要的专业知识并组建与培训掌握这些新方法及具有相关沟通技巧的评价队伍。

结论

系统而透明的研究综合法以经验为基础,是利用现有数据进行更有效而透明决策的路标。系统评价法的应用可使决策者根据任何质量,任何方向的研究证据进行决策。此外,系统评价的应用可防止重复性或者在对决策毫无必要的研究上浪费开支(Chalmers and Glasziou 2009)。

作为RCT先驱的统计学家Austin Bradford Hill 爵士,在其1965年皇家医学学会的致辞中告诫听众:尽管科学经常不够完善,且不断变化,但并未赋予我们无视我们已有知识,或者推迟看似需在某一时刻采取的行动。

Hill (1965)强调指出“强有力证据”并不意味着在我们行动前“做到尽善尽美,并与每一位批评者兵戎相见。” 他提出了不同行动有不同证据标准的提议,半个世纪后(美国) 国家科学院学报的《科学与决策: 推进风险评估》(Science and Decisions: Advancing Risk Assessment )一文响应了这一建议(NRC 2009)。

正因为系统评价方法学可以将科学、价值观与偏好透明地区分开来, 在是否需要为提升卫生科学的精确性或更多决策的争论中,它们可帮助我们用词更为准确。

“导航指南”法的首个案例研究, 证明了旨在优化环境卫生信息评价透明度并减少偏倚的系统而严格的研究综合法的应用成功。政府机构能够使用该“导航指南”法学撰写关于环境暴露与健康关系的循证报告(步骤1-3)。负责风险管理决策的政府机构还可应用“导航指南”的步骤4对预防建议的强度进行分级。专业学会、卫生保健机构以及与毒理学家并肩工作的其它潜在指南开发者,可以利用该“导航指南”法提出改善患者以致于人群健康结局的前后一致且及时的建议(步骤1-4)。健全的、系统而透明评价方法的制度化将提供衔接科学与及时预防伤害行动的具体机制。“导航指南”法,尽管概念很简单, 却要求可持续性高瞻远瞩利用大量投资的领导魄力,和环境卫生与临床卫生科学家及倡导者们的求知欲与献身精神。


PDF格式

译自EHP 122(10):1007-1014 (2014)
翻译:王仁礼 审校:李卫华

*本文参考文献请浏览英文原文
原文链接
http://dx.doi.org/10.1289/ehp.1307175