作者:李树恒 来源:生物谷 日期:2014-05-16
生物样本库是转化医学研究的宝贵资源,随着"十二五"国家科技计划的推进,我国的生物样本库建设蓬勃发展。上海交通大学转化医学研究院王伟业教授作为国外引进的样本库信息化管理专家,主要从事生物样本库建设和信息化管理方面的工作,指导多家医院生物样本库基本的建设工作。在2014生物样本库与临床研究论坛上,生物谷特别采访了王伟业教授,大家来看看他对中国生物样本库建设以及信息化管理方面的解读。
样本库建设不能以大和多来衡量
生物谷:生物样本库建设国内外的差别主要体现在哪些方面?
王伟业教授:我想从样本资源的本身,管理以及信息化和共享三方面来说这个问题。建样本库的根本目的是建一个研究资源的平台,一是资源整合应用,二是为不同学科的研究人员提供合作研究平台。国内外的区别可以从优势和差距两个方面来讲。
从样本资源来说,中国特点是样本资源量大,资源种类多样化。与欧美国家相比在较短时间内能够积累大量资源。在中国一个月的诊数量,在国外达到同样的病例数可能要几个月,如胸腺肿瘤类,据说整个欧洲的例数甚至少于中国的一家三甲专科医院。单从研究性资源来看,这是有利的方面。而不好的方面是没有考虑好应用问题。比如一个产品需没有做市场调查,没有计划应用措施,可能造成"储存性"的资源浪费,这也是样本库资源管理方面存在的问题。
在中国,很多人习惯以大和多来衡量事物的好坏。经常会听到有人用样本量多少和空间大小来衡量一个样本库的发展状况,这是概念性问题,会直接影响到样本库的建设和管理等一系列问题。我认为样本库不能以大和多来衡量其价值,那个时代已经过去了。目前我国样本库建设需要的是:以做模板为主,然后去扩充。简单来讲,1和10只是大小的区别,但难和键的是1要怎么去做,有了1,扩增到10很容易了。
第二个差别是样本库资源的进口和出口。样本库建设可以简单描述为像计算机中的任何一个事件:打个字到键盘上,这是"进口",计算机运算或处理一下输入的内容,这是"操作",然后中屏幕上显示;进口"的结果,这是"出口"。目前在我国样本库建设中,由于资源丰富,且操作相对容易,所以"进口"的速度很快。但具体"操作"跟国外相比还有不小的差异。当然每个样本库都很重视这个方面。但是我认为现在比较大的问题可能是样本库资源的"出口"问题,即资源的应用。现在中国做生物样本库,一定要与传统的,以单一课题的需求为目的的生物样本储存有本质的区别:一是在管理的组织结构上,二是作为系统化医学研究的资源。而现在大多样本库建设还没有发生本质上的改变。
第三,理念上认识的差距较大。我国每家医院都在做样本库建设,事实上有些没有必要重复建,比如有些小的医院。因为一旦要建,从建设库到人员培训等所有资源都会产生重复的花费,这方面主要问题是缺乏系统化的认识和设计。而国外则目标比较明确,很多样本库都是建设在大的医药公司,比如辉瑞,因为各家医院都跟他有研发方面的合作。而我们国内许多建库的目的还停留在提高科研、发文章上面,总强调发文章的SCI多少分。不管是管理层面,还是目的性方面的认识问题,都存在理念的问题。
另外,国外还有个重要的特点,是团体合作,协作性比较强,比如美国NIH的NCI有关项目,以及加拿大的P3G项目。我国目前在这方面较薄弱。国外信息化发达,在一些专病领域,他们都以团队或联盟的性质整合应用资源如经费,而我国总的来说还是单兵作战,虽有一些团体,但是没有改变实质。这可能跟文化有关系。很多人一谈到共享,会觉得拿了自己的东西。事实上,共享并非你拿我的,我拿你的这么简单。由于认识上的问题,很多人会回避,而不是去解决共享机制的建设。简单来讲,我们之间怎么共享,以何种机制来实现,而不是把共享的方式简单认为是一方拿另一方的东西,总是以"防守"和回避来解决问题。
资源整合也是同样的问题:认为资源整合是把所有资源实体上放置在一起,因而回避不整合,各自为阵。我现在和国外的合作项目,是研发国际信息共享的机制:整合各自分析结果再次分析,但是原始信息各自严密自行保存,不涉及到任何共享。这是面对大家都普遍存在的问题去寻求另外的机制来解决。他们共享的目的很清晰,也同样受规定限制,但会想办法用技术来解决这个问题,而不是回避。所以我认为在这方面,我们还是存在理念认识方面的差距。
生物样本库建设中的内容和方法中国也可以成为国际规范
生物谷:国外在管理、操作规范方面,有哪些值得中国借鉴的地方?
王伟业教授:讲到国际规范,通常是指欧美规范,其实我们没有必要总是跟在后面走,国际规范本身也可以包括中国。有些研发工作,可以针对现实的问题动手先做,没必要一定符合"国际规范",我们做出来有价值的一定会被借鉴,也会逐步发展为某种意义上的"国际规范",而不是框架性的认为,国外还没做,我们不必要做。有次在会议上报告我们相关研发的资源交流项目的时候,有不只一个听众提问,你们做的国际上有没有先例,是否符合"国际规范"之类的问题。我当时答是一是不知道,二是没有考虑过。为什么一定要先了解有没有国际先例再做呢?只要我们认为是有价值的,能够解决我们实际的问题,我们是先例,也可以到一定时候成为某种意义上的"国际规范"。今年初,我在美国与国际样本协会负责人讨论提及我们的项目时,发现他们也在做类似事情,所以只要是问题,大家都能够想到。
当然国际上在这方面发展比我们早,其中由许多我们可借鉴、可采用的建设发展理念,我们没有必要自己再做一套。从国外样本库建设规范化来说,我们需要采用。总体来讲主要有两个大规范:一是美国国立卫生研究院NIH里面的NCI,即美国肿瘤研究所,他们给生物样本库专门设立一个办公室叫OBBR,那里设了一套我们常说的标准规范,他们叫实践即英文的Best Practice。规范还不能称为标准,标准可能是必须服从的。但目前样本库建设方面国际上还没有真正意义上的标准,只能称为理想实践。根据所有专家过去的操作,大家认为比较好的办法,然后依据去做,是大家目前能力范围认为的比较好或应该采用的方法。而且这是不断更新的过程,事情发展到一定阶段,大家都这么做,会通过某种机制或手段体现其价值标准而成为操作标准规范。
另外一个规范是国际样本库协会ISBER (International Society of Biological Environmental Repository)采用的实践,其新版本的是2012年做的。这两个的区别是ISBER考虑比较高层面的,没有太详细,更多的是构架一些理念,而美国NCI的OBBR做的比较细,他们所有样本资源都是从肿瘤样本做起,从病理科开始发展。这是目前国际上存在的主要两大规范。几年前,中国也曾经制定过样本库规范,如我国重大疾病样本库建设规范,是由中国生物医药协会组织样本库分会主任委员郜恒俊教授领导的团队在开展这方面的工作,近年来,他们主要是推动以国际生物样本库协会ISBER的实践指南为主的规范化建设。
可借鉴的第三点是他们的信息化发展。这方面国际发展的的速度与我们差别较大,而且很多是由于理念认识不同而导致信息化发展方面的阻碍。国外信息化发展比较早,在科研上,我们会有很多可借鉴的。目前生物样本库与传统生物资源保存根本的区别是样本的信息化问题。我在许多场合的报告都会提出一点,是样本本身几乎没有什么价值,真正的价值在于其特有的信息,也是生物样本是的生物实体,它既有丰富的临床信息,又有详细的实验室信息,这是其他实体无法做到的,动物模型或细胞不能够正确反映临床信息。临床和实验室信息的结合正是转化医学的起点。简单来说,现代建设生物样本库的目的是如何能够把生物样本资源转化或翻译成为数据信息资源,如果样本没有信息的转化,其作为转化医学和个体化医学研究的宝贵资源也将成为一句空话。现在人们参观某个生物样本库,总是看有多大空间,多少冰箱,有什么仪器,有几个人等等,但是真正能够展示一个样本库价值的只有信息,一个有价值和管理规范的数据库,其核点也不是发表过多少篇文章。我相信将来我们再谈生物样本库,重点也会转移到相应的信息化建设与发展。近我申报一个新的项目,是与美国方面合作的,因为我知道他们那里做的非常好,正是我们需要的。所以从信息化的角度,他们有很多方面值得我们借鉴。
生物谷:如何看待生物样本库信息化管理以及标准化?
王伟业教授:前面已经简单提到生物样本的信息化建设的必要和重要性。信息化不能单一解释为管理,样本信息化的核简单地说是如何以正确的方式描述样本所包含的信息内容并且让这些信息能够充分体现样本的特性与特征。我前面提到想做的项目,其关键点是如何特异性的描述样本资源的特征。比如同样是大肠癌样本,不同的样本库描述特征可能不一样,现代医学越来越精细化,肿瘤样本的特性会有基因分型,个体化治疗更需要分型。单说是大肠癌样本没有多少价值,因为每个人的大肠癌样本内涵不同。这需要描述非常特征性的信息。在科研应用上,样本的特征性描述如果不全面,或不够精细,要考虑这个样本是否符合你的研究需要,所以信息化的重点是如何特异性的描述样本,即样本的特性。
第二点是上述的样本信息化方法要逐步走向规范化和标准化,比如大肠癌样本在不同的样本库要以同样的内容和方法来描述,这样经过统一,规范化然后被接受后,才能逐步走向标准化。所以标准化是水到渠成的事情,把基底铺好,一步步不断朝前走,到一定时候才能实现标准化,而不是今天讲标准,很快能做到标准。先找到正确的方向,建立一定的基础,然后自然会走到标准化。
生物谷:整体来讲,挑战还是比较多。国家政府层面对这个支持情况怎么样?
王伟业教授:样本库建设的发展需要领导层面和政策的支持,政策决定样本库的发展方向和可行性。许多医院领导在这方面意识很强,能够大力推动样本库的发展。今年6月在北京将召开第六届生物样本库标准化管理会议,其中专门设有一个医院院长高峰论坛,其目的很明确。中国的样本库建设之所以能够在短时间内发展迅速,是各医院领导大力支持的结果。正因为如此,也说明领导的支持是非常关键的因素。
据我所知,样本库建设目前还没有作为一个科研项目来申请资金项目。目前的资金,都只是来自当地政府的支持以及医院自身投入。
转化医学是从临床到实验室,再把实验室获得的结果带回到临床应用。这个过程需要研究对象,尤其涉及个体化治疗。如果没有生物样本资源,一切都是空谈。生物样本的可贵之处是其既有临床信息,又有实验室的研究信息,样本资源在实验室研究和临床信息之间搭建了一个通道,能够起到实验室与临床之间往来的桥梁作用。转化医学的多方面都涉及样本库,所以资金支持对样本库建设不是大问题。也是说,目前在建设样本库方面不会因资金短缺问题而做不好。
当然资金处理方面也会存在一些问题。有些资金在没有得到全面的规划和设计之前以分配的方式到了各个机构,像把需要一个拳头的力量来做的事情分成单个手指去单独执行。一个全面的自动化特性平台可以在保证质量的前提下完成同样的流程式操作,但资金分配后导致任何一家单位都承担不起,即使购买了设备,所需的试剂与耗材也会缺乏资金,或者有了设备,却没有单位有那么多需求,终也不能够真正应用。因此资金需要在高层面设计合理后才能更好地整合协调。
第二是样本库的维持,大多医院或单位对样本库建设的支持往往是大力支持硬件设施,如冰箱,房间,工作人员。其实消耗品也很重要,至少需要占5%,但这笔经费一般没有来源,有设备却无法开工。如何有机制地维护这种平台是目前我们都能够看到的一个挑战性问题。比如,一家小医院为了顺应发展趋势而建个样本库,由于科研平台薄弱,加上缺乏共享应用,之后的使用会很少而没有办法维持,后可能类似于传统上的一个实验室有几个冰箱。这涉及到国际上探讨的样本库经济学方面的思考(Biobank Economics)。当然这取决于管理人员在管理样本库,使用样本库等很多方面的能力,因此将来能够走下去的可能只有为数不多的生物样本库。
资金支持方面,目前国外NIH也可能没有特别经费支持。比如NIH设有个专门资金来支持一些重大项目的申请,但必须利用已经存在的生物样本资源,这可能是把资源大化利用的一个正确案例。
生物样本库信息化管理,专职容易专业难
生物谷:如何看待国家生物样本库信息化管理方面人才问题?
王伟业教授:首先,在中国,许多样本库通常是雇几个专职工作人员,称样本库有专职人员负责,当然这没有错,但需要明白专职并不等于专业化。另外对于样本库中的"库"字,在现实中可能造成理念上的误解:库,很容易被认为像仓库一样,而仓库会让人想到储存。所以"样本库"不像一个与研究非常紧密的机构。在英文里有些机构会写成Biospecimen Research。事实上,储存样本只是生物样本库主要功能的一项,其功能绝不于储存。如果一直停留在这个误区,会造成之后相应的错误,我认为主要的是资源的应用或共享。目前,样本资源的应用与研究方面的结合、信息共享为前提的资源共享等一系列问题都没有得到解决。所以,从专职到专业是个复杂的学习过程。由于样本库涉及的知识范围很广,如医学、生物学,分子生物学、冷冻保存技术、生物信息学和信息管理学等,现在已经把其看作是一门新型的学科。所以我认为应该成立生物样本中心,以反映其职能和功能特性。
样本库的信息化管理是样本资源所必须的,信息化和生物信息是两个方向,而生物信息学需要这两个领域的交叉人才。人们容易把生物信息理解为IT,但是IT人员只能够满足要求的计算机功能,却不知道生物领域的逻辑。因此需要生物学和IT人员紧密配合才能够达到需求。当然,并不是要求样本库工作人员都必须懂得信息化的知识,目前也办不到,但是至少管理层的人一定要有相应工作需要的基本知识,负责项目的人要有能力在中间做协调,这点很重要。样本库建设下一个阶段的发展一定是以信息化为重点。从我的工作经验来看,我的生物信息化知识加上我自己对计算机方面的的爱好,跨学科的知识与技能对我帮助很大,我现在可以设计数据库的逻辑方面需要。生物样本库是一个多学科的领域,需要一个从专职到专业化的转变和更新的历程。
生物谷:我国样本库信息化人才方面存在哪些问题?
王伟业教授:中国在生物信息化方面发展跟国外的差距相对比较大,也可以这么说,我国生物信息化的发展明显滞后于医学生物研究的发展。不少做分子生物研究领域的人,因为工作需要使用很多信息系统,然后去钻研信息相关方面的知识与技能,可能不需要知道详细编程,但至少知道信息化的逻辑。从管理项目来讲,需要掌握一些基本知识和一些逻辑过程。
另一方面,可能做生物的人对计算机认识少,国内对样本库信息化管理方面的认识不足,很容易把一些问题归纳为计算机的问题。其实有不少需求或者问题不一定是计算机方面的,比如样本库的信息怎么去标识,怎么注解等相关问题,这不能够只依赖IT的工作,而是需要样本库的工作人员去做的,因为这样的工作需要医学生物的专业知识。现在生物医学研究离不开数据,离不开信息化,大数据处理、生物样本信息处理,完全用Excel格式或手工记录已经不能满足现代生物医学研究所产生的数据量和复杂性方面的需求。
生物谷:针对这些问题,您个人是否有好的解决建议?
王伟业教授:首先我们需要培训,目前,生物样本库建设缺少以进修方式来达到掌握技能和管理的方式,而主要采取学习班的方式,这样时间有限,而且不能实践性的涉及到具体工作。样本库方面的工作主要还是应用型的操作和管理技能,尤其是对信息管理系统的掌握,单靠课堂方式的培训是不够的。在实际工作中如果遇到问题,学习正确的思考和解决问题的方法是重要的。我提倡的是,通过做事,才能真正知道如何解决问题,才能把一套知识学会。目前在我的团队,我对他们的要求以"进修"的方式,直接参与到日常工作中去。
去年因项目进展要求,我们走访了一些样本库,发现存在的问题主要在信息化管理方面:把样本登记到样本库信息管理系统中是很容易办到的事情,但信息内容几乎空白,这样的样本从信息系统本身而言是没有办法应用的,因为连基本的搜索恐怕都做不到。现在我们的样本库信息以临床诊断作为样本的主要信息,比如某种肿瘤的临床诊断名称。而个体信息可能都没有。再举个传统的简单例子,收集了群体的样本后,只描述临床诊断是某种型肺癌,如果研究者是想用此样本来研究抽烟和肺癌发生的相关性,但是是样本提供者是抽烟的,还是喝咖啡的等相关信息都没有,研究人员无法确定样本资源是否是研究所需要的。
样本库的发展,首先要建立,然后才能统一也必须统一,后才有可能发展为样本资源网络,这是国际样本库发展趋势中的三个里程碑。但是这里的"统一",并不是在实体上把样本资源整合在一起,不是把资源放在一起整合储存那么简单。整合应该是相同的资源在应用时具备相容性,可以用同一个标准来评价其质量和特性等。有了相容性,需要时才可以真正的整合应用,即使分开研究,由于信息规范统一,得到的结果也可以"整合"分析。所以"整合"可以分别理解为整合储存,整合应用和整合分析几种方式。另外"网络"并非计算机网络那么简单,网络代表共享,包括信息和样本资源的共享。我认为信息共享是样本资源共享的前提:信息不能够共享,不能确定样本资源是否有资质共享。目前我们在建设的初期,信息化方面的问题很明显。信息虽然很多,比如很多称为电子病历的病历有可能仅仅是电子版的记录,并不是真正意义上的电子病历,真正的电子病历是将所有病历信息化的计算机可以应用的病历信息。
当然,这些基本的理念可以通过培训,通过提供一些进修的平台,让从业人员从实际上接触并解决问题。现在承担样本库工作的专职人员缺乏一些必要的专业技能和经验,需要通过专业化的学习从专职成为专业人员。样本库是设计面广泛的应用科学与研究,因为实验室的研究结果与样本库的专业程度紧密相关,尤其在研究中出现的问题,样本库工作人员需要直接思考并解决问题。所以谈到职业方向,从业者如果一开始仅把建库理解为做好储存是没有意义的。负责人应该具有较高的专业化程度,不能把专职和专业等同起来,做专职易,做专业难!
王伟业教授2012年引进回国,之后开展了很多生物样本库信息化建设方面的工作。对于未来,他又有着怎样的期待呢?
生物谷:请您介绍一下回国后这两年在样本库资源共享方面的工作情况。
王伟业教授:前面谈到过,资源共享的前提是信息共享,其条件是样本资源必须在信息化建设方面有可比性和相容性,只有合格的样本资源才能够共享。另外,共享的实施也是通过信息化管理运作来实现的。两年来,除了领导研发合作团队研发信息化管理系统,也作为技术负责人指导研发信息化共享平台。我们走出的较关键性的一步是统一信息管理系统,这为不同样本库之间共享信息打好了基础。统一的信息化管理系统可以解决不同信息管理系统因不同的逻辑和结构设计而带来的信息搜索方面的难题。
我的工作重心还有我负责申报的两项信息化国际合作科研项目,已经获得上海科委国际合作项目和国家科技部国际科技合作专项的立项经费支持。项目的主要目的是探索应用统一多方数据元素的方法和数据屏蔽技术,建设信息共享机制和运作模式,促进国内国际合作研究。这些技术和模式同时也是样本资源共享建设发展的需求。
另外,为样本库建设下一阶段的发展考虑,我正在负责国家科技部的研究项目,重点是研究样本库信息资源的语义化描述/注解、语义化索引以及样本库资源语义化检索等方面的工作,为建设语义化的样本库(SemanticBiobank)。这也是生物资源和生物大数据共享的另一个需求模式。通过语义化注解,样本资源可以通过一定的统计学分析来评估样本信息质量的可比性和相似性,为判断资源共享的合理性提供一个可分析的方法。
样本库共享首先是样本的信息共享。如果不知道样本的信息,无从知道是否要共享。一些可能并不是你想要的样本,并非简单讲样本的质量好坏,凡不符合研究需要的样本对你来说是垃圾,当然也可能对别人是宝藏。所以跟别人资源共享,一定要先了解别人的资源对你是否有用,这是信息共享的前提。是否愿意共享是目前的一个主要障碍,当然也缺乏具体的应用方式和机制。有时同国际方面合作时,会有这种情况:愿意合作,但样本不合格。
第四是信息化管理,我设计的信息化管理流程和逻辑,是与专业的IT团队合作完成的,这样我具有的跨学科知识和经验能够起到一定的引导作用。在系统设计方面,融入的要素一定是将来要用的模式,而不是只考虑眼前的应用,有些方式和功能可能被认为用不着,但是里面涵盖着发展必须要有的。只满足眼前,不考虑将来,这是信息数据管理方面要避免的。信息交流越先进越好,终理想是只有一种信息,可能这才是需要的标准。虽然在实际中可能很难,但至少不能铺的太广,比如一百个生物样本库,用了几十个不同的管理系统,这样会走向混乱。所以标准化必须打好基础,否则没办法实现标准,即使提供一个标准也做不到。针对这个问题,不同样本库之间要互相做接口,互相征询和改变,这样大家才能逐步走向标准。
生物谷:后,您对中国生物样本库建设以及自己之后的工作有什么期待?
王伟业教授:期待当然有,我知道近有关方面要讨论建立国家层面的生物样本库。人类生物样本资源库主要有两种,一种是正常人群的,一种是病人源性的。中国资源种类多,病人多,需要一个逐步发展完整的机制和政策以及手段来规范化,我认为要采用先做模式,后扩展的方式,如同企业要先做强后做大一样,真正把样本库建设做成一个科学化的行业。
对于自己的工作期待,当然也是自己的研究项目,希望能够引导样本库信息化发展,目前样本库信息还不能实现共享。单纯讲资源共享不可行,中间有断层,这个领域内的培训和专业化层面跟国际上有很多可交流借鉴的地方。所以我要利用我个人的一点的优势通过国际合作的方式,实事求是的合作,利用已经有的技术平台和一些理念。另外,我认为国际合作并不是获取一项技术,单纯的技术不是重要的,因为技术也可以花钱买来。所以单纯有技术是不够的,重要的是模式和平台。我的研究项目很看重模式平台。我们有时过于强调技术,但是技术和平台不是一回事,一个平台的管理规章制度、流程、质控质检以及所有的专业技术人员代表着能否做好这件事情。所以合作或者共享,尤其和国际上合作,需要做的平台是信息交流平台。
关于王伟业
教授,美国M.D.Anderson肿瘤研究中心生物化学与分子生物学博士,生物信息研究与信息化管理专家。作为跨学科专业人士于2012年引进回国,任职于上海交通大学医学院附属新华医院,担任环境与儿童健康上海市和教育部重点实验室教授,副主任和新华医院生物样本库主任。多年来先后在美国M.D. Anderson Cancer Center,Baylor College of Medicine,Wyeth Research和Medical College of Wisconsin等科研机构从事生物医学研究,近年来主要从事生物样本库建设和信息化管理方面的工作,同时受聘为上海交通大学医学院转化医学研究院"985工程"生物样本库建设咨询专家,指导多家生物样本库基本的建设工作。目前的研究工作重心为生物医学科研信息和生物样本库信息化发展,促进资源信息共享。王教授领导的IT合作团队在较短时间内启动了几个信息化项目的研发,已经成功完成的生物样本库信息化管理系统(BIMS系统)已经在多家样本库建设和管理者发挥作用。另外,王教授领导的两项信息化科研项目已经分别获得上海科委创新国际合作项目和国家国际科技合作专项的经费支持,探索应用统一多方数据元素的方法和数据屏蔽技术,建设信息共享机制和运作模式,促进国内国际合作研究以及是样本资源的共享建设,为领域的领军者之一。