刘湘军:志在破译人类疾病遗传的密码库
作者: 文章来源:娄底侨联 发布时间: 2010-07-06 字体:【大】【中】【小】
人类的基因组有30亿个碱基,藏在里面的遗传密码浩如烟海。
2001年2月,美国的赛莱拉基因组公司(Celera Genomics, Rockville, MD)在《科学》杂志上发布了人类基因组的“工作草图”,指出人类共有三万多个基因。
2003年9月15日,为赛莱拉公司读解人类基因工作做出重要贡献的一位中国人,被MIT主办的“Technology Review(科技评论)”评选为本年度“100名世界顶尖青年创新者(The 2003 world’s 100 Top Young Innovators,简称TR100)”,他是全部获奖者中唯一的目前在中国大陆工作的科学家。
他,就是我校医学院教授、35岁的博士生导师刘湘军。
从中国到美国:5年时间拿两个学位
1993年,当刘湘军在母校清华拿到了生物化学的硕士学位之后,来自伊利诺大学芝加哥校区(University of Illinois at Chicago, Chicago, IL)的录取通知书把他带到了美国,他师从美国科学院院士伊曼纽尔?马格里亚希(Emanuel Margoliash)教授,进行分子生物学的研究。
上个世纪末开始的信息化浪潮给人们的生活带来了超量信息的同时,生物学的研究也步入了信息时代。
刘湘军敏锐地感觉到了这一点。在读到《科学》杂志上一篇有关生物学家要学会用电脑处理生物学的各种数据的文章之后,刘湘军开始修习计算机系的课程。而为了保证在分子生物学上有足够的时间和精力的投入,他几乎放弃了所有的休息时间。
在1996年-1997年的每一个节假日和夜晚,在伊利诺大学芝加哥校区的分子生物学的实验室里,都会找到刘湘军;在该校计算机系的课堂和机房里,也会经常看到他的身影。
1997年,他拿到了伊利诺大学芝加哥校区电子工程与计算机科学硕士学位。
1998年,他又拿到了生物学博士学位。
“那几年,我的生物学和计算机的学习同时独立进行,两方面的思路完全不同。”刘湘军说。
从大学到公司:读取人类遗传的密码
1998年11月,刘湘军走进了刚刚成立6个月的美国赛莱拉公司。该公司在HGP(人类基因组组织)已经在人类基因组计划进行了8年努力之际,志在以更快的速度勾画出人类基因组的图谱。
刘湘军成为该公司的第74号工作人员。他在这里展示了自己在生物信息学方面的天赋,在计算机方面的知识也使得他面对数以十亿计的数据时能够应付自如。
“人和人之间的基因组99.9%是一样的,仅有的一点点的不同就决定了我们的相貌、习惯、疾病倾向等等。当时公司以5个人作为样本进行人类基因组的测序。我们把这5个人的基因组序列互相比较,去发现他们基因组的不同之处,即单核苷酸多态性(Single Nucleotide Polymorphisms,SNP)。”刘湘军说。
无疑,这是一个浩大的工程。人类基因组大约由30亿个碱基对组成,打个比方,就像是一部30亿个由A,T,G,C四种字母交替组成的大书。人类基因组计划的目的,就是要知道这四种字母的排列顺序。但是由于技术的原因,在测序之前,需要先把这本书撕成许多个小片断分别阅读,然后再把这些片断拼接起来恢复成一本完整的书,而将人类基因的30亿个碱基全部计算一次就需要两万多个小时,因此,要想有结果,必须建立合理、精密而且可以分布式计算的流程。
“我们把SNP计算的工作分到一千个计算机处理器上来同时进行,当时整个系统的流程是我组织的团队建立起来的。只花了两个星期我们就把整个系统走通了,两个多月之后就开始有人用我们建立的SNP数据库搞研究了。”
“Technology Review”这样评价刘湘军在这一段时间的工作:“作为赛莱拉公司的研究者,刘通过领导一个团队读取了数以十亿计的基因序列,并且形成了一个有280万个SNP的数据库,这为基因组图谱草图的成功绘制打下了基础。遍及全球的研究者们在用这些数据去了解哪些基因变异与疾病相关,并且这些变异怎样在不同的人身上影响药物的作用和毒性。
在公司期间,刘湘军还从事了果蝇、人类、小鼠等基因组的注释软件开发,染色体图谱数据库和注释数据库的设计、装载、管理、质询,针对客户特殊需求的信息处理如专利准备、统计分析等等。在赛莱拉工作一年多之后,刘湘军被两次提升,成为资深经理,专门进行SNP的研究。
2001年2月,赛莱拉和人类基因组组织(HGP)在《科学》和《自然》杂志上分别公布了他们绘制的人类基因组的“草图”。
“草图中还存在很多不完善的地方,人类基因组计划并没有完工,各项工作仍在继续进行着。”刘湘军说。
从美国到中国:要破译中国人身上的疾病遗传基因
“分子生物学家刘湘军想知道你的基因里是否有一些东西,能够预言你容易患上某些疾病。”在“Technology Review”为刘湘军所写的名为《创新:基因组变异可以警示未来的疾病(Innovation: Maps gene variations that could warn of future disease)》的介绍中,一开始就是这样描述他的。
2002年2月,刘湘军打起行装离开了赛莱拉,回到了中国,回到了母校清华。
“我想在中国人的基因组上做一些工作。”面对众多不可理解的目光,他一语道出了自己回国的原因。
“赛莱拉的工作,以及和他性质相同的公立机构HGP,都集中在欧裔人的样品上开展研究。在赛莱拉,5个人的样品中只有一个是中国人,而中国人的样品量只占总样品量的5%,而其中的一个白人的样品量就占总样品量的70%。他们公布的数据也主要是以欧裔人为主。要做中国人基因组相关的工作,就得在中国。”
而人类基因组序列的获得,只是全面破译人类遗传奥秘的起点,而不是结束。
通过清华大学的“百人计划”,刘湘军获得一些启动资金,作为医学院生物医学信息研究所所长,他一到清华马上开始就人类的基因与疾病的相关性作进一步的研究,同时在生物系开始教课——他完全投入到一名普通清华教授的工作与生活当中。
“我的下一步主要的工作就是破译基因和疾病倾向的关联,这是我回国之后要做的事情。在美国的时候我也在做这件事情,但是主要是在计算机上做,是纸上谈兵。”在读取了密码之后,破译密码自然就成为刘湘军下一个工作的目标。
清华的医学院与一些医院良好的合作关系,使得他有便利的条件直接到医院去取一些病人的基因样品。“你可以拿着病人的基因,直接去寻找他的基因变异,我们确实发现他的SNP与他的这个疾病有着某种相关性,如色盲症,血友病,还有动脉硬化症。SNP不仅可以直接导致疾病的发生,同时它还可以作为一种遗传的标记。就象大海的灯塔一样,SNP的分析可以为疾病基因的研究指引一个方向。”
从现在到未来:科学家要研究真正的科学问题
科学家要在广袤的科学领域中取得突破,需要什么样的素质?
刘湘军回答了三点:要有牢牢地追求一个科学问题的思想态度;要心态平和,耐得住寂寞,不能够浮躁;要多和他人交流,尤其是在一些学科交叉的领域,尤其要注重和别人去讨论。
也许正是有了这样的禀赋,他才能够在基因组学、生物信息学这类交叉性非常强的学科中一直保持着革新意识很强的研究势头和孜孜不倦的研究态度。
这两天,刘湘军正在为中英合作项目 “e-Science在生命科学领域中的应用”争取国家863项目的资助。他说:“目前我们已经提前完成了第一阶段的计划,我们将联合北京大学、天津大学、中国科学院等单位共同申请国家863项目的支持。”(e-Science的概念是英国科学家首先提出的,是指通过网络和电脑来促进科学研究。)
此外他还在进行多项研究:包括国家863计划“基因注释系统的标准建立和软件开发”的课题研究;负责进行功能基因组专利信息战略研究,该项目由国家863重大专项计划支持。此外,还在进行各种SNP的检测与分析研究。
而经过这些年在“干的生物学”的经验和不断探索,刘湘军更明确地注意到了“湿的生物学”在整个生物学的发展中的重要地位:“生物学可以分为两种,湿的生物学是和瓶瓶罐罐打交道,做生物学的实验;干的生物学就是做生物信息学,工作主要在电脑上进行,现在我主要开展的是干的生物学研究,但干的生物学如果没有湿的生物学去验证的话,也是做不好的。”
他还说:“我的导师伊曼纽尔?马格里亚希先生四五十年来一直在研究细胞色素C这种蛋白质,它是细胞呼吸的重要一环,生命活动的重要基础元素;最近几年又发现了它是促进细胞凋亡(在生物体内,有些细胞将牺牲自己以便于机体自身的维持与更新的一种现象),的重要因素。现在我导师已经83岁了。作为他的关门弟子,他把实验室的设备和材料,以及他的藏书都交给了我,他希望我继承他的衣钵,能够在细胞色素c上继续做出有意义的研究。”