摘要 人类基因组计划(human genome project,HGP)旨在阐明人类基因组的结构、组成、全部3×109核苷酸的序列以及基因在染色体上的定位及其功能,从而破译人类全部遗传信息。美国于1990年正式启动HGP,估计到2003年完成人类基因组全部序列的研究。目前,HGP已成为全球范围的合作项目。本文就HGP以及由HGP延伸而来的后基因组计划(post-genome project)的发展现状作一综述。
关键词:人类基因组 基因克隆 基因组学 结构基因组 功能基因组
人类基因组计划(human genome project,HGP)是由美国科学家、诺贝尔奖获得者Renato dulbecco于1986年在杂志《Science》上发表的文章中率先提出的,旨在阐明人类基因组脱氧核糖核酸(DNA)3×109核苷酸的序列,阐明所有人类基因并确定其在染色体的位置,从而破译人类全部遗传信息。美国于1990年正式启动人类基因组计划,估计到2003年完成人类基因组全部序列测定。欧共体、日本、加拿大、巴西、印度、中国也相继提出了各自的基因组研究计划[1]。由于各国政府和科学家的共同努力,HGP目前已在为全球范围的合作项目;随着数理化、信息、材料等学科的渗透和工业化管理模式的引进,HGP已真正成为生命科学领域的科学工程,基因组(genomics)作为一门新兴学科也应运而生。
与此同时,科学界也在思索人类基因组计划完成后的下一步工作,因此就有了“后基因组计划”(post-genome project)的提法。大多数科学家认为原定于2003年所完成的人类基因组计划只是一个以测序为主的结构基因组学(structural genomics)研究,而所谓的“后基因组计划”应该是对基因功能的研究,即所谓的功能基因组学(functional genomics)。此外,一些新的概念如:“蛋白质组(proteome)”、“环境基因组学(environmental genomics)”和“肿瘤基因组解剖学计划(cancer genome anatomy project,CGAP)”等等也在不断向外延伸。
一、结构基因组学
(一)人类基因组作图
人类基因组作图根据使用的标记和手段不同,初期的作图有二种:一是通过计算连锁的遗传标记之间重组频率而确定它们相对距离的遗传连锁图,一般用厘摩(cM)来表示;二是确定各遗传标记之间物理距离的物理图,一般用碱基(bp)或千碱基(kb)或兆碱基(Mb)来表示。1cM的遗传距离大致上相当于1Mb的物理距离。随着研究工作的进展,遗传图和物理图逐渐发生整合,在此基础上大量引入基因标记,从而形成了新一代的转录图。