-
基因组学
基因组学(英文genomics),研究生物基因组和如何利用基因的一门学问。用于概括涉及基因作图、测序和整个基因组功能分析的遗传学分支。该学科提供基因组信息以及相关数据系统利用,试图解决生物,医学,和工业领域的重大问题。
基因组研究应该包括两方面的内容:以全基因组测序为目标的结构基因组学(structural genomics)和以基因功能鉴定为目标的功能基因组学(functional genomics),又被称为后基因组(postgenome)研究,成为系统生物学的重要方法。
基因组学能为一些疾病提供新的诊断,治疗方法。例如,对刚诊断为乳腺癌的女性,一个名为“Oncotype DX”的基因组测试,能用来评估病人乳腺癌复发的个体危险率以及化疗效果,这有助于医生获得更多的治疗信息并进行个性化医疗。基因组学还被用于食品与农业部门。基因组学与遗传学发展里程碑
基因组学的主要工具和方法包括: 生物信息学,遗传分析,基因表达测量和基因功能鉴定。 基因组学出现于1980年代,1990年代随着几个物种基因组计划的启动,基因组学取得长足发展。 相关领域是遗传学,其研究基因以及在遗传中的功能。
1980年,噬菌体Φ-X174;(5,368 碱基对)完全测序,成为第一个测定的基因组。
1995年,嗜血流感菌(Haemophilus influenzae,1.8Mb)测序完成,是第一个测定的自由生活物种。从这时起,基因组测序工作迅速展开。
2001年,人类基因组计划公布了人类基因组草图,为基因组学研究揭开新的一页。
基因组学是研究生物基因组的组成,组内各基因的精确结构、相互关系及表达调控的科学。基因组学、转录组学、蛋白质组学与代谢组学等一同构成系统生物学的组学(omics)生物技术基础。
功能基因组学
基因组DNA测序是人类对自身基因组认识的第一步。随着测序的完成,功能基因组学研究成为研究的主流,它从基因组信息与外界环境相互作用的高度,阐明基因组的功能。功能基因组学的研究内容:人类基因组 DNA 序列变异性研究、基因组表达调控的研究、模式生物体的研究和生物信息学的研究等。
(1)基因组表达及调控的研究。在全细胞的水平,识别所有基因组表达产物mRNA和蛋白质,以及两者的相互作用,阐明基因组表达在发育过程和不同环境压力下的时、空的整体调控网络。
(2)人类基因信息的识别和鉴定。要提取基因组功能信息,识别和鉴定基因序列是必不可少的基础工作。基因识别需采用生物信息学、计算生物学技术和生物学实验手段,并将理论方法和实验结合起来。基于理论的方法主要从已经掌握的大量核酸序列数据入手,发展序列比较、基因组比较及基因预测理论方法。识别基因的生物学手段主要基于以下的原理和思路:根据可表达序列标签(STS);对染色体特异性cosmid进行直接的cDNA选择;根据CpG岛;差异显示及相关原理;外显子捕获及相关原理;基因芯片技术;基因组扫描;突变检测体系,等等。
(3)基因功能信息的提取和鉴定。包括:人类基因突变体的系统鉴定;基因表达谱的绘制;“基因改变-功能改变”的鉴定;蛋白质水平、修饰状态和相互作用的检测。
(4)在测序和基因多样性分析。人类基因组计划得到的基因组序列虽然具有代表性,但是每个人的基因组并非完全一样,基因组序列存在着差异。基因组的差异反映在表型上就形成个体的差异,如黑人与白人的差异,高个与矮个的差异,健康人与遗传病人的差异,等等。出现最多基因多态性就是单核苷酸多态性(SNPs)。
(5)比较基因组学。将人类基因组与模式生物基因组进行比较,这一方面有助于根据同源性方法分析人类基因的功能,另一方面有助于发现人类和其他生物的本质差异,探索遗传语言的奥秘 。
结构基因组学
结构基因组学是继人类基因组之后又一个国际性大科学热点,主要目的是试图在生物体的整体水平上(如全基因组、全细胞或完整的生物体)测定出(以实验为主、包括理论预测)全部蛋白质分子、
蛋白质-蛋白质、蛋白质-核酸、蛋白质-多糖、蛋白质-蛋白质-核酸-多糖、蛋白质与其他生物分子复合体的精细三维结构,以获得一幅完整的、能够在细胞中定位以及在各种生物学代谢途径、生理途径、信号传导途径中全部蛋白质在原子水平的三维结构全息图。在此基础上,使人们有可能在基因组学、蛋白质组学、分子细胞生物学以致生物体整体水平上理解生命的原理。 对疾病机理的阐明、对疾病的防治有重要应用意义。
发展回顾
1998年4月,由美国国家医学科学院(NIGMS)和Wellcome Trust发起在英国召开了第一次国际结构基因组会议,美国、法国、英国、德国、加拿大、日本、荷兰、意大利以及以色列的9国科学家参加了会议。2000年9月,美国NIGMS决定首批投入1.5亿美元,在美国建设7个研究中心(已经发展成为10个),争取在未来10年内解出1万个蛋白质的三维结构,建立蛋白质的氨基酸残基序列、三维结构和生物功能之间的有机联系,同时也支持结构基因组方法学的研究。2002年,10家大型国际制药公司宣布启动结构基因组研究。2000年11月,日本组织召开国际会议讨论结构基因组计划的有关问题,确定了完成测定3000个蛋白质三维结构的“Protein3000计划”。2001年4月,在美国召开了第二次国际结构基因组会议,表明新一轮大规模的国际合作研究已经开始。
主要进展
我国在结构生物学研究方面具有较好的基础。60年代,我国科学家在世界上首次人工合成了胰岛素;70年代初又测定出1.8 埃; 分辨率的猪胰岛素三维结构,成为世界上为数不多的能够测定生物大分子三维结构的国家,这些研究工作处于当时的世界先进水平。在国际结构基因组研究刚露端倪之时,我国科学家杨焕明就敏感地抓住了这一新动向,2000年我国开展了结构基因组学的研究。国家863计划、973计划、中国科学院知识创新工程、国家重大攻关项目、自然科学基金先后重点资助了结构基因组学的研究工作和相关技术平台的建设。相关研究工作既有分工、又有交叉合作,并充分地考虑到了我国基因组水平研究的特点和我国在结构解析方法研究在国际上的地位。并计划在参加国际合作的基础上,在逐步建立基因组研究技术平台的同时,五年之中完成200-300个蛋白质三维结构的测定。
我国的结构生物学研究队伍不断发展壮大,中国科学院生物物理所、中国科技大学、北京大学、清华大学以及中国科学院物理所、高能所、上海生命科学院、福州物质结构所、上海复旦大学等单位均是我国开展结构基因组研究的重要基地。
我国结构基因组学研究虽然启动时间较短,但已经获得了不少重要进展。 据初步统计,已经完成了近千个克隆,已表达出210个蛋白质,其中有100多个可溶或部分可溶;获得近30个结晶和NMR样品,已经测定出5个结构。