barriers / 阅读 / 详情

蛋白质组的研究内容

2023-10-06 04:15:35
共1条回复
FinCloud

主要有两方面,一是结构蛋白质组学,二是功能蛋白质组学。其研究前沿大致分为三个方面:

① 针对有关基因组或转录组数据库的生物体或组织细胞,建立其蛋白质组或亚蛋白质组及其蛋白质组连锁群,即组成性蛋白质组学。

② 以重要生命过程或人类重大疾病为对象,进行重要生理病理体系或过程的局部蛋白质组或比较蛋白质组学。

③ 通过多种先进技术研究蛋白质之间的相互作用,绘制某个体系的蛋白,即相互作用蛋白质组学,又称为“细胞图谱”蛋白质组学。

此外,随着蛋白质组学研究的深入,又出现了一些新的研究方向,如亚细胞蛋白质组学、定量蛋白质组学等。蛋白质组学是系统生物学的重要研究方法.

蛋白质组学

相关推荐

蛋白质组学的定义?

蛋白质组学是大规模蛋白质的研究,通常是利用生物化学的方法。
2023-09-12 07:11:403

蛋白质组的介绍

蛋白质组(Proteome)的概念最先由Marc Wilkins提出,指由一个基因组(Genome),或一个细胞、组织表达的所有蛋白质(protein). 蛋白质组的概念与基因组的概念有许多差别,它随着组织、甚至环境状态的不同而改变。 在转录时,一个基因可以多种mRNA形式剪接,一个蛋白质组不是一个基因组的直接产物,蛋白质组中蛋白质的数目有时可以超过基因组的数目。 蛋白质组学(Proteomics)处于早期“发育”状态,这个领域的专家否认它是单纯的方法学,就像基因组学一样,不是一个封闭的、概念化的稳定的知识体系,而是一个领域。
2023-09-12 07:11:481

什么是蛋白质组学的基本技术流程

蛋白质组学的基本技术流程主要为以下四方面: 蛋白质标本的制备及分离:寻找较好的方法尽可能完全地抽提细胞或组织中的全部蛋白质是比较蛋白质组学研究的重要前提。蛋白质图像的差异对比分析:给予双向电泳所获得的凝胶图谱,可用图像分析软件进行分析对比。差异蛋白质肽段鉴定:图像分析显示的不相匹配点及有异常变化匹配点是比较蛋白质组学的兴趣所在。单排之数据库的搜索分析:蛋白质数据库是属性化的数据库,通过搜索蛋白质数据库可分析和确定该蛋白质性质特征,若搜索不到,可能为新蛋白。
2023-09-12 07:12:051

1. 蛋白质组学研究方法概述(上)

说明:此篇笔记系2016-2017年由克里克学院与康昱盛主办的蛋白质组学网络大课堂整理而成,侵删。该课程由上海交通大学系统生物医学研究院助理研究员库鑫博士所授。 大伙儿都知道,蛋白质组学(proteomics),是研究一种细胞或者一种生物体所表达的全部蛋白质。虽说现在基因组测序火得一塌糊涂,但是,我们不要忽略了,蛋白质才是执行生命体功能的基本单元,而且蛋白质都是通过形成各种复合物,组成通路网络,去行使各种生物学功能的!所以,有很多生物学问题只能在蛋白质层面上去研究去探索,而且需要站在系统的层面去考察,比如说:蛋白-蛋白相互作用、蛋白的细胞定位、翻译后修饰、信号通路及代谢通路的调控和功能等。这就是为啥蛋白质组学如此重要啦! 既然重要,科学家们自然是想尽办法来研究了!最开始使用的技术就是传说中的双向凝胶电泳(2-DE),由于分辨率低、蛋白质重叠等各种问题,无论是通量还是准确度,都不尽如人意。当质谱技术兴起以后,就迅速被替代了。 说起质谱技术的诞生,估计很多小伙伴都听过那个著名的diao丝逆袭的段子,讲的就是2002年诺贝尔化学奖得主田中耕一,作为蛋白质谱发明人之一,由于一个不小心在实验时错加了甘油,结果神奇地将质谱技术引入到鉴定生物大分子的应用领域。想想,大到整个人类的科技发展史,小到每个个体的人生,都充满了多少不可思议~ 当质谱技术与蛋白质组学碰到了一起,真是天雷引了地火,产生出强烈的化学反应,迅速引爆整个学科的发展!也就十几年的时间吧,蛋白质组学的研究目标从细胞模型、动物模型,到人的体液、组织等人体样本,应用范围的生物复杂度越来越高。研究目的呢,也从最初的肽段序列推导,到多肽和蛋白质的定性定量分析,翻译后修饰,再到如今成为新热点的靶向蛋白质组学,总之,势不可挡啊! 说到靶向蛋白质组学,咱们都知道,一直以来蛋白质组学的应用领域主要是针对基础生物学,比如研究通路、蛋白复合物、互作网络,表征细胞和组织的类型,观察细胞周期内蛋白质的表达等。近年来,由于技术的飞速发展,蛋白质组学开始被用于医学研究和药物研究。比如说药物研究,国内可能用得还不多,但在欧美已经开始越来越广泛。以肝毒性为例,蛋白质组学可以为药物研发前期的肝毒性评估提供研究手段。 那么,怎么将蛋白质组学应用到临床及药物研发中呢?就是需要靶向蛋白质组学技术了!以前,蛋白质组学技术主要用于发现新的未知物,比如肽段、蛋白复合物、蛋白的翻译后修饰等。这部分的应用很广,技术门槛比较低,方法比较通用。但问题是,这种方法思路没办法应对大量的临床样本,可重复性和准确性达不到要求。 于是,靶向分析开始兴起,就是说,分析之前我们就明确知道需要分析的物质是什么,然后把它挑出来,进行一个精确的定量和分析!我们不需要一次性验证成千上万的蛋白,但我们需要在成百上午的样本中验证十几种或者几十种我们关心的蛋白质,而且这些蛋白质常常都是浓度很低的蛋白,用传统的方法基本上只有被遗漏的命(后面我会详细讲为什么会遗漏)。有了靶向技术,对于研究临床诊断的生物标志物,就有了更大的可能和更强的支撑了! 那么接下来,根据老师讲课的思路,我就从定性检测、定量检测和靶向蛋白质组学三个方面来分享下听课的收获。 无论是定性还是定量检测,样品制备是跑不掉的准备工作。用于质谱的蛋白质样品,来源非常广泛,只要你是包含了蛋白质的东西,都可以作为来源。对于复杂的样品,比如人体体液或组织样本,蛋白质的提取及去高峰度,常常需要复杂的精细的处理,而且处理流程根据样本和研究目的的不同而不同。这部分内容呢,第二讲“样品前处理”会详扒,感兴趣的小伙伴可以期待我的下一篇听课笔记吧~ 话说,蛋白质的定性检测有两种思路:Bottom-up和Top down。Top down是指从一个完整的蛋白出发,在质谱中进行碎片化处理,通过对碎片分子的检测,推导出蛋白的序列。而在使用中真正占绝大多数是Bottom-up方法,也就是我们常说的shotgun方法,它充分利用了蛋白质自身的特点:可以被特定的酶在特定的位点切断。基本思路是,先用蛋白酶把蛋白序列进行酶切,再针对酶切后的肽段进行鉴定,所以进入质谱的检测对象永远是肽段,再根据肽段序列再推导出蛋白序列。 1. 样本处理 :拿到蛋白来源的各种样本,进行前处理和优化。 2. 蛋白分离 :根据研究需要,用凝胶分离,提取所需的蛋白,或者不分离,全部拿来检测,需要注意去杂质; 3. 酶切 :用序列特异性的酶,对蛋白进行酶切; 4. 肽段分离 :酶切后的肽段进入HPLC(高压液相色谱),这也就是我们常说的LC-MS中的LC,肽段会因为在色谱柱填料上的保留时间的不同,得到预分离; 5. 电离 :分离后的肽段,加电压使其离子化(ESI);或者用MALDI基质辅助的激光解离,就不需要HPLC的过程; 6. 质谱解析 :将带上电荷的肽段送入质谱,肽段会在磁场中发生偏转(质谱仪的基本原理),在质谱里收集信号,得到谱图。 7. 搜库 :用搜索软件对质谱图进行自动化的分析,得到肽段及蛋白序列信息。 换个角度,对Shotgun方法的流程,我们可以这样来总结: 这里面最关键的一个指标,我们叫Peptide-Spectrum matching(PSM),就是指谱图与肽段的匹配。匹配得越好,则反推出的蛋白就越准确。这个匹配的过程,也就是我们常说的搜库。那么接下来我就来分享一下从课程中学习到的搜库背景知识、搜库工具和算法,以及对搜索结果的评估。 质谱,听上去很高大上,无论有多贵重,都是由三部分组成的:离子源+质量分析器+检测器。 一台质谱可以不止一个离子源\分析器\检测器,可以把几种串联起来,针对不同分析需要来使用。 离子源 我们先来说说离子源。蛋白质谱所使用的ESI(Electrospray ionization)电喷雾离子化,对蛋白质组学来说是一个标志性的发明!因为是直接从液相进行离子化,使它与LC(液相色谱)的联用变得更加容易了,我们可以先用LC将非常复杂的肽段混合物进行预分离,减少每次分析物的复杂度,然后分离的肽段可以直接进入ESI,形成电离喷雾。 那么,ESI喷雾是怎么形成的呢?简单来说,分离柱前端有一个小开口,被分析物根据质量及电荷的不同,依次通过前端的小开口。小开口处加了电压,刚开始,静电力与表面张力相同,当加大静电力使它大于表面张力的时候,液膜破裂,形成无数带电的小液滴,就形成喷雾了。像现在比较新的nanoESI技术,LC的流速就更加慢,离子化的效果也更好。觉得以上描述还不够形象的童鞋,直接看图吧: 质量分析器 说完了离子源,接下来我们来说质量分析器,这是质谱仪里最重要的一部分。我们通常听到的各种质谱仪的名字,就是根据质量分析器的类型来命名的。我们样品中各组分在离子源中发生电离,并经加速电场的作用后,形成离子束,进入质量分析器中。质量分析器将带电离子根据其质荷比加以分离,记录各种离子的质量数和丰度,用于后续定性与定量的分析。 质量分析器有两个主要的技术参数:质量范围和分辨率。质量范围是指是所能测定的质荷比的范围,它决定了咱们能检测到的离子的范围。比如,ESI离子源能产生许多m/z大于3000的离子,如果你选的质量分析器的上限达不到3000,那么3000以上的离子你就检测不出来了。 然而,另一个更为重要的指标,就是质量分析器的分辨率!先上个公式描述: 分辨率=观测的一个质谱峰的质荷比/半峰高处的峰宽(FWHM) 啥意思呢?比如下图中最左边的那个峰,它的质荷比是1,085.55,峰高一半的地方的峰宽值是0.217,于是: 分辨率=1,085.55/0.217=5,000 如果这么讲还是不太明白,那你可以简单理解为,质谱分辨率越高,我们将得到越尖越细的谱峰。你可能会问:谱峰又尖又细的好处是什么?这是个好问题!事实上,分辨率可以表征两个相邻的谱峰在质谱中被区分开的能力。大家通过下图感受一下不同分辨率的质谱仪能给我们多么不同的谱峰图。 图中以Glucagon(胰高血糖素)为例,展示了不同分辨率的质谱仪给出的谱峰。当分辨率是1000时,只能看一个很宽的峰(蓝色);分辨率增加到3000时,峰窄一些(红色),但还感受不到明显的差别;当提高到10000时,很明显能看到,其实这里包含了8个峰(绿色);再提高到30000的时候,半峰宽更窄,两个相邻的峰可以彻底地被分开(黑色)。显然,我们在分辨率为1000或3000,不能准确的检测被分析肽段的精确分子量, 从而导致谱图无法匹配或者发生错配。 不同的质量分析器有不同的分辨率,通常的顺序是:傅里叶变换质谱分辨率最高,但造价太贵;其次是Orbitrap(轨道阱系列),分辨率远远高于其它质谱;再次是TOF(时间飞行质谱);然后是离子阱(Ion Trap);最后是四级杆质谱(Quadrupole)。 这里我多说一句,分辨率高固然好,但价格肯定就贵,选择质谱仪的时候要根据咱们自己的研究目的以及预算范围啦! 二级质谱 然而,要对肽段进行鉴定,一级质谱显然是办不到的,我们没法根据肽段离子m/z的值就推断出这个肽段由哪些氨基酸残基组成(可能的组合非常多),以及序列顺序是怎么样的,对吧?所以,鉴定肽段还需要二级质谱。 什么是二级质谱呢?简单来说,肽段混合物通过一级质谱得到了一级谱图,然后从中选择一个肽段,通过一些方法,比如,与随性气体进行碰撞,把肽段碰碎,得到碎片离子,再形成二级谱图。我们通过观察碎片离子的质量分布来推断肽断的残基组成,最后再反推出蛋白质是什么。上个图,帮助大家理解一下二级质谱是怎么来的。 在上一段,我提到是从一级质谱中“选择”一个肽段进入二级质谱。这里看似讲得云淡风轻,事实上怎么选却是一个很关键的问题!通常选择的方法我们可以叫做“TOP”法(这是我自己起的名字),比如TOP15就是指从一级谱里选前15个高度的峰,每一次分离一个肽段,然后对这个肽段进行扫描,得到二级谱图。 大家发现了没有?如果一个肽段在一级谱图中没有进入TOP15,那它连打二级谱图的资格都没有!原来质谱的世界竞争也是如何残酷!二级质谱能扫描哪些肽段是由一级质谱决定的,所以我们将这种方法称为“数据依赖性采集(DDA, data dependent acquisition)! 明白了吧,DDA这个名字就是这么来的!下次大伙儿再听到有人说DDA,心里不会再一百个问号飞过了吧? 咱们细想一下就不难发现,如果一个蛋白的浓度不够高,也就是说,它的肽段在一级谱图中很难成为那些TOPs,那么它能进入二级质谱的可能性基本上没有。这就是为什么低峰度蛋白很难被鉴定到!这也就是为什么我们在做比如血液这种样品的时候,一定要去除血红蛋白等高峰度蛋白(如果你想鉴定的蛋白不是血红蛋白的话)! 很显然,DDA方法的局限性就摆在那里!这叫想要研究低峰度蛋白的科学家们怎么忍?于是,一种叫做数据非依赖性采集(DIA)的新方法就应运而生了!关于这种方法的原理,下一篇推文会详扒。 我们再通过以下这个图来感受一下一级谱图与二级谱图之间的关系: 比如,第一个时间点,我们先进行MS1扫描,然后选一个峰高的肽段进行MS2扫描,依次类推。在一些扫描速度比较快的质谱仪里,一个MS1谱图可以进行80张MS2的扫描。 鉴定碎片离子 好,我们搞清楚了二级质谱是怎么来的,那么我们怎么根据检测到的离子信息来推测这是什么氨基酸呢?可能你会说,这还不简单么?根据分子量呀! 没错,不同的氨基酸,它的分子量不就是一个简单的值吗?然而,这件事却并没有这么简单,因为这个世界上还存在一个神奇的东西,它的名字叫同位素! 比如说碳元素,最常见的是原子量12的这种,我们叫C12,然而它还有一个同样很稳定的好基友,C13(多一个中子)。于是,我们得考虑到这两种稳定同位素的含量(百度百科说C13占 1.11%,C12占98.89%),对于一个氨基酸而言,我们就会得到两个不同的分子量: 为啥说平均呢?因为当肽段分子量越大,含有各种同位素的可能性及不同组合就越多,我们如果把每一种组合都算一遍分子量,这样会得到一个长长的list,到时候做谱图匹配时用哪一个值呢?也没谱。所以干脆用一个平均值来表示。 我们通过下表来感受一下各种不同的氨基酸残基的单同位素分子量与平均分子量有多大的区别: 可能你又会问,这两个不同的分子量分别在什么情况下用呢?这里又要说到分辨率了,如果咱们用的是高分辨率质谱仪,不同的同位素峰会被明显地分开,也就是说,谱图里我们能看几个同位素峰,这时我们就可以使用单同位素分子量,可以与相应的单同位素峰准确对应。但在低分辨率质谱仪里,这些峰很可能混在一起,看上去只是一个峰,这种情况下,也没办法,只能用平均分子量去近似一下了。 下面这个图可以很形象地展示出,单同位素分子量与平均分子量在质谱图上差别有多大。在高分辨质谱看来,这完全就是两种不同的离子了。上面我们也说了,根据平均分子量来计算,结果并不准确,但用单同位素分子量来计算,就可以准确对应了。 除了同位素,还有一个因素我们也需要考虑,那就是肽段碎裂进入二级质谱时,可能会形成三种不同的离子类型,这就是我们通常所说的by离子,ax离子和cz离子。 之所以会形成不同的离子对,是因为不同的碎裂方法,造成肽段断裂的位置不同。大伙儿看看上面这个图就明白了。当我们使用CID(碰撞诱导解离)或HCD(High-energy C-trap Dissociation)碎裂时,与惰性气体碰撞的是C-N键这里,C端生成y离子,N端生成b离子,这是二级质谱产生的最常见的离子对了。当我们使用ETD(电子转移解离)碎裂时,因为有一个电子反应的过程,在加上电子后才产生的碎裂,它的断裂位置可能出现在N-C键这里,形成cz离子,而TOF类仪器可能会产生ax离子。 离子类型的信息需要传递给后续的搜库步骤(通常我们在搜库软件中指定了仪器类型,软件就会自动匹配离子类型),计算机需要模拟最可能的碎裂位置,生成对应的理论谱图,然后拿来与实际谱图比对。我们以by离子为例,来看看对一个肽段来说,它可能碎裂成哪些碎片离子: 那么它可能会生成如下这样的谱图: 从谱图上看,这个肽段所有的by离子都检测到了。通常来说,对于丰度不错,长短合适的肽段,在高精度质谱仪上被完整捕获到的情况是很常见的。通常情况下50%-80%的by离子都能被捕获到。 下篇继续讲定性检测里的搜库工具、结果评估,以及定量检测的各种背景知识。
2023-09-12 07:12:121

蛋白质组学研究到底有多大意义

主要意义还是在研究生命的现象和促进人类的健康. 蛋白质是生理功能的执行者,是生命现象的直接体现者,对蛋白质结构和功能的研究将直接阐明生命在生理或病理条件下的变化机制. 而一些生命的现象不仅仅是某一个蛋白质决定的,有多个蛋白的相互作用,这就需要蛋白质组学的研究. 蛋白质组学的研究最终还是要服务于人类的健康,比如通过研究药物干预蛋白质间的相互作用,寻找靶分子等来促进分子医学的发展.
2023-09-12 07:12:231

什么是蛋白质组学?

这个概念最早是在1995年提出的,它在本质上指的是在大规模水平上研究蛋白质的特征,包括蛋白质的表达水平,翻译后的修饰,蛋白与蛋白相互作用等,由此获得蛋白质水平上的关于疾病发生,细胞代谢等过程的整体而全面的认识。 目前,在蛋白质功能方面的研究是极其缺乏的。大部分通过基因组测序而新发现的基因编码的蛋白质的功能都是未知的,而对那些已知功能的蛋白而言,它们的功能也大多是通过同源基因功能类推等方法推测出来的。有人预测,人类基因组编码的蛋白至少有一半是功能未知的。因此,在未来的几年内,随着至少30种生物的基因组测序工作的完成,人们研究的重点必将转到蛋白质功能方面,而蛋白质组的研究正可以完成这样的目标。在蛋白质组的具体应用方面,蛋白质在疾病中的重要作用使得蛋白质组学在人类疾病的研究中有着极为重要的价值。 疾病的产生可能仅仅是因为基因组中一个碱基对的变化,如β-血红蛋白第六位上的Glu变为Val就导致了镰刀型细胞贫血症的发生。然而,对于大多数疾病来说,其疾病发生机制要复杂的多。因此,对于疾病发生的分子机制的认识就需要一些能够解决这些复杂性的方法来完成。而作为细胞中的活性大分子,蛋白质无疑是与疾病相关的主要分子,蛋白表达水平的改变是与疾病,药物作用或毒素作用直接相关的。因此,基于蛋白质整体水平的蛋白质组学在人类疾病研究中无疑将发挥重要作用。 现在,蛋白质组学在人类疾病中的应用已经在一些疾病如皮肤病,癌症,心脏病中广泛开展了,而这些研究则主要集中在这样几个方面:寻找和疾病相关的单个蛋白,整体研究某种疾病引起的蛋白表达或修饰的变化,利用蛋白质组寻找一些致病微生物引起的疾病的诊断标记和疫苗等。下面,我们就将就蛋白质组学的基本技术和这些领域的应用作一些介绍。蛋白质组学研究的基本技术 对于蛋白质组学的研究来说,它的最基本的实验手段就是利用双向凝胶电泳(two-dimensional protein electrophoresis, 2DE),在整个 基因组水平上检测蛋白质表达的情况。双向凝胶电泳首先利用等电点聚焦来分离不同等电点的蛋白,再利用SDS-PAGE来分离不同分子量的蛋白,其分辨率是非常高的。微克级的蛋白质就可以被很好的分辨开了,如在微克级水平上,有人从一个蛋白混合物中最多分开了11200种蛋白质,数量是非常可观的。因而,微克级的蛋白的双向凝胶电泳常被用来初步检测表达或修饰有变化的蛋白。然后,同样的蛋白混合物样品可用于毫克级的2DE,这样,电泳图谱上的每一个多肽就可被纯化并进行下一步的分析,如质谱,末端或中间的氨基酸序列分析等。 仅仅进行双向凝胶电泳显然是远远不够的,因为由双向电泳得到的蛋白质表达情况的变化并不能和具体的何种蛋白表达出了变化联系起来。而一些如蛋白质印迹或凝集素亲和印迹等传统技术对于这方面的信息也帮助不大。为了鉴定这些由电泳得来的蛋白,质谱(MS,mass spectrometry)被广泛应用在蛋白质组学中。对于蛋白质的鉴定,有两种方法用的最为广泛,即MALDI-MS ( matrix-assisted laser desorption ionization)和ESI-MS (electrospray ionization)。这两种方法各有自己的 适用范围,通常前者对于分析高分子量的蛋白更有效,而后者对于蛋 白的检测灵敏度更高,常可达到飞克级水平以下。质谱可以用于蛋白质分析主要是因为它可以提供特定蛋白的不同方面的结构信息,如它可直接测定蛋白或多肽的分子量信息,也可用来获得一些蛋白质序列信息等。同时,质谱也可通过多肽片段分子量的改变来得到一些关于糖型,磷酸化和其它翻译后修饰的数据。因此,质谱对于蛋白质的鉴定是非常重要的,而它的进展也无疑会大大促进蛋白质组学的研究进展。单个的疾病相关蛋白的寻找 在疾病发生过程中,由于和疾病相关的遗传信息的变化常常会导致蛋白的种类和数量发生变化,而这些变化是可以被可以被高解析度的双向凝胶电泳所检测到的,这就是利用蛋白质组学寻找和鉴定疾病相关蛋白的依据。 结肠癌的产生是一个包含了多个基因突变的多步过程,这其中包括抑癌基因的功能丧失,癌基因的活化等。然而,肿瘤发生的具体机制仍不清楚。对于这样一种涉及多种蛋白的疾病,人们已经开始利用蛋白质组学来分析结肠粘膜发生恶性转化后的多肽的变化了。对照15例结肠癌病人和13例正常人的结肠表皮的双向凝胶电泳结果发现,二者分别含有882个和861个点,而这些点中,有一个蛋白,其分子量为 13kDa,等电点为5.6,它只在肿瘤组织中专一性的表达。在15个癌症样品中,有13例的此蛋白表达上调,占到了87%。进一步的研究也证实了这个蛋白在不同程度的癌症引起的发育异常中也有明显的表达水平上的差异。由双向电泳发现的这个可能与癌症相关的蛋白到底是什么蛋白呢?从电泳的凝胶上得到的这个点经胰蛋白酶水解后,得到的肽段由μ-HPLC分离后测序。测序的结果拿到两个序列,LGHPDTLNQ和VIEHMEDLDTNADK,这与钙粒蛋白B的情况完全吻合。进一步的用MALDI-MS分析的结果也证实了这个蛋白就是钙粒蛋白B。同时,结合以前的发现,即由钙粒蛋白B和A组成的异源二聚体蛋白钙防卫蛋白在胃肠肿瘤病人的粪便样品中含量有很大提高,钙粒蛋白B在肿瘤性转化的组织中的高专一性存在显示出它在结肠癌的产生中具有重要的作用。尽管蛋白的具体功能还需要进一步的阐明,但这个例子已经可以证明,由蛋白质组学方法寻找疾病相关蛋白肯定是可行的。 这方面的另一个例子是关于肝细胞癌的研究。双向凝胶电泳已经被成功的用于发现化学诱导的鼠的肝癌相关蛋白中。而双向电泳和蛋白质化学方法的联合应用也更深化了对这些癌症相关蛋白的具体特征的认识。在用N-甲基-N-亚硝基脲诱导了鼠的肝癌后,利用双向电泳发现了一些表达有变化的蛋白,经氨基酸序列分析后,分析其中一个蛋白是来源于肝癌的醛糖还原酶样蛋白( hepatoma-derived aldose reductase-like protein)。这个蛋白分子量为35KDa,等电点为7.4,它是 一种在肝癌和胚胎的肝中特异性表达的蛋白。利用双向电泳得到了这样一种可能和癌症相关的蛋白后,一些蛋白质化学的方法可用来对这种蛋白和疾病的相关性作进一步的研究。有人利用免疫组化的方法发现,直接针对来源于肝癌的醛糖还原酶样蛋白的抗体FR-1表明,这个蛋白在化学诱导的肝癌小鼠的发生肿瘤转化的前期和转化的早期就已经有很强的表达了,而正常肝组织中并无表达。这都是该蛋白涉及肝癌发生过程的有力证据。 已有的一些关于此蛋白的研究表明,醛糖还原酶是还原酶超家族的成员,在山梨糖醇途径中它可以催化葡萄糖向山梨糖醇的转化,而且在一些糖尿病的并发症的发生中它也有作用。作为一种酶,它可以水解一些生物异源物质等,因此它也参与了一些解毒过程。而在肝癌发生过程中,一些解毒酶的表达水平或活力增高已是公认的事实了。对于醛糖还原酶这一类有解毒功能的蛋白来说,只有由双向电泳发现的肝癌来源的醛糖还原酶样蛋白是与肝癌相关的。它首先在胚胎肝中表达,但在成年的肝中就不表达了。肝癌发生时,它又重新表达了。因此,目前可以初步推断,醛糖还原酶样蛋白在肝癌发生过程中是与肝的解毒过程相关的。现在,在人的肝癌中,也找到了鼠的醛糖还原酶样蛋白的同源蛋白,它同样是在人的不同组织中选择性表达的。疾病相关蛋白的整体研究 对于大多数疾病来说,疾病造成的往往不只一个或几个蛋白的变化,参与疾病过程的蛋白的数目也是很大的,因此除了通过双向凝胶电泳来寻找与疾病相关的单个蛋白外,通过蛋白质组对表达情况有变化的蛋白在整体水平上的研究同样是非常重要的。目前,在利用双向凝胶电泳进行的蛋白整体水平的研究方面,扩张性的心肌病(Dilated cardiomyopathy, DCM)是一个较好的例子。 扩张性的心肌病是一种严重的心脏疾病,对于这种疾病的致病机理和涉及的分子都还不清楚,而且,对于这样一种复杂的疾病来说,也不可能仅由一种致病机理造成。因此,对于这样的疾病,从整体的蛋白质组水平来研究是极为必要的。另外,相对其它组织而言,主要由心肌细胞组成的心脏是一种相对均一的组织,这也为用双向凝胶电泳进行蛋白质组的研究提供了良好的基础。对DCM的蛋白质组的研究在九十年代初就已经开始了,目前,心肌的双向凝胶电泳的数据库已经建立。尽管国际上各实验室之间的数据之间有着如不同的样品制备,不同的等电聚焦条件,不同的凝胶大小等差异,但这些数据的比较证明,在大多数情况下,不同蛋白的点的位置还是相对稳定的,可以进行大规模的比较研究。 在Knecht等人的研究中,得到了一个高解析度的具有大约3300个心肌蛋白点的双向电泳结果,并对其中的150个蛋白进行了氨基酸分析,N端和中间的Edman降解以及MALDI-MS等一系列鉴定。而对几百个正常和扩张性心肌病的病人的2-DE结果比较发现,两者的蛋白条带具有可比性。除去一些可能由不同的疾病有关参数如患病程度,用药情况,病人年纪等因素造成的无重复性的点的多少和强度的变化外,患病者和正常人有25种蛋白在统计学上具有显著差异。这些即是DCM相关蛋白。而这个结果是在对几百个样品的大规模研究的基础上得来的,而也只有大规模的研究,才能体现出这个结果在实际应用前景上的价值。对于这几十种疾病相关蛋白,我们可以用一些其它方法,如免疫组化,酶活测定等,来作进一步的鉴定,确认它们与疾病的相关性以及它们在疾病中的作用等。这些工作都是在基于蛋白质组的研究基础上进一步的深入而进行的,显然,在几百个DCM患者和正常对照的样品的大规模水平上对疾病相关蛋白的整体研究无疑是最为基础和有效的。病原微生物的蛋白质组学分析 近几年来,关于传染病的研究变得比原来更为重要。一些新的传染原,如Borrelia burgdorferi,HIV,Ebola病毒等的出现,使得一些原来认为已被控制的疾病如结核,多抗药性的链球菌属感染等又有所增 加。因此,对于有毒力的微生物和病毒进行蛋白质组学的分析就显得非常必要,它可以用来寻找和研究毒力因子,抗原,疫苗等,而这些对于疾病的诊断,治疗和防治是极为重要的。目前,已经有18种微生物的基因组测序已经完成,而另有60多种的微生物的基因组测序正在进行当中,这些基因序列的信息和相对真核组织来说少得多的基因数量都为蛋白质组的研究提供了良好的基础。 疏螺旋体属的Borrelia burgdoferi是引起多系统疾病人类Lyme氏疏 螺旋体病的主要致病因子。这种疾病的症状开始时常表现为一些环状红斑样皮疹以及流感样症状,发展下去也会造成一些神经系统的并发症和关节炎等。目前,对这种疾病的诊断主要是通过临床症状的判断并辅以血清学实验如ELISA,免疫印迹等来证实。由于这些实验具有不同程度的敏感性和特异性,诊断并不是标准化的。利用蛋白质组学的研究提供一些新的较为标准的诊断标记就显得尤为必要了。 Borrelia burgdoferi的染色体上有853个基因,它的11个质粒上有额 外的430个基因。它的双向凝胶电泳图谱大约有300个点,由这些蛋白点就可以寻找免疫相关抗体等蛋白了。将银染的 Borrelia burgdoferi的 2DE凝胶上的其中217个点编号后,用来源于兔子的多克隆抗体采用免 疫杂交的方法鉴定了一些抗原在胶上的位置,如外表面蛋白A(OspA),OspB,OspC,p83/100,p39,flagellin p41等。除了p83/100外,所有 抗原在2DE图上都存在于不只一个点上。利用不同表现症状的Lyme氏 疏螺旋体病病人的血清与疏螺旋体的2DE图进行印迹分析发现,具有 红斑迁移症状的十个病人的血清中分别含有60种和88种抗原的IgM型和IgG型抗体,而关节炎病人的血清中含有15种抗原的IgM抗体和76种不同抗原的IgG抗体,晚期神经疏螺旋体病人的血清中则含有33种抗原的IgM抗体和76种抗原的IgG抗体,但在这三种不同疾病时期的病人血清中都含有这样几种抗原的抗体,OspA,OspB,OspC,flagellin,p83/100,p39等,这几个抗原同时也是原来血清学实验中用来诊断的标记,蛋白质组的结果验证了原来诊断的合理性,同时,2DE的结果也发现了一些原来并没有发现的抗原,这些正是一些新的潜在的诊断标记。更多诊断标记的发现对于诊断的标准化和准确性的提高大有帮助。 弓形虫病是由原生动物Toxoplasma gondil寄生感染引起的,全世 界约有30%的人携带此种寄生虫,而在欧洲,弓形虫病是发生频率最 高的传染病之一,因此,这种疾病的危害是相当高的。在健康人群中,寄生虫的感染通常是无症状的或症状极其轻微的,但如果是怀孕期间感染,寄生虫就会通过胎盘,并造成胎儿的死亡。随着怀孕时间的增加,寄生虫穿透的可能性也会增加。因此,确定感染的时间就显得非常重要了。另一方面,怀孕不同时期的感染后果也是不同的,在怀孕早期,器官形成过程时的感染危害可能是致死的,而怀孕的后期,胎儿的感染经常会导致一些并发症的出现如视网膜色素异常等。如果在怀孕期间感染的妇女得到了充分的治疗,胎儿感染的可能和后果的严重性都会大大降低。因此,及时的诊断和准确判断感染时间对于弓形虫病的治疗是非常重要的。 但实际上,90%以上的怀孕妇女的初期感染都不能被及时发现。目前的诊断主要是依靠血清学手段和PCR方法,而用血清学的方法来检测抗体对于一些无免疫应答的和怀孕的病人显然是不够的,而潜伏性感染致病恰恰是经常发生在无免疫应答的人中。如在艾滋病患者中, T.gondil就是导致脑内病变并致死的主要原因。由这些都可看出,疾病的有效的诊断对于有效的治疗是非常关键的。同样,蛋白质组水平上的研究为这方面的进展提供了非常有力的方法。我们可以用不同感染情况的病人的血清和T.gondil的2DE图进行免疫印迹来寻找和感染相关的抗 原来作为诊断标记。这些不同的血清包括:急性感染弓形虫病的 怀孕妇女的血清,急性弓形虫病的非怀孕病人的血清,潜伏性感染弓形虫的尚未发病者的血清。结果显示,2DE图上的9个点可以和感染者血清中的任一类型的免疫球蛋白反应,且这种反应和感染的状态和发病与否无关,这9个点就可用来作为T.gondil 感染的标记。另外有7个点 和抗体的反 应则与抗体类型或发病情况有关,可用来区分不同疾病状 况如潜伏期和急性期等,它们同样可作为进一步判断感染状态的诊断标记使用。小结 双向凝胶电泳就象一个分子显微镜,将复杂的蛋白混合物分离开来,而进一步的由疾病和对照的比较可以找到一些疾病相关蛋白。目前,蛋白质组的应用最多的领域就是通过疾病和对照的2DE条带的比较寻找单个的疾病相关蛋白,钙粒蛋白B在结肠癌中的表达上调和肝癌来源的醛糖还原酶样蛋白在鼠的肝癌发生过程中的重新表达就是两个典型的例子。这些蛋白和疾病的相互关系还可以通过免疫组化等方法进一步的鉴定。而另一方面,利用蛋白质组来进行整体水平上的研究也是不可缺少的。如对扩张性心肌病的研究就显示出了患病者和对照的 25种蛋白的显著差异,人的心肌的包括了3300个蛋白的双向凝胶电泳数据库也已经建立了。对于整体水平上的研究而言,规模越大,使用样品数目越多,对分子机制的研究可能就越深入,因而国际间的协作是非常重要的。蛋白质组学应用的另一领域是在致病微生物的诊断用蛋白的寻找方面,如在上面所提到的Borrelia burgdoferi引起的Lyme氏 疏螺旋体病和Toxoplasma gondil引起的弓形虫病等,由蛋白质组学得 来的诊断标记甚至还可用来区分不同的疾病时期,这些都为有效的 诊断检测的发展提供了基础。蛋白质组学的研究在蛋白质功能和人类疾病研究方面为我们开辟了一个新的领域,尽管它还处于刚刚起步的不成熟期,很多技术还有待完善和发展,但它的潜力是不可低估的,在将来,蛋白质组在人类疾病中的应用也必然会更加广泛和深入。
2023-09-12 07:12:341

蛋白质组学可以不做实验吗

不可以。蛋白质组学(英语:proteomics,又译作蛋白质体学),是以蛋白质组为研究对象,研究细胞、组织或生物体蛋白质组成及其变化规律的科学,我们是需要通过实验来验证的。
2023-09-12 07:12:571

蛋白质组学主要包括哪些分析技术及各自特点.

双向凝胶电泳  双向凝胶电泳的原理是第一向基于蛋白质的等电点不同用等电聚焦分离,第二向则按分子量的不同用SDS-PAGE分离,把复杂蛋白混合物中的蛋白质在二维平面上分开。由于双向电泳技术在蛋白质组与医学研究中所处的重要位置,它可用于蛋白质转录及转录后修饰研究,蛋白质组的比较和蛋白质间的相互作用,细胞分化凋亡研究,致病机制及耐药机制的研究,疗效监测,新药开发,癌症研究,蛋白纯度检查,小量蛋白纯化,新替代疫苗的研制等许多方面。近年来经过多方面改进已成为研究蛋白质组的最有使用价值的核心方法。等电聚焦  等电聚焦(isoelectric focusing,IEF)是60年代中期问世的一种利用有pH梯度的介质分离等电点不同的蛋白质的电泳技术。等电聚焦凝胶电泳依据蛋白质分子的静电荷或等电点进行分离,等电聚焦中,蛋白质分子在含有载体两性电解质形成的一个连续而稳定的线性pH梯度中电泳。载体两性电解质是脂肪族多氨基多羧酸,在电场中形成正极为酸性,负极为碱性的连续的pH梯度。蛋白质分子在偏离其等电点的pH条件下带有电荷,因此可以在电场中移动;当蛋白质迁移至其等电点位置时,其静电荷数为零,在电场中不再移动,据此将蛋白质分离。生物质谱  生物质谱技术是蛋白质组学研究中最重要的鉴定技术,其基本原理是样品分子离子化后,根据不同离子之间的荷质比(M/E)的差异来分离并确定分子量。对于经过双向电泳分离的目标蛋白质用胰蛋白酶酶解(水解Lys或Arg的-C端形成的肽键)成肽段,对这些肽段用质谱进行鉴定与分析。目前常用的质谱包括两种:基质辅助激光解吸电离-飞行时间质谱(MALDI-TOF-MS)和电喷雾质谱(ESI- MS)。飞行时间质谱  MALDI 的电离方式是 Karas和Hillenkamp于1988年提出。MALDI的基本原理是将分析物分散在基质分子(尼古丁酸及其同系物)中并形成晶体,当用激光(337nm的氮激光)照射晶体时,基质分子吸收激光能量,样品解吸附,基质-样品之间发生电荷转移使样品分子电离。它从固相标本中产生离子,并在飞行管中测定其分子量,MALDI-TOF-MS一般用于肽质量指纹图谱,非常快速(每次分析只需3~5min),灵敏(达到fmol水平),可以精确测量肽段质量,但是如果在分析前不修饰肽段,MALDI-TOF-MS不能给出肽片段的序列。电喷雾质谱(ESI-MS)  ESI- MS是利用高电场使质谱进样端的毛细管柱流出的液滴带电,在N2气流的作用下,液滴溶剂蒸发,表面积缩小,表面电荷密度不断增加,直至产生的库仑力与液滴表面张力达到雷利极限,液滴爆裂为带电的子液滴,这一过程不断重复使最终的液滴非常细小呈喷雾状,这时液滴表面的电场非常强大,使分析物离子化并以带单电荷或多电荷的离子形式进入质量分析器。ESI-MS从液相中产生离子,一般说来,肽段的混合物经过液相色谱分离后,经过偶联的与在线连接的离子阱质谱分析,给出肽片段的精确的氨基酸序列,但是 分析时间一般较长。   目前,许多实验室两种质谱方法连用,获得有意义的蛋白质的肽段序列,设计探针或引物来获得有意义的基因。随着蛋白质组研究的深入,又有多种新型质谱仪出现,主要是在上述质谱仪的基础上进行改进与重新组合
2023-09-12 07:13:081

蛋白质组研究的发展历史

虽然第一次提出蛋白质组概念是在1994年,但相关研究可以追溯到上世纪90年代中期甚至更早,尤其是80年代初,在基因组计划提出之前,就有人提出过类似的蛋白质组计划,当时称为Human Protein Index计划,旨在分析细胞内的所有蛋白质。但由于种种原因,这一计划被搁浅。90年代初期,各种技术已比较成熟,在这样的背景下,经过各国科学家的讨论,才提出蛋白质组这一概念。国际上蛋白质组研究进展十分迅速,不论基础理论还是技术方法,都在不断进步和完善。相当多种细胞的蛋白质组数据库已经建立,相应的国际互联网站也层出不穷。1996年,澳大利亚建立了世界上第一个蛋白质组研究中心:Australia Proteome Analysis Facility ( APAF )。丹麦、加拿大、日本也先后成立了蛋白质组研究中心。在美国,各大药厂和公司在巨大财力的支持下,也纷纷加入蛋白质组的研究阵容。去年在瑞士成立的GeneProt公司,是由以蛋白质组数据库“SWISSPROT” 著称的蛋白质组研究人员成立的,以应用蛋白质组技术开发新药物靶标为目的,建立了配备有上百台质谱仪的高通量技术平台。而当年提出Human Protein Index 的美国科学家Normsn G. Anderson也成立了类似的蛋白质组学公司,继续其多年未实现的梦想。2001年4月,在美国成立了国际人类蛋白质组研究组织(Human Proteome Organization, HUPO),随后欧洲、亚太地区都成立了区域性蛋白质组研究组织,试图通过合作的方式,融合各方面的力量,完成人类蛋白质组计划(Human Proteome Project)。蛋白质组学虽然问世时间很短,但已经在研究细胞的增殖、分化、异常转化、肿瘤形成等方面进行了有力的探索,涉及到白血病、乳腺癌、结肠癌、膀胱癌、前列腺癌、肺癌、肾癌和神经母细胞瘤等,鉴定了一批肿瘤相关蛋白,为肿瘤的早期诊断、药靶的发现、疗效判断和预后提供了重要依据。鉴于蛋白质组学发展前景的重要性和技术的先进性,西方各主要发达国家纷纷投巨资全面启动蛋白质组的研究。如美国国立卫生研究院,美国能源部、欧共体等均启动了不同生物蛋白质组的研究并取得明显进展,一批高质量的研究论文相继在国际著名学术刊物发表。由于蛋白质组学研究比基因组学研究更接近实用,有着巨大的市场前景,企业与制药公司也纷纷斥巨资开展蛋白质组研究。独立完成人类基因组测序的Celera公司已宣布投资上亿美元于此领域;日内瓦蛋白质组公司与布鲁克质谱仪制造公司联合成立了国际上最大的蛋白质组研究中心。为了促进国家与地区性的蛋白质组的发展、合作与交流,成立了国际人类蛋白质组组织 (HUPO),在法国召开了首届国际蛋白质组大会,并迅即在北美、欧洲、韩国、日本成立了相应的分支机构。蛋白质组学已成为西方各主要发达国家、各跨国制药集团竞相投入的“热点”。
2023-09-12 07:13:181

4. 蛋白质组学数据分析基础(1)

说明:此篇笔记系2016-2017年由克里克学院与康昱盛主办的蛋白质组学网络大课堂整理而成,侵删。该课程由上海易算生物科技有限公司CEO沈诚频博士所授。 话说,蛋白质质谱从十几年前就形成了固定的数据结构和格式。现在常用的搜库格式,比如mascot的mgf,从十年前就基本固定下来。 到目前为止,质谱界的数据格式因为仪器的不同,有几个不同的大类: 这些数据格式的扩展名有一定的差别,且原始数据里包含的内容也有所不同。具体包含哪些重要的信息,稍后我们还会详细讲到。 数据分析,最终都是为了拿到一个可信的结果。所以,我们在讲具体的分析原理之前,先得来聊聊,我们做一次高通量的蛋白质定性、定量实验,以及搜库鉴定及定量分析等步骤,对结果报告有哪些质控要求。 首先,我们做完实验,在拿到下机数据的时候,大多数小伙伴们都会把数据放到各种搜库软件中,比如Mascot或者Thermo的Proteome Discoverer,导入原始数据,设定一些搜库参数,就可以得到结果了。 但是,作为一个严谨的实验方案设计来说,在分析的过程中,是需要对自己的数据有一个前期质控的,这样可以帮助大家判断数据分析结果的可靠性。所以说,基本的质控可以帮助我们对实验结果进行一个预判。 举个例子。 我们打开一个实验的下机数据,就可以预判我们的样品中是否发生了高分子塑料的PEG污染,有没有超高丰度的蛋白,或者有没有被严重的盐类污染。这些数据都可以从原始数据的可视化视图中看到。 不同的质谱软件,打开原始数据的方式不同,但这些信息都是可见的。另外,当两次实验搜索到的蛋白数量差异比较大时,也可以从TIC图来判断其原因。此外还可以判断分离的效率,以及是否出现喷雾中断等情况。 对于蛋白鉴定的结果,或者绝大多数的搜库算法,都要求对结果进行FDR控制,以及unique peptide的控制等等。如果我们要发表这些数据,绝大多数的期刊杂志也都会要求提供这些质控的信息。 那么,问题就来了,为什么要做这样的要求呢? 事实上,我们做好了质控,就能够看到一个总的鉴定的比例。比如说像常规的定量实验,用的最多的是iTRAQ。 举个例子。 假设总蛋白数只有2446个,算是比较少的,而总的谱图数是53万张,那么它的谱图鉴定率在当前条件下是32%(有些质控软件可以直接报告谱图鉴定率,比如Scaffold),我们可以判断当前的实验并没有出现重大的问题,鉴定率不高主要是因为存在高丰度蛋白,而这个后续可以进行详细的查看。 对于定量实验,不管我们使用的是SILAC,iTRAQ还是Label Free,都需要对定量结果进行准确性控制(详细内容,后续课程还会展开讲解)。一般来说,我们需要用相应的软件和统计方法来进行质控。 经过这几步的判断之后,可以得到一个初步的结果,比如说谱图数量是否和之前的结果差不多,质量精度及鉴定率如何,高丰度蛋白的存在与否,是否受污染,分离效率如何,定量是否准确,标记效率是否ok,等等,这些信息都可以得到。这样,我们最终可以得到一个准确可靠的蛋白质组学鉴定或定量结果用于后续的分析了。 那么,如何通过查看原始数据来进行初步质控呢? 首先,我们从原始数据出发,可以看到下图(以Data-dependent-acquisiton数据依赖性扫描为例),是从色谱出来的一个LC分离得到的TIC图,其中的信号采集都是在质谱中完成的,它其实就是将色谱逐渐通过喷雾的方式进入质谱的那些信号进行逐一的扫描,然后在其中挑选高强度的谱峰进行二级碎裂。 关于LC分离,以及TIC图的详细介绍,请参考上一节课的内容: 下图就是色谱离子流图的某个瞬间。横坐标是质荷比,纵坐标是信号强度。这个瞬间进入色谱的有这样一些信号,信号强度最高的是质荷比为477.31的肽段,其他一些肽段也可以进行查看。 这是我们在打开质谱的下机数据所能看到的最直观的结果。我们需要了解的是,这只是我们所有结果的某一个瞬间,某一个scan。这一个scan是否能够反映整个结果的好坏是不确定的,所以后续我们需要进一步的展开。 对于质谱来说,在这一步会自动选择其中一个比较强的峰,比如说477,它会进行一个动态的排除,这也是Data-dependent-acquisiton的一个重要参数。就是说,在多少秒之内,这么强的一个峰如果一直反复出现的话,那么在后续的扫描过程中,我们不去再对它进行进行MS2碎裂了。 比如说如图的477.31,我们质谱仪器记录时发现前面已经对它做过二级碎裂了,那么我们就有可能选择另外一个比较弱的谱峰。比如552.80,将它进行二级碎裂。 我们再来看一眼二级谱峰,如下图,就是对我们全长的进入质谱的肽段信息进行打碎,得到相应的B/Y离子,如下图,这些在后面我们会进行详细的讲解。 下图是Thermo质谱的原理示意图(由Thermo工程师提供)。这是QE的原理图,我们先在绿色的范围内进行一次full scan的mass扫描,然后判断当前选择的离子信号强度,以及在最近的几十秒钟之内是否对其进行扫描过。 如果没有,那么在紧接着的循环过程中,我们会对之前30秒之内(假设当前的仪器速度可以达到10个MS)没有扫描过的最强的十个谱峰进行二级碎裂,那么质谱就会依次将色谱推进来的喷雾中的肽段进行依次碎裂。 这就是DDA模式基本的原理。我们的数据也是根据这样的一个过程来记录的。 如果将刚才的扫描过程二维展开,可以得到下图,看上去跟二维凝胶电泳图很像吧?横坐标是质荷比,纵坐标是保留时间,而刚才那张图横坐标是保留时间,纵坐标是强度(LC seperation图),所以,此图没有质荷比信息。 我们知道,在进入full scan的MS扫描时是有质荷比信息的。所以简单的讲,上图是将刚才的两张图的信息拼接,然后将整个下机数据所有的瞬间都进行了一个拼接,由于维度的限制,因此信号强度信息无法再展示了。 但在此图中用了颜色的深浅来表示保留时间,颜色深的就是相对信号较强的肽段。而图中的每一根小线段都代表一个肽段,小线段的长度对应着肽段的保留时间,加上横坐标质荷比的信息,因此通过这张全局纵览图,就能够看到我们这次实验分离的效果如何,有没有PEG、盐、或者其它污染,有没有喷雾中断等情况发生,这些都能在这张图中有一个大致的把握。 因此,这张图对于我们进行数据质控非常有用。不同的软件和仪器有不同的方法来提供这张图。此次举例用的图是由Peaks软件得来的。 我们可以在上图中选定自己感兴趣的部分,画一个小方框,将方框中的内容进行打开放大,就得到了下图我们存储数据的结果形式了。这是在Qual Browser里打开我们的数据看到的结果。 其实这就是将我们的模拟图转换成数据信号,储存在我们的Raw文件中,或者说进一步提取成MGF文件所用到的相关信息。 这里主要包含两大类信息:MS1和MS2的信息,也就是full scan mass和二级碎裂的信息。这两类信息的结构式是一模一样的,都是包含质核比、强度值,以及相对信号强度。 比如说794.03谱峰,相对信号强度是100,也就是在这张谱图中,这是最强的一个峰,信号强度是3558210.8。那么对于我们质谱的搜索来说,一级信息和二级信息都是需要用到的,其中一级信息是首要的,也就是图中MS1部分,是后续搜库的关键信息。而二级谱图的强度信息一般用于定量,也就是说如果不是做SILAC或者非标记定量,这些信息不是最重要的。 另外,第一栏的信息准确性也是非常重要的。比如图上红框内,我们可以得到的信息是,794.03和794.36强度大约差了1.5倍,后面的峰强度差了大约2倍,再看下红框内四个数据的质荷比相差并不大,我们的质谱仪器因此会判断这四个峰非常符合一个肽段的同位素分布(肽段同位素分段的性状,后续将会讲解)。 回到此图,794.03应该是一个肽段,后面三个数据是同一个肽段,这就是我们进行precursor识别的原理。有些时候质谱会识别错误,认为红框上一行的793.69更可能是同位素,这个就需要我们自己进行校正。 质谱在搜集信号的时候,会告诉我们794.03是一个母离子或者说是肽段的谱峰,因此在后续进行MS2碎裂的时候,会挑选这样一个谱峰,以及在质谱中我们会设定相应的窗口去打碎它。因为仅仅设定一个非常小的窗口,可能信号不够。我们会设计比如正负1.5个道尔顿的窗口,把这些信号全部采集进去进行二级碎裂得到二级信号。 现在高分辨质谱中,二级信号也会包含同位素信息,因此数据分析软件需要对这些信息进行有效的处理。 大家可以看到,这样一个例子中,软件记录的是794.03,但实际我们可以通过肉眼观察,793.69跟794.03就只相差0.33~0.34,也是一个三电荷同位素的差值(1除以0.33是3,这就是质荷比中的Z的计算原理)。两者分别的强度271万和355万差别也不是非常大,我们会判断出793.69更可能是零同位素峰(如何判断后面会再讲解)。 我们进行后续数据提取和采集的时候,也就是用了这样的信息来进行分析。我们记录的一级质谱数据,以及二级质谱对应的列表,其中最重要的是m/z和intensity,在一级质谱数据中,强度并不用于蛋白鉴定的打分,但二级质谱数据中的强度值却会被用于打分。 下篇将聊聊同位素的问题,以及如何解读原始谱图包含的信息。
2023-09-12 07:13:481

蛋白质组研究的发展趋势

在基础研究方面,近两年来蛋白质组研究技术已被应用到各种生命科学领域,如细胞生物学、神经生物学等。在研究对象上,覆盖了原核微生物、真核微生物、植物和动物等范围,涉及到各种重要的生物学现象,如信号转导、细胞分化、蛋白质折叠等等。在未来的发展中,蛋白质组学的研究领域将更加广泛。在应用研究方面,蛋白质组学将成为寻找疾病分子标记和药物靶标最有效的方法之一。在对癌症、早老性痴呆等人类重大疾病的临床诊断和治疗方面蛋白质组技术也有十分诱人的前景,目前国际上许多大型药物公司正投入大量的人力和物力进行蛋白质组学方面的应用性研究。在技术发展方面,蛋白质组学的研究方法将出现多种技术并存,各有优势和局限的特点,而难以象基因组研究一样形成比较一致的方法。除了发展新方法外,更强调各种方法间的整合和互补,以适应不同蛋白质的不同特征。另外,蛋白质组学与其它学科的交叉也将日益显著和重要,这种交叉是新技术新方法的活水之源,特别是,蛋白质组学与其它大规模科学如基因组学,生物信息学等领域的交叉,所呈现出的系统生物学(System Biology)研究模式,将成为未来生命科学最令人激动的新前沿。
2023-09-12 07:13:561

论述蛋白质组学与基因组学的区别和联系

组学omics,研究的是整体. 按照分析目标不同主要分为基因组学,转录组学,蛋白质组学,代谢组学。基因组学研究的主要是基因组DNA,使用方法目前以二代测序为主,将基因组拆成小片段后再用生物信息学算法进行迭代组装。当然这仅仅是第一步,随后还有繁琐的基因注释等数据分析工作。转录组学研究的是某个时间点的mRNA总和,可以用芯片,也可以用测序。芯片是用已知的基因探针,测序则有可能发现新的mRNA,蛋白组学针对的是全体蛋白,组要以2D-Gel和质谱为主,分为top-down和bottom-up分析方法。理念和基因组类似,将蛋白用特定的物料化学手段分解成小肽段,在通过质量反推蛋白序列,最后进行搜索,标识已知未知的蛋白序列。代谢组分析的代谢产物,是大分子和小分子的混合物,主要也是用液相和质谱。总而言之,这些技术都想从全局找变量,都是一种top-down的研究方法,原因很简单:避免‘只缘身在此山中"的尴尬。但因为技术局限,都各有缺点,尤其是转录组和蛋白组数据,基本上颠覆了以前一直认为的mRNA水平能代表蛋白水平的观念,因为这两组数据的重合度太低。所以目前很多研究都开始使用交叉验证方法。无论如何,都需要对数据进行分析,有经验的分析往往能化腐朽为神奇。
2023-09-12 07:14:131

生物质谱技术在蛋白质组学中的应用有哪些

生物质谱技术在蛋白质组学中的应用有哪些对分离的蛋白质 进行鉴定是蛋白质组研究的重要内容,蛋白质微量测序、氨基酸组成分析等传统的蛋白质鉴定技术不能满足高通量和高效率的要求,生物质谱技术是蛋白质组学(Proteomics)的另一支撑技术。生物质谱技术在离子化方法上主要有两种软电离技术,即基质辅助激光解吸电离(matrix―assisted laser desorption/ionization,MALDl)和电喷雾电离(electrospray ionization,ESl)。MALDI是在激光脉冲的激发下,使样品从基质晶体中挥发并离子化。ESI使分析物从溶液相中电离,适合与液相分离手段(如液相色谱和毛细管电泳(capillary electrophoresis))联用。MALDI适于分析简单的肽混合物,而液相色谱与ESI―MS的联用(LC―MS)适合复杂样品的分析。软电离技术的出现拓展了质谱的应用空间,而质量分析器的改善也推动了质谱仪技术的发展。生物质谱的质量分析器主要有4种:离子阱(iontrap,IT)、飞行时间(TOF)、四极杆(quadrupole)和傅立叶变换离子回旋共振(Fourier transform ion cyclotron resonance,FTICR)。它们的结构和性能各不相同,每一种都有自己的长处与不足。它们可以单独使用,也可以互相组合形成功能更强大的仪器。离子阱质谱灵敏度较高,性能稳定,具备多级质谱能力,因此被广泛应用于蛋白质组学(Proteomics)研究,不足之处是质量精度较低。与离子阱相似,傅立叶变换离子回旋共振(FTICR)质谱也是一种可以“捕获”离子的仪器,但是其腔体内部为高真空和高磁场环境,具有高灵敏度、宽动态范围、高分辨率和质量精度(质量准确度可很容易地小于1mg/L),这使得它可以在一次分析中对数百个完整蛋白质分子进行质量测定和定量。FTICR―MS的一个重要功能是多元串级质谱,与通常的只能选一个母离子的串级质谱方式不同,FTICR―MS可以同时选择几个母离子进行解离,这无疑可以大大增加蛋白质鉴定工作的通量。但是它的缺点也很明显,操作复杂、肽段断裂效率低、价格昂贵等,这些缺点限制了它在蛋白质组学(Proteomics)中的广泛应用。MALDI通常与TOF质量分析器联用分析肽段的精确质量,而ESI常与离子阱或三级四极杆质谱联用,通过碰撞诱导解离(collision―induceddissociation,CID)获取肽段的碎片信息。
2023-09-12 07:14:231

基因组学、功能基因组学、蛋白质组学以及转录组学的

相关书籍?基因组学概念性太大,其中包含了数据挖掘(有:序列特征提取),不知道您问的是?
2023-09-12 07:14:362

蛋白质组研究的蛋白质组学

存在于细胞核里的DNA构成了基因组。基因组作为遗传信息的载体,最根本的特征就是稳定不变。对单细胞生物而言,不论在什么样的生长条件下,其基因组始终保持不变。对多细胞生物来说,每一个个体的基因组,在构成个体的不同种类的细胞里都是一样的,知道了个体内某一细胞内的基因组就知道了该个体所有细胞的基因组。然而对于蛋白质组而言,由于蛋白质是生命活动的主要执行者,不同类型的细胞或同一个细胞在不同的活动状态下,其蛋白质组的蛋白质种类构成却是很不一样的。  所以,蛋白质组与基因组的一个重要差别就是蛋白质组具有多样性。这种差别要求我们对“蛋白质组”的概念要进行仔细的分析。目前蛋白质组比较公认的定义是:一个基因组内所有基因表达的全部蛋白质。这种定义从字面上容易理解,但在实际中却很成问题。任何一种生物的基因组,都是由不编码蛋白质的核苷酸序列和编码蛋白质的核苷酸序列(基因)所组成。基因通常只是基因组的一小部分,例如编码人类蛋白质的核苷酸序列大约占人类基因组的2%。要想从混杂有大量非编码核苷酸序列的基因组中找出基因,如同沙里淘金。基因组研究的结果表明,一个基因组拥有的“基因”数目是由两部分组成的:通过实验证明确有蛋白质产物的真实基因、根据起始密码和终止密码序列所确定的潜在基因。生物学家们把这两类基因都称为“开放阅读框”(open reading frame,ORF)。因此,一个基因组内的基因数目通常是指ORF的数目。当一个基因组的全序列测定之后,确定其含有的ORF就成为了主要任务,称为基因注释。目前用于基因注释的方法还有较高的出错率,尤其对于那些存在不连续基因(即在一个基因内插有非编码的核苷酸序列)的复杂基因组,出错的问题更为突出。此外,这些ORF是否与蛋白质存在一一对应关系也是一个问题。一方面,人们已经发现有许多“假基因”(pseudogene)的存在,这些假基因有和真基因相同的ORF,但却从不表达。另一方面,由于存在RNA水平上遗传信息的加工——mRNA编辑(RNA editing),以及蛋白质水平上遗传信息的加工——蛋白质剪接(protein splicing),许多蛋白质很难找到直接对应的ORF。如果我们不能确定基因组的“所有”基因,我们从何知道蛋白质组的“全部”蛋白质?显然,确定基因数目最可靠的方法是通过研究蛋白质组来进行。据最新统计,人类基因组拥有的基因数目大约是在3万到4万个之间。如果能够把人体252种细胞内的全部蛋白质都给鉴定出来,那么我们就有可能真正知道人类基因组的所有基因。但是这样一来,基因组和蛋白质组形成了“循环定义”:蛋白质组是以基因组拥有的所有基因的表达产物来构成,而所有基因的确定又必须通过蛋白质组来给予肯定。蛋白质组学的研究技术目前还有很多不完善之处,许多新技术正在研发之中。因此,蛋白质组学的发展是受技术限制的,也是受技术推动的。如果说未知世界是一个无边无际的海洋,那么我们的知识就是这海洋里一个小小的岛屿。随着科学的进步,知识的岛屿会不断地扩张。但我们同时会发现,环绕着知识岛的未知领域也在增长。我们的研究可以逐渐地扩大人类知识的领地,但永远不能穷尽宇宙的奥秘。基因组也好,蛋白质组也好,都不会是人类认识生命的终点。
2023-09-12 07:14:431

Genomics”在MeSH树状结构表中的上位词和下位词各是什么?(请同时写出中英文名

“Genomics”在MeSH树状结构表中的上位词和下位词如下:上位词:生物学,分子(Molecular Biology)遗传学(Genetics)生物医学研究(Biomedical Research)下位词:基因组学(Genomics)转录组学(Transcriptomics)蛋白质组学(Proteomics)代谢组学(Metabolomics)转录因子组学(Transcriptome Analysis)基因组范围的关联研究(Genome-Wide Association Study)基因组学,植物(Plant Genomics)基因组学,真菌(Fungal Genomics)基因组学,病毒(Viral Genomics)
2023-09-12 07:14:582

蛋白质组学的研究技术

可以说,蛋白质组学的发展既是技术所推动的也是受技术限制的。蛋白质组学研究成功与否,很大程度上取决于其技术方法水平的高低。蛋白质研究技术远比基因技术复杂和困难。不仅氨基酸残基种类远多于核苷酸残基(20/ 4), 而且蛋白质有着复杂的翻译后修饰,如磷酸化和糖基化等,给分离和分析蛋白质带来很多困难。此外,通过表达载体进行蛋白质的体外扩增和纯化也并非易事,从而难以制备大量的蛋白质。蛋白质组学的兴起对技术有了新的需求和挑战。蛋白质组的研究实质上是在细胞水平上对蛋白质进行大规模的平行分离和分析,往往要同时处理成千上万种蛋白质。因此,发展高通量、高灵敏度、高准确性的研究技术平台是现在乃至相当一段时间内蛋白质组学研究中的主要任务。当前在国际蛋白质组研究技术平台的技术基础和发展趋势有以下几个方面: 通常可采用细胞或组织中的全蛋白质组分进行蛋白质组分析。也可以进行样品预分级,即采用各种方法将细胞或组织中的全体蛋白质分成几部分,分别进行蛋白质组研究。样品预分级的主要方法包括根据蛋白质溶解性和蛋白质在细胞中不同的细胞器定位进行分级,如专门分离出细胞核、线粒体或高尔基体等细胞器的蛋白质成分。样品预分级不仅可以提高低丰度蛋白质的上样量和检测,还可以针对某一细胞器的蛋白质组进行研究。对临床组织样本进行研究,寻找疾病标记,是蛋白质组研究的重要方向之一。但临床样本都是各种细胞或组织混杂,而且状态不一。如肿瘤组织中,发生癌变的往往是上皮类细胞,而这类细胞在肿瘤中总是与血管、基质细胞等混杂。所以,常规采用的癌和癌旁组织或肿瘤与正常组织进行差异比较,实际上是多种细胞甚至组织蛋白质组混合物的比较。而蛋白质组研究需要的通常是单一的细胞类型。最近在组织水平上的蛋白质组样品制备方面也有新的进展,如采用激光捕获微解剖(Laser Capture Microdissection, LCM) 方法分离癌变上皮类细胞。 利用蛋白质的等电点和分子量通过双向凝胶电泳的方法将各种蛋白质区分开来是一种很有效的手段。它在蛋白质组分离技术中起到了关键作用。如何提高双向凝胶电泳的分离容量、灵敏度和分辨率以及对蛋白质差异表达的准确检测是目前双向凝胶电泳技术发展的关键问题。国外的主要趋势有第一维电泳采用窄pH梯度胶分离以及开发与双向凝胶电泳相结合的高灵敏度蛋白质染色技术,如新型的荧光染色技术。质谱技术是目前蛋白质组研究中发展最快,也最具活力和潜力的技术。它通过测定蛋白质的质量来判别蛋白质的种类。当前蛋白质组研究的核心技术就是双向凝胶电泳-质谱技术,即通过双向凝胶电泳将蛋白质分离,然后利用质谱对蛋白质逐一进行鉴定。对于蛋白质鉴定而言,高通量、高灵敏度和高精度是三个关键指标。一般的质谱技术难以将三者合一,而最近发展的质谱技术可以同时达到以上三个要求,从而实现对蛋白质准确和大规模的鉴定。 做过双向凝胶电泳的人一定会抱怨它的繁琐、不稳定和低灵敏度等缺点。发展可替代或补充双向凝胶电泳的新方法已成为蛋白质组研究技术最主要的目标。目前,二维色谱 (2D-LC)、二维毛细管电泳 (2D-CE)、液相色谱-毛细管电泳 (LC-CE) 等新型分离技术都有补充和取代双向凝胶电泳之势。另一种策略则是以质谱技术为核心,开发质谱鸟枪法(Shot-gun)、毛细管电泳-质谱联用 (CE-MS)等新策略直接鉴定全蛋白质组混合酶解产物。随着对大规模蛋白质相互作用研究的重视,发展高通量和高精度的蛋白质相互作用检测技术也被科学家所关注。此外,蛋白质芯片的发展也十分迅速,并已经在临床诊断中得到应用。蛋白质组生物信息学蛋白质组数据库是蛋白质组研究水平的标志和基础。瑞士的SWISS-PROT拥有目前世界上最大,种类最多的蛋白质组数据库。丹麦、英国、美国等也都建立了各具特色的蛋白质组数据库。生物信息学的发展已给蛋白质组研究提供了更方便有效的计算机分析软件;特别值得注意的是蛋白质质谱鉴定软件和算法发展迅速,如SWISS-PROT、Rockefeller大学、UCSF等都有自主的搜索软件和数据管理系统。最近发展的质谱数据直接搜寻基因组数据库使得质谱数据可直接进行基因注释、判断复杂的拼接方式。随着基因组学的迅速推进,会给蛋白质组研究提供更多更全的数据库。另外,对肽序列标记的从头测序软件也十分引人注目。
2023-09-12 07:15:081

蛋白质组学常用的研究方法

酵母双杂交系统、抗体芯片、LCM技术、mic Solution Inc、SPR技术、色谱分离技术、双相电泳技术、有机质谱等等。 LCM技术获得的细胞可以用于蛋白质样品的制备。蛋白质样品中的不同类型的蛋白质可以通过二维电泳进行分离。胶染色后可以利用凝胶图象分析系统成像,然后通过分析软件对蛋白质点进行定量分析,并且对感兴趣的蛋白质点进行定位。 Genomic Solution可以为研究者提供除质谱外的所有蛋白质组学研究工具,包括二维电泳系统,成像系统及分析软件,胶切割系统,蛋白质消化浓缩工作站,点样工作站等;同时还可以提供相关试剂和消耗品。蛋白质相互作用的研究,酵母双杂交和噬菌体展示技术无疑是很好的研究方法。LCM-二维电泳-质谱的技术路线是典型的一条蛋白质组学研究的技术路线,除此以外,LCM-抗体芯片也是一条重要的蛋白质组学研究的技术路线。………………详细资料请参考:on http://product.bio1000.com/101969/
2023-09-12 07:15:251

有谁知道蛋白质组学的优缺点和未来的发展方向不?麻烦告诉一下 急~~~~~~~ 谢谢了 非常感谢了哈

  发展趋势  在基础研究方面  近两年来蛋白质组研究技术已被应用到各种生命科学领域,如细胞生物学、神经生物学等。在研究对象上,覆盖了原核微生物、真核微生物、植物和动物等范围,涉及到各种重要的生物学现象,如信号转导、细胞分化、蛋白质折叠等等。在未来的发展中,蛋白质组学的研究领域将更加广泛。  在应用研究方面  蛋白质组学将成为寻找疾病分子标记和药物靶标最有效的方法之一。在对癌症、早老性痴呆等人类重大疾病的临床诊断和治疗方面蛋白质组技术也有十分诱人的前景,目前国际上许多大型药物公司正投入大量的人力和物力进行蛋白质组学方面的应用性研究。  在技术发展方面  蛋白质组学的研究方法将出现多种技术并存,各有优势和局限的特点,而难以象基因组研究一样形成比较一致的方法。除了发展新方法外,更强调各种方法间的整合和互补,以适应不同蛋白质的不同特征。另外,蛋白质组学与其它学科的交叉也将日益显著和重要,这种交叉是新技术新方法的活水之源,特别是,蛋白质组学与其它大规模科学如基因组学,生物信息学等领域的交叉,构成组学(omics)生物技术研究方法,所呈现出的系统生物学(System Biology)研究模式,将成为未来生命科学最令人激动的新前沿。  优缺点:这个方法容易被核酸干扰,而且测定混合有机成分时,极不准确。  但简便、灵敏、快速,不消耗样品,测定後仍能回收使用
2023-09-12 07:15:551

2. 蛋白质组学样品前处理(3)

说明:此篇笔记系2016-2017年由克里克学院与康昱盛主办的蛋白质组学网络大课堂整理而成,侵删。该课程由复旦大学生物医学研究院(IBS)的刘晓慧博士所授。 我们通过上一篇笔记里介绍的各种方法把蛋白质提取出来以后,这事儿还没完,因为我们需要对提取出来的蛋白进行一下质控,以确认是否成功提取出了足够的蛋白,是否有污染等。 如上图,质量控制分两个部分: 含量测定 :检测是否有充足的蛋白被提取出。注意上图里提到的不兼容问题,如果你样品里加过SDS,就不要用Bradford法来测定蛋白浓度,而可以选用BCA方法;反之,如果你样品里加入了还原剂,就不要用BCA方法来测定蛋白,可以选用Bradford法。 SDS-PAGE :检测蛋白的提取效率,以及是否有污染。比如我们上了50个样,能看到的条带却很少,说明定量不准确。如果想从几组样品中寻找差异蛋白,特别需要做一次SDS-PAGE检测同类样品蛋白的提取效率。 以上图为例,0号样品中间的条带不见了,可能是提取蛋白不充分引起的差异,也可能是样品本身的差异。我们可以重新提取一次,先排除是否是提取造成的差异;如果是样品本身的差异,建议用label free的方法,每个样品单独做定量,而不要用iTRAQ或TMT标记定量,否则会因为中间这个高丰度蛋白的影响,而导致定量不准。 我们再看来几种常见的问题,以及解决方法,如下图: 情况1:提取出来的结果差异很大。这种情况需要重新提取,以检测到底是提取不充分造成的差异,还是样品本身的差异; 情况2:左边是分子量marker,右边是实际样品,可以看到实际样品的条带很少,可能是提取不充分,需要重设提取参数,使用更剧烈的条件,更长的时间,重新提取; 情况3:横纹、纵纹比较多,很可能是核酸或脂蛋白的影响,这种情况需要进行脱盐处理,也就是利用脱盐柱与肽段结合,而与其它物质不结合,从而达到去除污染的目的。 情况4:两个条带很类似,但一条明显比另一条淡。可能造成这种情况的原因有哪些呢?第一种情况,由于这是同样类型的样品,比如都是小鼠肌肉组织,一个样品的蛋白质抽提充分,而另外一个样品蛋白抽提不充分,就会导致两条带不一样,这种情况下需要重新抽提。还有一种可能,考虑到是等量上样跑的SDS-PAGE,如果两个条带显示出的蛋白含量差别很大,则可能因为参考的含量测定结果不准确引起的,这时候需要重新定量。 蛋白提取后,还需要做脱盐处理,我们来看看可以用哪些方法实现。 超滤: 可以截留10kDa及以上的蛋白分子,适用于体积较小的样品。操作步骤可以是,从100μL超滤浓缩到40μL,再加缓冲液至100μL,再超滤到40μL,反复几次。事实上,超滤是很难把污染(比如SDS)完全去掉的,最终仍然会有极少量的污染物存在,但当这些污染物的浓度降到一定程度时,则样品的纯净度我们认为是可以接受的了。 透析 :也是可以截留10kDa及以上的蛋白分子,适用于体积比较大的样品,比如尿液,可以将盐透析至外面的透析液里。 丙醇沉淀 :-20℃丙酮(V 样品 :V 冷丙酮 =1:3以上)沉淀2个小时以上。 C18色谱柱脱盐法 :Waters公司生产的XBridge C18色谱柱,利用柱子上的填料与蛋白结合,而盐类物质则流穿过去,从而达到分离的目的。 脱盐完成以后,接下来我们就要进行相当重要的一步:还原烷基化及酶解。整个流程,大伙儿看下面这张图: 这里面有两件事要先跟大伙儿聊聊。 首先,我们来说说为什么步骤里要把丙酮沉淀放在烷基化以后。通过之前的学习,我们知道丙酮可以溶解样品的去污剂、还原剂等,而蛋白是不会在丙酮中溶解的,而是会沉淀下来,这样就达到了去除杂质的目的。 烷基化以后,球状蛋白变成链状,再通过丙酮沉淀去掉尿素或SDS等污染物,然后复溶(即重新溶解,以备下一步酶解操作),那么链状的蛋白比球状蛋白的复溶效果会更好,可以避免因为复溶不充分而造成的损失。因此,丙酮沉淀要放在烷基化之后再做。 另外,关于酶切这一步,有些抗体如果只用胰酶进行酶切,由于酶切位点太少,导致切出来的肽段太长,不便于质谱检测。这种情况下可以结合其它酶,比如Lys-C,进行多酶酶切,使肽段变得短一些。经过测试我们发现,用Lys-C+胰酶酶切,比只用胰酶酶切,可以提高10%-20%的鉴定率。 酶解需要在buffer体系下完成,比如25mM碳酸氢铵体系(易挥发,pH 7-8)最为常用,或者也可以使用TEAB( triethyl ammonium bicarbonate,三乙基二乙胺盐,10-100mM)。 酶的用量可以参考以下的公式: W(酶):W(底物)=1:20 – 1:50 此外,需要注意的是胰酶酶解的兼容性问题。胰酶只能耐受最多1M的尿素,且不能与SDS同时使用。 前面提过,质谱仪是一种离子饱和性仪器,高丰度蛋白的存在会对低丰度蛋白的信号产生抑制,并且质谱仪反应也需要一定的时间。例如,人的细胞内通常会表达20300种蛋白,它们酶解后,每种蛋白会产生10-20种肽段,那么就有几十万种肽段,质谱很难同时检测到这么多种肽段。所以对肽段混合物进行分级,可以降低检测的难度,得到更多的肽段/蛋白鉴定结果。 我们既可以从蛋白水平进行分离,也可以从肽段水平进行分离,还可以将多种分离手段结合起来。从蛋白水平的分离,大家都比较熟悉吧?通常我们用SDS-PAGE或IEF等技术,利用蛋白质的分子量、形状、等电点等理化性质的不同,将混合在一起的蛋白质分开。 第二种分离方案是在肽段水平上进行,根据肽段的不同性质,使用不同填料进行分离。 SCX(Strong Cation Exchange):是以硅胶为基质的强阳离子交换柱,可以与阳离子结合,并通过buffer进行离子交换,将阳离子分离和洗脱出来,达到与其它不带阳离子的肽段分离的目的。 SAX(Strong Anion Exchange):硅胶键合季铵基团的强阴离子交换柱,可以与阴离子结合,并通过buffer进行离子交换,将阴离子分离和洗脱出来,达到与其它不带阴离子的肽段分离的目的。 RPLC(Reverse Phase Liquid Chromatography):反相液相色谱柱,与正相柱在表面键合极性官能团不同,反相柱的表面键合的是非极性的官能团,例如,键合十八烷基官能团,称为C18柱,其它常用的还有C8,C4和C2等。这里我们选用C18柱,根据肽段疏水性的不同,达到分离的目的。 HILIC(Hydrophilic interaction liquid chromatography ):亲水色谱柱可以用来分离极性化合物。由于强极性肽段在反相色谱柱中保留情况都比较差,很难将它们分开,而亲水色谱柱却可以用来固定强极性的肽段,并结合高比例有机相与低比例水相组成的流动相,来实现分离的目的,且这样的流动相组成尤其有利于提高电喷雾离子化质谱(ESI-MS)的灵敏度。 High pH - Low pH RPLC:用pH10的液相条件,结合pH2的RPLC酸性条件,进行分离。 多维分离:例如,先从蛋白水平进行分离,再从肽段水平进行分离,或者多种肽段水平的分级分离结合起来使用。接下来我们重点聊一下各种多维分离的策略和效果。 我们先来看看上面这张图。左上角的“A图“展示的是通过High pH - Low pH RPLC将样品分成了40个馏分,然后进行叉开的合并,合并为20个馏分,这样的合并可以让样品中的肽段分布更加均匀。 右上角的”B图”展示的是通过SDS-PAGE进行分离,也分成20个馏分,然后用两种合并方案,分别合并为5个馏分和6个馏分,这样做的目的也是为了让样品的肽段分布更加均匀。 左下角的“C图”针对同一种样品,对High/Low pH RPLC和SDS-PAGE两种分离策略进行了比较,发现经过两种分离方法后,有5408个蛋白是都可以鉴定到的,另外有1951种蛋白是只在High/Low pH RPLC分离策略中鉴定到的,而用SDS-PAGE分离,则可以鉴定到其它389种蛋白。从这个图上看,两种方法有互补性。 右下角的四幅小图说明,当我们在做分级分离时,分的级别越多,能鉴定到的蛋白也就越多。不过这种增长并不是呈线性关系的,分级的级数达到一定程度时,能鉴定到的蛋白数量的增长就会饱和。所以比较省时省力又能保证效果的做法时,选择一个合适的分级数即可。 我们来看一下目前发表的文献里,利用多级分离所能鉴定到的蛋白数量。 就像前面说到的,对蛋白及多肽分离的级数越多,能鉴定到的蛋白也就越多,但常常因为机时的限制,再加上这种变化趋势到一定程度总会饱和,所以我们通常有个权衡。比如常规的分10个馏分,基本上可以鉴定到5000-8000个蛋白。如果是血清样品,可以馏分更多一些,尤其是RPLC一维,如果分到40或60个馏分,再合并为10或20个馏分,比直接分成10个或20个馏分能鉴定到的蛋白要多30%左右! 样品前处理的各个步骤就介绍到这,下篇将继续分享样品前处理的最新方法与进展
2023-09-12 07:16:051

蛋白质组研究的研究内容

早期蛋白质组学的研究范围主要是指蛋白质的表达模式(Expression profile),随着学科的发展,蛋白质组学的研究范围也在不断完善和扩充。蛋白质翻译后修饰研究已成为蛋白质组研究中的重要部分和巨大挑战。蛋白质-蛋白质相互作用的研究也已被纳入蛋白质组学的研究范畴。而蛋白质高级结构的解析即传统的结构生物学,虽也有人试图将其纳入蛋白质组学研究范围,但目前仍独树一帜。 对人类而言,蛋白质组学的研究最终要服务于人类的健康,主要指促进分子医学的发展。如寻找药物的靶分子。很多药物本身就是蛋白质,而很多药物的靶分子也是蛋白质。药物也可以干预蛋白质-蛋白质相互作用。在基础医学和疾病机理研究中,了解人不同发育、生长期和不同生理、病理条件下及不同细胞类型的基因表达的特点具有特别重要的意义。这些研究可能找到直接与特定生理或病理状态相关的分子,进一步为设计作用于特定靶分子的药物奠定基础。
2023-09-12 07:16:131

2. 蛋白质组学样品前处理(4)

说明:此篇笔记系2016-2017年由克里克学院与康昱盛主办的蛋白质组学网络大课堂整理而成,侵删。该课程由复旦大学生物医学研究院(IBS)的刘晓慧博士所授。 自从进入了精准医学时代,蛋白质组学的发展也朝着精准医学临床应用的方向在不断发展。 我们知道,在临床应用领域,常常需要用更多的样品量来进行研究分析,得到更多的结果。比如,用几十上百例的蛋白质组学样品来进行肿瘤分析。2014年Nature上发表过一篇文章,做了95例大肠癌的分析,通过label free结果对95例进行分型。与之前的ATGC方法把大肠癌分成四个型比起来,蛋白质组学的方法可以更精准地分成五个型。这也是蛋白质组学在精准医学领域一个很好的应用实例。 (Bing Zhang, Jing Wang, et al, Proteogenomic characterization of human colon and rectal cancer,nature,2014,3,382) 接下来我们分享两种新方法,都可以实现简单、可重复且自动化的样品前处理效果。 第一种方法最早发表于2007年,到今年已经成立了一家公司,将这种方法发展出来的装置很好地商业化了。 当时,整套装置还需要手工来组装。不过组装的方法也非常简单,根据上面的图,分五步走: 第一步:准备好一张3M的C18过滤膜,一个枪头,一个平口的针头和一个长手柄; 第二步+第三步:在3M膜上取出一个小孔的膜, 第四步:将膜捅到EP管里面,用气把它压紧了,形成一个小的膜系统。 第五步:取出手柄和针头,带膜的枪头就完成了。 C18过滤膜有脱盐的效果,可以把蛋白质或肽段截留在上面,通过水或BUFFER体系把盐洗掉,之后再通过有机相把肽段或蛋白从C18膜上洗脱下来。 除了C18膜,还有很多种类型的膜,比如强阳离子膜、阴离子膜等。大伙儿看看下面这个图,感受一下这些膜的名字和成分。 这里的柱状图是对比不同的膜处理后能鉴定到的肽段的数量,左图是肽段水平的鉴定,右图是蛋白水平的鉴定,差别都不太大(图里的fr1,2,3是指馏分)。通过这个膜系统,可以进行分级分离,也可以进行脱盐。 时间走到2009年,又出现了一种新的FASP( filter-aided sample preparation)方法。之前的Stagetips只是为了进行分级和富集,而FASP可进行酶解(文献见下图)。 到了2014年,这个团队又将StageTips和FASP方法结合起来,实现了所有的实验都在这个小管子里完成,样品加入后先清洗,然后还原,清洗,烷基化,再清洗,最后酶解。酶解后的肽段一直留在下图的“Reaction chamber”里,然后将肽段通过下方的膜脱盐,洗脱,或者直接通过它进行馏分的分离,收集样品。 四次重复实验检测发现,用这种装置做下来,四次都能被重复的蛋白有92.9%,只有1.6%的蛋白是其中任意一次单独鉴定到的,1.5%是其中两次鉴定到的,4.0%是其中三次鉴定到的。如果我们考虑到这个实验一共鉴定到了9,667个蛋白(human proteins),在保证了较高的鉴定率的前提下,92.9%的四次重复率已经相当不错了!并且信号强度也比较一致。由于管子体积的限制,这套装置很适合少量样品的分析。 该方法已经商业化。2016年Cell Systems上发表了一篇用这套商业化的装置做的血液样品案例。如下图,把血液样品取出来后,直接加到装备了膜系统的EP管里。通过优化整个酶解系统,整个前处理过程2个小时之内就能完成,其中裂解与还原烷基化是同时完成的。完成之后通过一个自动化仪器,进入质谱,经过0.5小时的质谱实验,以及15分钟的结果分析,最后鉴定到了300多个常规的中高丰度蛋白(这个例子中没有对血液中的高丰度蛋白进行去除)。 同样的,文章里也对这次实验进行了重复性评估,见下图。 从图上看,鉴定的重复性特别好,尤其是49种FDA批准的Biomarkers中,有41种的CV值都小于20%,说明这些biomarkers可以通过该方法可重复地检测到。这个方法被认为很有希望发展为高通量样品处理的方案。 以上是该公司的网址,有兴趣的小伙伴可以登上去看看。目前最新的进展是,重复性可以到0.99,样品处理时间缩短到了1个小时,再加上20分钟的质谱分析,总体实验时间得到了很好地控制,实现了简单快速高效且可重复的要求!我们期待这个方法能早时用到临床样品的检测上。 第二种新方法叫PCT压力循环系统。 刚才讲到,可以通过压力差来进行样品的破碎和蛋白的提取。另外,我们知道,在高压条件下,很多反应是会提高效率的,比如说酶解、还原烷基化、样品裂解等。下面这篇文章通过分析穿刺的样品(量非常少,大概只有1立方毫米),放到PCT装置里,通过样品的处理,还原烷基化,酶解,酶解之后脱盐,取出,直接进行SWATH分析。 我们来看下这种方法的结果评估。图示上方的a 图表明结果的SD(样品标准差)都很小,说明检测结果很精确;b图表明漏切的位点也很少. 图示下方的a图表明,可重复性CV值基本上都小于20%,只有其中两次的重复性实验中差异大了一点。 文章里用这个方法分析了9对胃癌的癌症与癌旁组织,然后找到了一组蛋白成为癌症的潜在标志物。 以上是两种在蛋白质临床检测方面非常有前途的方法,都实现了快速、高通量、高重现性,自动化的处理,感兴趣的童鞋可以重点关注一下。 最后,我们对整个第二讲的内容进行一个小结,如下图:
2023-09-12 07:16:271

蛋白质组的技术原理

双向凝胶电泳技术(2-DE)双向凝胶电泳技术与质谱技术是目前应用最为广泛的研究蛋白质组学的方法。双向凝胶电泳技术利用蛋白质的等电点和分子量差别将各种蛋白质区分开来。虽然二维凝胶电泳难以辨别低丰度蛋白,对操作要求也较高,但其通量高、分辨率和重复性好以及可与质谱联用的特点,使其成为目前最流行、可靠的蛋白质组研究手段。双向凝胶电泳技术及质谱基础的蛋白质组学研究程序为样品制备→等电聚焦→聚丙烯酰胺凝胶电泳→凝胶染色→挖取感兴趣的蛋白质点→胶内酶切→质谱分析确定肽指纹图谱或部分氨基酸序列→利用数据库确定蛋白。蛋白质组研究要求有高分辨率的蛋白质分离及准确、灵敏的质谱鉴定技术。凝胶电泳中蛋白质的着色不仅影响蛋白质分离的分辨率,同时也影响后续的质谱鉴定。蛋白质的染色可分为有机试剂染色、银染、荧光染色及同位素显色四类。Unlu 等提出了一种荧光差异显示双向电泳(F-2D-DIGE)的定量蛋白质组学分析方法。差异凝胶电泳(DIGE)是对2-DE 在技术上的改进,结合了多重荧光分析的方法,在同一块胶上共同分离多个分别由不同荧光标记的样品,并第一次引入了内标的概念。两种样品中的蛋白质采用不同的荧光标记后混合,进行2-DE,用来检测蛋白质在两种样品中表达情况,极大地提高了结果的准确性、可靠性和可重复性。在DIGE技术中,每个蛋白点都有它自己的内标,并且软件可全自动根据每个蛋白点的内标对其表达量进行校准,保证所检测到的蛋白丰度变化是真实的。DIGE 技术已经在各种样品中得到应用。高效液相色谱技术(HPLC)尽管二维凝胶电泳(2-DE)是常用的对全蛋白组的分析方法,但其存在分离能力有限、存在歧视效应、操作程序复杂等缺陷。对于分析动态范围大、低丰度以及疏水性蛋白质的研究往往很难得到满意的结果。Chong 等使用HPLC/ 质谱比较分析恶性肿瘤前和癌症两种蛋白质差异表达。利用HPLC 分离蛋白质,并用MALDI-TOF-MS鉴定收集的组分,从而在两种细胞中的差异表达中对蛋白质进行定量分析。多维液相色谱作为一种新型分离技术,不存在相对分子质量和等电点的限制,通过不同模式的组合,消除了二维凝胶电泳的歧视效应,具有峰容量高、便于自动化等特点。二维离子交换-反相色谱(2D-IEC-RPLC)是蛋白质组学研究中最常用的多维液相色谱分离系统。飞行时间质谱技术表面增强激光解吸离子化飞行时间质谱技术于2002 年由诺贝尔化学奖得主田中发明,刚刚产生便引起学术界的高度重视。SELDI 技术是蛋白质组学研究中比较理想的技术平台,其全称是表面增强激光解吸电离飞行时间质谱技术(SELDI-tof)。其方法主要如下:通常情况下将样品经过简单的预处理后直接滴加到表面经过特殊修饰的芯片上,既可比较两个样品之间的差异蛋白,也可获得样品的蛋白质总览。因此,在应用方面具有显著优势。SELDI 技术分析的样品不需用液相色谱或气相色谱预先纯化,因此可用于分析复杂的生物样品。SELDI 技术可以分析疏水性蛋白质,PI 过高或过低的蛋白质以及低分子质量的蛋白质( < 25 000) ,还可以发现在未经处理的样品中许多被掩盖的低浓度蛋白质,增加发现生物标志物的机会。SELDI 技术只需少量样品,在较短时间内就可以得到结果,且试验重复性好,适合临床诊断及大规模筛选与疾病相关的生物标志物,特别是它可直接检测不经处理的尿液、血液、脑脊液、关节腔滑液、支气管洗出液、细胞裂解液和各种分泌物等, 从而可检测到样品中目标蛋白质的分子量、PI、糖基化位点、磷酸化位点等参数。同位素标记亲和标签(ICAT)技术同位素亲和标签技术是一种用于蛋白质分离分析技术,此技术是蛋白质组研究技术中的核心技术之一。该技术用具有不同质量的同位素亲和标签( ICATs) 标记处于不同状态下的细胞中的半胱氨酸,利用串联质谱技术,对混合的样品进行质谱分析。来自两个样品中的同一类蛋白质会形成易于辨识比较的两个不同的峰形,能非常准确的比较出两份样品蛋白质表达水平的不同。ICAT 的好处在于它可以对混合样品直接测试;能够快速定性和定量鉴定低丰度蛋白质,尤其是膜蛋白等疏水性蛋白等;还可以快速找出重要功能蛋白质。由于采用了一种全新的ICAT试剂,同时结合了液相色谱和串联质谱,因此不但明显弥补了双向电泳技术的不足,同时还使高通量、自动化蛋白质组分析更趋简单、准确和快速,代表着蛋白质组分析技术的主要发展方向。针对磷酸化蛋白分析以及与固相技术相结合ICAT技术本身又取得了许多有意义的进展,已形成ICA T 系列技术。生物信息学技术生物信息学在生命科学研究中起着越来越重要的作用。利用生物信息学对蛋白质组的各种数据进行处理和分析,也是蛋白质组研究的重要内容。生物信息学是蛋白质组学研究中不可缺少的一部分。生物信息学的发展,已不仅是单纯的对基因组、蛋白质组数据的分析,而且可以对已知的或新的基因产物进行全面分析。在蛋白质组数据库中储存了有机体、组织或细胞所表达的全部蛋白质信息,通过用鼠标点击双向凝胶电泳图谱上的蛋白质点就可获得
2023-09-12 07:16:381

蛋白质组学与分子生物学的联系与区别是什么?

一个是以蛋白为基础,一个是以DNA等核酸为基础,分子生物学里的DNA指导合成了所有的蛋白质就是蛋白组学研究的对象,所以联系也是十分紧密的,蛋白组学大到物种,个体,小到组织细胞,所以同一分子基础的物种细胞表达差别还是很大的
2023-09-12 07:16:541

蛋白质组学在医疗和健康方面有什么应用?

在科学发现的最初有基因组,随后出现了蛋白质组。但是前者是如何与后者联系起来的呢?在早些时候,基因组被认为是一维的,这也引出"一对多"的问题:一维的,单一的基因序列映射到多维蛋白质组中的多个蛋白质。同时,基因组自身也占据多个维度,所以使得在特性和时序方面(identity and temporal dynamics)将基因映射到蛋白质组成为一个更大的难题。问题是,在很多情况下,基因组的ORF(open reading frame)和人类的“蛋白质输出”没有一个简单的联系。这个问题是由其他的组学复杂化的,而这需要我们继续来发现。我有幸拥有一个出色的执行顾问委员会,由Andrew J.主持的编委会,副主编LucieKalvodova,总编辑Matthew Lock和顾问编辑Achim Kraus。希望您在阅读这篇文章之后有所收获。
2023-09-12 07:17:033

什么是蛋白质组学,研究蛋白质组学有什么意义

核酸排序就是ATGC的各种组合,但是蛋白质组学涉及的常用氨基酸就有20多种,这个排序下来复杂度高多了,蛋白还存在各种翻译后修饰,高级结构等等。而且蛋白质没有核酸稳定,容易降解,研究起来更难获得重复性好的结果。蛋白质组学集中于动态描述基因调节,对基因表达的蛋白质水平进行定量的测定,鉴定疾病、药物对生命过程的影响,以及解释基因表达调控的机制. 作为一门科学,蛋白质组研究并非从零开始,它是已有20多年历史的蛋白质(多肽)谱和基因产物图谱技术的一种延伸. 多肽图谱依靠双向电泳(Two-dimensional gel electrophoresis, 2-DE)和进一步的图象分析;而基因产物图谱依靠多种分离后的分析,如质谱技术、氨基酸组分分析等.由于可变剪辑及RNA编辑的存在,许多基因可以表达出多种不同的蛋白质。因此,蛋白质组的复杂度要比基因组的复杂度高得多。如果某物种的基因组全序列已经破译,并不代表该物种的蛋白质组也已破译。 具体分析某个基因的蛋白质产物要综合基因组水平、转录水平和翻译水平的修饰及调控来确定。
2023-09-12 07:17:481

蛋白质组学的研究内容

1.蛋白质鉴定:可以利用一维电泳和二维电泳并结合Western等技术,利用蛋白质芯片和抗体芯片及免疫共沉淀等技术对蛋白质进行鉴定研究。2.翻译后修饰:很多mRNA表达产生的蛋白质要经历翻译后修饰如磷酸化,糖基化,酶原激活等。翻译后修饰是蛋白质调节功能的重要方式,因此对蛋白质翻译后修饰的研究对阐明蛋白质的功能具有重要作用。3.蛋白质功能确定:如分析酶活性和确定酶底物,细胞因子的生物分析/配基-受体结合分析。可以利用基因敲除和反义技术分析基因表达产物-蛋白质的功能。另外对蛋白质表达出来后在细胞内的定位研究也在一定程度上有助于蛋白质功能的了解。Clontech的荧光蛋白表达系统就是研究蛋白质在细胞内定位的一个很好的工具。4.对人类而言,蛋白质组学的研究最终要服务于人类的健康,主要指促进分子医学的发展。如寻找药物的靶分子。很多药物本身就是蛋白质,而很多药物的靶分子也是蛋白质。药物也可以干预蛋白质-蛋白质相互作用。在基础医学和疾病机理研究中,了解人不同发育、生长期和不同生理、病理条件下及不同细胞类型的基因表达的特点具有特别重要的意义。这些研究可能找到直接与特定生理或病理状态相关的分子,进一步为设计作用于特定靶分子的药物奠定基础。 不同发育、生长期和不同生理、病理条件下不同的细胞类型的基因表达是不一致的,因此对蛋白质表达的研究应该精确到细胞甚至亚细胞水平。可以利用免疫组织化学技术达到这个目的,但该技术的致命缺点是通量低。激光捕获显微切割LCM(Laser Capture Microdissection)技术可以精确地从组织切片中取出研究者感兴趣的细胞类型,因此LCM技术实际上是一种原位技术。取出的细胞用于蛋白质样品的制备,结合抗体芯片或二维电泳-质谱的技术路线,可以对蛋白质的表达进行原位的高通量的研究。很多研究采用匀浆组织制备蛋白质样品的技术路线,其研究结论值得怀疑,因为组织匀浆后不同细胞类型的蛋白质混杂在一起,最后得到的研究数据根本无法解释蛋白质在每类细胞中的表达情况。虽然培养细胞可以得到单一类型细胞,但体外培养的细胞很难模拟体内细胞的环境,因此这样研究得出的结论也很难用于解释在体实际情况。因此在研究中首先应该将不同细胞类型分离,分离出来的不同类型细胞可以用于基因表达研究,包括mRNA和蛋白质的表达。LCM技术获得的细胞可以用于蛋白质样品的制备。可以根据需要制备总蛋白,或膜蛋白,或核蛋白等,也可以富集糖蛋白,或通过去除白蛋白来减少蛋白质类型的复杂程度。相关试剂盒均有厂商提供。 蛋白质样品中的不同类型的蛋白质可以通过二维电泳进行分离。二维电泳可以将不同种类的蛋白质按照等电点和分子量差异进行高分辨率的分离。成功的二维电泳可以将2000到3000种蛋白质进行分离。电泳后对胶进行高灵敏度的染色如银染和荧光染色。如果是比较两种样品之间蛋白质表达的异同,可以在同样条件下分别制备二者的蛋白质样品,然后在同样条件下进行二维电泳,染色后比较两块胶。也可以将二者的蛋白质样品分别用不同的荧光染料标记,然后两种蛋白质样品在一块胶上进行二维电泳的分离,最后通过荧光扫描技术分析结果。胶染色后可以利用凝胶图像分析系统成像,然后通过分析软件对蛋白质点进行定量分析,并且对感兴趣的蛋白质点进行定位。通过专门的蛋白质点切割系统,可以将蛋白质点所在的胶区域进行精确切割。接着对胶中蛋白质进行酶切消化,酶切后的消化物经脱盐/浓缩处理后就可以通过点样系统将蛋白质点样到特定的材料的表面(MALDI-TOF)。最后这些蛋白质就可以在质谱系统中进行分析,从而得到蛋白质的定性数据;这些数据可以用于构建数据库或和已有的数据库进行比较分析。LCM-二维电泳-质谱的技术路线是典型的一条蛋白质组学研究的技术路线,除此以外,LCM-抗体芯片也是一条重要的蛋白质组学研究的技术路线。即通过LCM技术获得感兴趣的细胞类型,制备细胞蛋白质样品,蛋白质经荧光染料标记后和抗体芯片杂交,从而可以比较两种样品蛋白质表达的异同。Clontech最近开发了一张抗体芯片,可以对378种膜蛋白和胞浆蛋白进行分析。该芯片同时配合了抗体芯片的全部操作过程的重要试剂,包括蛋白质制备试剂,蛋白质的荧光染料标记试剂,标记体系的纯化试剂,杂交试剂等。对于蛋白质相互作用的研究,酵母双杂交和噬菌体展示技术无疑是很好的研究方法。Clontech开发的酵母双杂交系统和NEB公司开发的噬菌体展示技术可供研究者选用。关于蛋白质组的研究,也可以将蛋白质组的部分或全部种类的蛋白质制作成蛋白质芯片,这样的蛋白质芯片可以用于蛋白质相互作用研究,蛋白表达研究和小分子蛋白结合研究。 Science,Vol. 293,Issue 5537,2101-2105,September 14,2001发表了一篇关于酵母蛋白质组芯片的论文。该文主要研究内容为:将酵母的5800个ORF表达成蛋白质并进行纯化点样制作芯片,然后用该芯片筛选钙调素和磷脂分子的相互作用分子。最后有必要指出的是,传统的蛋白质研究注重研究单一蛋白质,而蛋白质组学注重研究参与特定生理或病理状态的所有的蛋白质种类及其与周围环境(分子)的关系。因此蛋白质组学的研究通常是高通量的。适应这个要求,蛋白质组学相关研究工具通常都是高度自动化的系统,通量高而速度快,配合相应分析软件和数据库,研究者可以在最短的时间内处理最多的数据
2023-09-12 07:18:051

蛋白质组学的基本策略

蛋白质组(Proteome)的概念最先由Marc Wilkins提出,指由一个基因组(genome),或一个细胞、组织表达的所有蛋白质(Protein). 蛋白质组的概念与基因组的概念有许多差别,它随着组织、甚至环境状态的不同而改变. 在转录时,一个基因可以多种mRNA形式剪接,并且,同一蛋白可能以许多形式进行翻译后的修饰. 故一个蛋白质组不是一个基因组的直接产物,蛋白质组中蛋白质的数目有时可以超过基因组的数目. 蛋白质组学(Proteomics)处于早期“发育”状态,这个领域的专家否认它是单纯的方法学,就像基因组学一样,不是一个封闭的、概念化的稳定的知识体系,而是一个领域. 蛋白质组学集中于动态描述基因调节,对基因表达的蛋白质水平进行定量的测定,鉴定疾病、药物对生命过程的影响,以及解释基因表达调控的机制. 作为一门科学,蛋白质组研究并非从零开始,它是已有20多年历史的蛋白质(多肽)谱和基因产物图谱技术的一种延伸. 多肽图谱依靠双向电泳(Two-dimensional gel electrophoresis, 2-DE)和进一步的图象分析;而基因产物图谱依靠多种分离后的分析,如质谱技术、氨基酸组分分析等.
2023-09-12 07:18:301

什么是蛋白质组学的基本技术流程

蛋白质组学的基本技术流程主要为以下四方面:蛋白质标本的制备及分离:寻找较好的方法尽可能完全地抽提细胞或组织中的全部蛋白质是比较蛋白质组学研究的重要前提。蛋白质图像的差异对比分析:给予双向电泳所获得的凝胶图谱,可用图像分析软件进行分析对比。差异蛋白质肽段鉴定:图像分析显示的不相匹配点及有异常变化匹配点是比较蛋白质组学的兴趣所在。单排之数据库的搜索分析:蛋白质数据库是属性化的数据库,通过搜索蛋白质数据库可分析和确定该蛋白质性质特征,若搜索不到,可能为新蛋白。
2023-09-12 07:18:471

蛋白质组学为什么用nanolc

蛋白质组学为什么用nanolc蛋白质组学(英语:proteomics,又译作蛋白质体学),是对蛋白质特别是其结构和功能的大规模研究,是在90年代初期,由Marc Wikins和学者们首先提出的新名词。蛋白质组(Proteome)一词,源于蛋白质(protein)与 基因组(genome)两个词的组合,意指“一种基因组所表达的全套蛋白质”,即包括一种细胞乃至一种生物所表达的全部蛋白质。蛋白质组学本质上指的是在大规模水平上研究蛋白质的特征,包括蛋白质的表达水平,翻译后的修饰,蛋白与蛋白相互作用等,由此获得蛋白质水平上的关于疾病发生,细胞代谢等过程的整体而全面的认识,这个概念最早是由Marc Wilkins 在1994年提出的。
2023-09-12 07:19:041

蛋白质组研究的研究方法技术

蛋白质组学的发展既是技术所推动的也是受技术限制的。蛋白质组学研究成功与否,很大程度上取决于其技术方法水平的高低。蛋白质研究技术远比基因技术复杂和困难。不仅氨基酸残基种类远多于核苷酸残基(20/4), 而且蛋白质有着复杂的翻译后修饰,如磷酸化和糖基化等,给分离和分析蛋白质带来很多困难。此外,通过表达载体进行蛋白质的体外扩增和纯化也并非易事,从而难以制备大量的蛋白质。蛋白质组学的兴起对技术有了新的需求和挑战。蛋白质组的研究实质上是在细胞水平上对蛋白质进行大规模的平行分离和分析,往往要同时处理成千上万种蛋白质。因此,发展高通量、高灵敏度、高准确性的研究技术平台是现在乃至相当一段时间内蛋白质组学研究中的主要任务。当前在国际蛋白质组研究技术平台的技术基础和发展趋势有以下几个方面: 蛋白质组数据库是蛋白质组研究水平的标志和基础。瑞士的SWISS-PROT拥有目前世界上最大,种类最多的蛋白质组数据库。丹麦、英国、美国等也都建立了各具特色的蛋白质组数据库。生物信息学的发展已给蛋白质组研究提供了更方便有效的计算机分析软件;特别值得注意的是蛋白质质谱鉴定软件和算法发展迅速,如SWISS-PROT、Rockefeller大学、BHS宝护神、UCSF等都有自主的搜索软件和数据管理系统。最近发展的质谱数据直接搜寻基因组数据库使得质谱数据可直接进行基因注释、判断复杂的拼接方式。随着基因组学的迅速推进,会给蛋白质组研究提供更多更全的数据库。另外,对肽序列标记的从头测序软件也十分引人注目。
2023-09-12 07:19:291

蛋白质组的主要功能

蛋白质组学集中于动态描述基因调节,对基因表达的蛋白质水平进行定量的测定,鉴定疾病、药物对生命过程的影响,以及解释基因表达调控的机制. 作为一门科学,蛋白质组研究并非从零开始,它是已有20多年历史的蛋白质(多肽)谱和基因产物图谱技术的一种延伸. 多肽图谱依靠双向电泳(Two-dimensional gel electrophoresis, 2-DE)和进一步的图象分析;而基因产物图谱依靠多种分离后的分析,如质谱技术、氨基酸组分分析等.由于可变剪辑及RNA编辑的存在,许多基因可以表达出多种不同的蛋白质。因此,蛋白质组的复杂度要比基因组的复杂度高得多。如果某物种的基因组全序列已经破译,并不代表该物种的蛋白质组也已破译。 具体分析某个基因的蛋白质产物要综合基因组水平、转录水平和翻译水平的修饰及调控来确定。
2023-09-12 07:19:441

什么是蛋白质组学的基本技术流程

  蛋白质组学的基本技术流程主要为以下四方面:   蛋白质标本的制备及分离:寻找较好的方法尽可能完全地抽提细胞或组织中的全部蛋白质是比较蛋白质组学研究的重要前提。蛋白质图像的差异对比分析:给予双向电泳所获得的凝胶图谱,可用图像分析软件进行分析对比。差异蛋白质肽段鉴定:图像分析显示的不相匹配点及有异常变化匹配点是比较蛋白质组学的兴趣所在。单排之数据库的搜索分析:蛋白质数据库是属性化的数据库,通过搜索蛋白质数据库可分析和确定该蛋白质性质特征,若搜索不到,可能为新蛋白。
2023-09-12 07:20:001

为什么要进行蛋白质组的研究

题都没有啊排除无关变量的影响吧
2023-09-12 07:20:373

蛋白质结构与功能的研究进展?

如果在五年前提到蛋白质组学(Proteomics),恐怕知之者甚少,而在略知一二者中,部分人还抱有怀疑态度。但是,2001年的Science杂志已把蛋白质组学列为六大研究热点之一,其“热度”仅次于干细胞研究,名列第二。蛋白质组学的受关注程度如今已令人刮目相看。 1.蛋白质组学研究的研究意义和背景随着人类基因组计划的实施和推进,生命科学研究已进入了后基因组时代。在这个时代,生命科学的主要研究对象是功能基因组学,包括结构基因组研究和蛋白质组研究等。尽管现在已有多个物种的基因组被测序,但在这些基因组中通常有一半以上基因的功能是未知的。目前功能基因组中所采用的策略,如基因芯片、基因表达序列分析(Serial analysis of gene expression, SAGE)等,都是从细胞中mRNA的角度来考虑的,其前提是细胞中mRNA的水平反映了蛋白质表达的水平。但事实并不完全如此,从DNA mRNA 蛋白质,存在三个层次的调控,即转录水平调控(Transcriptional control ),翻译水平调控(Translational control),翻译后水平调控(Post-translational control )。从mRNA角度考虑,实际上仅包括了转录水平调控,并不能全面代表蛋白质表达水平。实验也证明,组织中mRNA丰度与蛋白质丰度的相关性并不好,尤其对于低丰度蛋白质来说,相关性更差。更重要的是,蛋白质复杂的翻译后修饰、蛋白质的亚细胞定位或迁移、蛋白质-蛋白质相互作用等则几乎无法从mRNA水平来判断。毋庸置疑,蛋白质是生理功能的执行者,是生命现象的直接体现者,对蛋白质结构和功能的研究将直接阐明生命在生理或病理条件下的变化机制。蛋白质本身的存在形式和活动规律,如翻译后修饰、蛋白质间相互作用以及蛋白质构象等问题,仍依赖于直接对蛋白质的研究来解决。虽然蛋白质的可变性和多样性等特殊性质导致了蛋白质研究技术远远比核酸技术要复杂和困难得多,但正是这些特性参与和影响着整个生命过程。传统的对单个蛋白质进行研究的方式已无法满足后基因组时代的要求。这是因为:(1) 生命现象的发生往往是多因素影响的,必然涉及到多个蛋白质。(2) 多个蛋白质的参与是交织成网络的,或平行发生,或呈级联因果。(3) 在执行生理功能时蛋白质的表现是多样的、动态的,并不象基因组那样基本固定不变。因此要对生命的复杂活动有全面和深入的认识,必然要在整体、动态、网络的水平上对蛋白质进行研究。因此在上世纪90年代中期,国际上产生了一门新兴学科-蛋白质组学(Proteomics),它是以细胞内全部蛋白质的存在及其活动方式为研究对象。可以说蛋白质组研究的开展不仅是生命科学研究进入后基因组时代的里程碑,也是后基因组时代生命科学研究的核心内容之一。虽然第一次提出蛋白质组概念是在1994年,但相关研究可以追溯到上世纪90年代中期甚至更早,尤其是80年代初,在基因
2023-09-12 07:20:451

论述蛋白质组学与基因组学的区别和联系

组学omics,研究的是整体. 按照分析目标不同主要分为基因组学,转录组学,蛋白质组学,代谢组学。基因组学研究的主要是基因组DNA,使用方法目前以二代测序为主,将基因组拆成小片段后再用生物信息学算法进行迭代组装。当然这仅仅是第一步,随后还有繁琐的基因注释等数据分析工作。转录组学研究的是某个时间点的mRNA总和,可以用芯片,也可以用测序。芯片是用已知的基因探针,测序则有可能发现新的mRNA,蛋白组学针对的是全体蛋白,组要以2D-Gel和质谱为主,分为top-down和bottom-up分析方法。理念和基因组类似,将蛋白用特定的物料化学手段分解成小肽段,在通过质量反推蛋白序列,最后进行搜索,标识已知未知的蛋白序列。代谢组分析的代谢产物,是大分子和小分子的混合物,主要也是用液相和质谱。总而言之,这些技术都想从全局找变量,都是一种top-down的研究方法,原因很简单:避免‘只缘身在此山中"的尴尬。但因为技术局限,都各有缺点,尤其是转录组和蛋白组数据,基本上颠覆了以前一直认为的mRNA水平能代表蛋白水平的观念,因为这两组数据的重合度太低。所以目前很多研究都开始使用交叉验证方法。无论如何,都需要对数据进行分析,有经验的分析往往能化腐朽为神奇。
2023-09-12 07:20:551

为什么讲生物质谱是蛋白质组学研究的主要工具

蛋白质组学(Proteomics)研究生物质谱技术对分离的蛋白质 进行鉴定是蛋白质组研究的重要内容,蛋白质微量测序、氨基酸组成分析等传统的蛋白质鉴定技术不能满足高通量和高效率的要求,生物质谱技术是蛋白质组学(Proteomics)的另一支撑技术。生物质谱技术在离子化方法上主要有两种软电离技术,即基质辅助激光解吸电离(matrix―assisted laser desorption/ionization,MALDl)和电喷雾电离(electrospray ionization,ESl)。MALDI是在激光脉冲的激发下,使样品从基质晶体中挥发并离子化。ESI使分析物从溶液相中电离,适合与液相分离手段(如液相色谱和毛细管电泳(capillary electrophoresis))联用。MALDI适于分析简单的肽混合物,而液相色谱与ESI―MS的联用(LC―MS)适合复杂样品的分析。软电离技术的出现拓展了质谱的应用空间,而质量分析器的改善也推动了质谱仪技术的发展。生物质谱的质量分析器主要有4种:离子阱(iontrap,IT)、飞行时间(TOF)、四极杆(quadrupole)和傅立叶变换离子回旋共振(Fourier transform ion cyclotron resonance,FTICR)。它们的结构和性能各不相同,每一种都有自己的长处与不足。它们可以单独使用,也可以互相组合形成功能更强大的仪器。离子阱质谱灵敏度较高,性能稳定,具备多级质谱能力,因此被广泛应用于蛋白质组学(Proteomics)研究,不足之处是质量精度较低。与离子阱相似,傅立叶变换离子回旋共振(FTICR)质谱也是一种可以“捕获”离子的仪器,但是其腔体内部为高真空和高磁场环境,具有高灵敏度、宽动态范围、高分辨率和质量精度(质量准确度可很容易地小于1mg/L),这使得它可以在一次分析中对数百个完整蛋白质分子进行质量测定和定量。FTICR―MS的一个重要功能是多元串级质谱,与通常的只能选一个母离子的串级质谱方式不同,FTICR―MS可以同时选择几个母离子进行解离,这无疑可以大大增加蛋白质鉴定工作的通量。但是它的缺点也很明显,操作复杂、肽段断裂效率低、价格昂贵等,这些缺点限制了它在蛋白质组学(Proteomics)中的广泛应用。MALDI通常与TOF质量分析器联用分析肽段的精确质量,而ESI常与离子阱或三级四极杆质谱联用,通过碰撞诱导解离(collision―induceddissociation,CID)获取肽段的碎片信息。
2023-09-12 07:21:061

蛋白质组学的研究手段有哪些

比较多:最基本的1、双向电泳技术(理想目的:将细胞(或组织)内所有蛋白质都分离开来)2、质谱技术及一系列派生技术 (测蛋白质序列)3 、蛋白质互相作用研究:酵母双杂交,细菌双杂交,免疫共沉淀技术,pull-down,FRET,BiFC等4、蛋白质定位:荧光标记技术,共聚焦荧光显微镜技术,免疫荧光,免疫化学等技术。
2023-09-12 07:21:171

为什么说蛋白质组学研究是更艰巨更复杂具有重要意义

为什么说蛋白质组学研究是更艰巨更复杂具有重要意义核酸排序就是ATGC的各种组合,但是蛋白质组学涉及的常用氨基酸就有20多种,这个排序下来复杂度高多了,蛋白还存在各种翻译后修饰,高级结构等等。而且蛋白质没有核酸稳定,容易降解,研究起来更难获得重复性好的结果。蛋白质组学集中于动态描述基因调节,对基因表达的蛋白质水平进行定量的测定,鉴定疾病、药物对生命过程的影响,以及解释基因表达调控的机制. 作为一门科学,蛋白质组研究并非从零开始,它是已有20多年历史的蛋白质(多肽)谱和基因产物图谱技术的一种延伸. 多肽图谱依靠双向电泳(Two-dimensional gel electrophoresis, 2-DE)和进一步的图象分析;而基因产物图谱依靠多种分离后的分析,如质谱技术、氨基酸组分分析等.由于可变剪辑及RNA编辑的存在,许多基因可以表达出多种不同的蛋白质。因此,蛋白质组的复杂度要比基因组的复杂度高得多。如果某物种的基因组全序列已经破译,并不代表该物种的蛋白质组也已破译。 具体分析某个基因的蛋白质产物要综合基因组水平、转录水平和翻译水平的修饰及调控来确定。
2023-09-12 07:21:301

蛋白组学获得差异蛋白怎么进行后续的研究

蛋白组学获得差异蛋白怎么进行后续的研究蛋白质组学和转录组学都是后基因组时代(Post genomics era)中重要的组成部分,其中转录组学和基因组结合更紧密,能够针对性的解决一些组织特异性相关的基因差异的问题,所以近几年随着越来越多的基因组获得测序,加上转录组测序成本的降低,获得了长足的进步,越来越多的物种的基因信息得到了丰富,很多我们关注的模式植物,模式动物的一些具体的问题被解决。蛋白质组学则是更关注下游的一种研究方法,因为基因的最终作用(除了表观遗传学的部分外)都是通过蛋白质(酶)来具体执行的,所以蛋白质组学是能够解决一些具体问题的,列如一些关键蛋白,一些BIOMARKER都已经在实践中得到了很好的应用。但是蛋白质组和转录组中间,由于翻译后修饰的多元化,存在一个不可逾越的鸿沟,所以,目前很多基因的部分和蛋白还不能形成很好的衔接,也造成了蛋白质组学这几年发展的停滞。综合来说,蛋白质组学和转录组学都是从基础研究水平上来缩小我们实验的范围,运气好,能够碰到一个单基因控制的,或者相互作用网络比较简单的蛋白,我们就能具体解决某一个问题,但大部分时候只能够给我们提出一个方向
2023-09-12 07:21:401

蛋白质组学数据分析基础(一)

转发自 http://crickcollege.com/news/238.html 质谱数据格式 话说,蛋白质质谱从十几年前就形成了固定的数据结构和格式。现在常用的搜库格式,比如mascot的mgf,从十年前就基本固定下来。 到目前为止,质谱界的数据格式因为仪器的不同,有几个不同的大类: Thermo公司的raw文件格式,这是目前用得最多的一种格式 AB公司的WIFF格式, Bruker的yep/.fid Waters的folder Agilent的folder Notes MALDI MS目前应用越来越少,而且基本上不用于shotgun或者高通量研究。 这些数据格式的扩展名有一定的差别,且原始数据里包含的内容也有所不同。具体包含哪些重要的信息,稍后我们还会详细讲到。 结果报告的质控 数据分析,最终都是为了拿到一个可信的结果。所以,我们在讲具体的分析原理之前,先得来聊聊,我们做一次高通量的蛋白质定性、定量实验,以及搜库鉴定及定量分析等步骤,对结果报告有哪些质控要求。 首先,我们做完实验,在拿到下机数据的时候,大多数小伙伴们都会把数据放到各种搜库软件中,比如Mascot或者Thermo的Proteome Discoverer,导入原始数据,设定一些搜库参数,就可以得到结果了。 但是,作为一个严谨的实验方案设计来说,在分析的过程中,是需要对自己的数据有一个前期质控的,这样可以帮助大家判断数据分析结果的可靠性。所以说,基本的质控可以帮助我们对实验结果进行一个预判。 举个例子。 我们打开一个实验的下机数据,就可以预判我们的样品中是否发生了高分子塑料的PEG污染,有没有超高丰度的蛋白,或者有没有被严重的盐类污染。这些数据都可以从原始数据的可视化视图中看到。 不同的质谱软件,打开原始数据的方式不同,但这些信息都是可见的。另外,当两次实验搜索到的蛋白数量差异比较大时,也可以从TIC图来判断其原因。此外还可以判断分离的效率,以及是否出现喷雾中断等情况。 对于蛋白鉴定的结果,或者绝大多数的搜库算法,都要求对结果进行FDR控制,以及unique peptide的控制等等。如果我们要发表这些数据,绝大多数的期刊杂志也都会要求提供这些质控的信息。 那么,问题就来了,为什么要做这样的要求呢? 事实上,我们做好了质控,就能够看到一个总的鉴定的比例。比如说像常规的定量实验,用的最多的是iTRAQ。 举个例子。 假设总蛋白数只有2446个,算是比较少的,而总的谱图数是53万张,那么它的谱图鉴定率在当前条件下是32%(有些质控软件可以直接报告谱图鉴定率,比如Scaffold),我们可以判断当前的实验并没有出现重大的问题,鉴定率不高主要是因为存在高丰度蛋白,而这个后续可以进行详细的查看。 对于定量实验,不管我们使用的是SILAC,iTRAQ还是Label Free,都需要对定量结果进行准确性控制(详细内容,后续课程还会展开讲解)。一般来说,我们需要用相应的软件和统计方法来进行质控。 经过这几步的判断之后,可以得到一个初步的结果,比如说谱图数量是否和之前的结果差不多,质量精度及鉴定率如何,高丰度蛋白的存在与否,是否受污染,分离效率如何,定量是否准确,标记效率是否ok,等等,这些信息都可以得到。这样,我们最终可以得到一个准确可靠的蛋白质组学鉴定或定量结果用于后续的分析了。 那么,如何通过查看原始数据来进行初步质控呢? 首先,我们从原始数据出发,可以看到下图(以Data-dependent-acquisiton数据依赖性扫描为例),是从色谱出来的一个LC分离得到的TIC图,其中的信号采集都是在质谱中完成的,它其实就是将色谱逐渐通过喷雾的方式进入质谱的那些信号进行逐一的扫描,然后在其中挑选高强度的谱峰进行二级碎裂。 关于LC分离,以及TIC图的详细介绍,请参考上一节课的内容: 听课笔记之蛋白质质谱的原理及使用(四) 下图就是色谱离子流图的某个瞬间。横坐标是质荷比,纵坐标是信号强度。这个瞬间进入色谱的有这样一些信号,信号强度最高的是质荷比为477.31的肽段,其他一些肽段也可以进行查看。 这是我们在打开质谱的下机数据所能看到的最直观的结果。我们需要了解的是,这只是我们所有结果的某一个瞬间,某一个scan。这一个scan是否能够反映整个结果的好坏是不确定的,所以后续我们需要进一步的展开。 对于质谱来说,在这一步会自动选择其中一个比较强的峰,比如说477,它会进行一个动态的排除,这也是Data-dependent-acquisiton的一个重要参数。就是说,在多少秒之内,这么强的一个峰如果一直反复出现的话,那么在后续的扫描过程中,我们不去再对它进行进行MS2碎裂了。 比如说如图的477.31,我们质谱仪器记录时发现前面已经对它做过二级碎裂了,那么我们就有可能选择另外一个比较弱的谱峰。比如552.80,将它进行二级碎裂。 我们再来看一眼二级谱峰,如下图,就是对我们全长的进入质谱的肽段信息进行打碎,得到相应的B/Y离子,如下图,这些在后面我们会进行详细的讲解。 DDA模式的工作原理 下图是Thermo质谱的原理示意图(由Thermo工程师提供)。这是QE的原理图,我们先在绿色的范围内进行一次full scan的mass扫描,然后判断当前选择的离子信号强度,以及在最近的几十秒钟之内是否对其进行扫描过。 如果没有,那么在紧接着的循环过程中,我们会对之前30秒之内(假设当前的仪器速度可以达到10个MS)没有扫描过的最强的十个谱峰进行二级碎裂,那么质谱就会依次将色谱推进来的喷雾中的肽段进行依次碎裂。 这就是DDA模式基本的原理。我们的数据也是根据这样的一个过程来记录的。 如果将刚才的扫描过程二维展开,可以得到下图,看上去跟二维凝胶电泳图很像吧?横坐标是质荷比,纵坐标是保留时间,而刚才那张图横坐标是保留时间,纵坐标是强度(LC seperation图),所以,此图没有质荷比信息。我们知道,在进入full scan的MS扫描时是有质荷比信息的。所以简单的讲,上图是将刚才的两张图的信息拼接,然后将整个下机数据所有的瞬间都进行了一个拼接,由于维度的限制,因此信号强度信息无法再展示了。 但在此图中用了颜色的深浅来表示保留时间,颜色深的就是相对信号较强的肽段。而图中的每一根小线段都代表一个肽段,小线段的长度对应着肽段的保留时间,加上横坐标质荷比的信息,因此通过这张全局纵览图,就能够看到我们这次实验分离的效果如何,有没有PEG、盐、或者其它污染,有没有喷雾中断等情况发生,这些都能在这张图中有一个大致的把握。 因此,这张图对于我们进行数据质控非常有用。不同的软件和仪器有不同的方法来提供这张图。此次举例用的图是由Peaks软件得来的。 我们可以在上图中选定自己感兴趣的部分,画一个小方框,将方框中的内容进行打开放大,就得到了下图我们存储数据的结果形式了。这是在Qual Browser里打开我们的数据看到的结果。 其实这就是将我们的模拟图转换成数据信号,储存在我们的Raw文件中,或者说进一步提取成MGF文件所用到的相关信息。 这里主要包含两大类信息:MS1和MS2的信息,也就是full scan mass和二级碎裂的信息。这两类信息的结构式是一模一样的,都是包含质核比、强度值,以及相对信号强度。 比如说794.03谱峰,相对信号强度是100,也就是在这张谱图中,这是最强的一个峰,信号强度是3558210.8。那么对于我们质谱的搜索来说,一级信息和二级信息都是需要用到的,其中一级信息是首要的,也就是图中MS1部分,是后续搜库的关键信息。而二级谱图的强度信息一般用于定量,也就是说如果不是做SILAC或者非标记定量,这些信息不是最重要的。 另外,第一栏的信息准确性也是非常重要的。比如图上红框内,我们可以得到的信息是,794.03和794.36强度大约差了1.5倍,后面的峰强度差了大约2倍,再看下红框内四个数据的质荷比相差并不大,我们的质谱仪器因此会判断这四个峰非常符合一个肽段的同位素分布(肽段同位素分段的性状,后续将会讲解)。 回到此图,794.03应该是一个肽段,后面三个数据是同一个肽段,这就是我们进行precursor识别的原理。有些时候质谱会识别错误,认为红框上一行的793.69更可能是同位素,这个就需要我们自己进行校正。 质谱在搜集信号的时候,会告诉我们794.03是一个母离子或者说是肽段的谱峰,因此在后续进行MS2碎裂的时候,会挑选这样一个谱峰,以及在质谱中我们会设定相应的窗口去打碎它。因为仅仅设定一个非常小的窗口,可能信号不够。我们会设计比如正负1.5个道尔顿的窗口,把这些信号全部采集进去进行二级碎裂得到二级信号。 现在高分辨质谱中,二级信号也会包含同位素信息,因此数据分析软件需要对这些信息进行有效的处理。 大家可以看到,这样一个例子中,软件记录的是794.03,但实际我们可以通过肉眼观察,793.69跟794.03就只相差0.33~0.34,也是一个三电荷同位素的差值(1除以0.33是3,这就是质荷比中的Z的计算原理)。两者分别的强度271万和355万差别也不是非常大,我们会判断出793.69更可能是零同位素峰(如何判断后面会再讲解)。 我们进行后续数据提取和采集的时候,也就是用了这样的信息来进行分析。我们记录的一级质谱数据,以及二级质谱对应的列表,其中最重要的是m/z和intensity,在一级质谱数据中,强度并不用于蛋白鉴定的打分,但二级质谱数据中的强度值却会被用于打分。
2023-09-12 07:21:481

与基因组及其研究相比较,蛋白质组及其研究特点。

写论文可以先分别介绍基因组,蛋白组,转录组,代谢组等等等等,然后从中心法则出发,阐述个中关联,上升到跟生理,疾病等等现象的高度。
2023-09-12 07:21:592

蛋白质组学的发展回顾

核酸与蛋白质是构成生物体的主要大分子。随着人类基因组等大量生物体全基因组序列的破译和功能基因组研究的展开,生命科学家越来越关注如何用基因组研究的模式开展蛋白质组学的研究。正因如此,《Nature》、《Science》在2001年2月公布人类基因组草图的同时,分别发表了“And now for the proteome”和“Proteomics in genomeland”的述评与展望,将蛋白质组学的地位提到前所未有的高度,认为蛋白质组学将成为新世纪最大战略资源---人类基因争夺战的战略制高点之一。蛋白质组学虽然问世时间很短,但已经在研究细胞的增殖、分化、异常转化、肿瘤形成等方面进行了有力的探索,涉及到白血病、乳腺癌、结肠癌、膀胱癌、前列腺癌、肺癌、肾癌和神经母细胞瘤等,鉴定了一批肿瘤相关蛋白,为肿瘤的早期诊断、药靶的发现、疗效判断和预后提供了重要依据。鉴于蛋白质组学发展前景的重要性和技术的先进性,西方各主要发达国家纷纷投巨资全面启动蛋白质组的研究。如美国国立卫生研究院,美国能源部、欧共体等均启动了不同生物蛋白质组的研究并取得明显进展,一批高质量的研究论文相继在国际著名学术刊物发表。由于蛋白质组学研究比基因组学研究更接近实用,有着巨大的市场前景,企业与制药公司也纷纷斥巨资开展蛋白质组研究。独立完成人类基因组测序的Celera公司已宣布投资上亿美元于此领域;日内瓦蛋白质组公司与布鲁克质谱仪制造公司联合成立了国际上最大的蛋白质组研究中心。为了促进国家与地区性的蛋白质组的发展、合作与交流,成立了国际人类蛋白质组组织 (HUPO),在法国召开了首届国际蛋白质组大会,并迅即在北美、欧洲、韩国、日本成立了相应的分支机构。蛋白质组学已成为西方各主要发达国家、各跨国制药集团竞相投入的“热点”。
2023-09-12 07:22:091

如何解释细胞基因组相同但是蛋白质组不相同的现象

蛋白质组(Proteome)的概念最先由Marc Wilkins提出,指由一个基因组(genOME),或一个细胞、组织表达的所有蛋白质(PROTein). 蛋白质组的概念与基因组的概念有许多差别,它随着组织、甚至环境状态的不同而改变. 在转录时,一个基因可以多种mRNA形式剪接,一个蛋白质组不是一个基因组的直接产物,蛋白质组中蛋白质的数目有时可以超过基因组的数目. 蛋白质组学(Proteomics)处于早期“发育”状态,这个领域的专家否认它是单纯的方法学,就像基因组学一样,不是一个封闭的、概念化的稳定的知识体系,而是一个领域. 蛋白质组学的研究内容  主要有两方面,一是结构蛋白质组学,二是功能蛋白质组学。其研究前沿大致分为三个方面: ① 针对有关基因组或转录组数据库的生物体或组织细胞,建立其蛋白质组或亚蛋白质组及其蛋白质组连锁群,即组成性蛋白质组学。 ② 以重要生命过程或人类重大疾病为对象,进行重要生理病理体系或过程的局部蛋白质组或比较蛋白质组学。 ③ 通过多种先进技术研究蛋白质之间的相互作用,绘制某个体系的蛋白,即相互作用蛋白质组学,又称为“细胞图谱”蛋白质组学。 此外,随着蛋白质组学研究的深入,又出现了一些新的研究方向,如亚细胞蛋白质组学、定量蛋白质组学等。蛋白质组学是系统生物学的重要研究方法.
2023-09-12 07:22:401

比较概述基因组学、转录组学、蛋白质组学和代谢组学的概念、研究方法、优缺点及应用设想

组学omics,研究的是整体. 按照分析目标不同主要分为基因组学,转录组学,蛋白质组学,代谢组学。基因组学研究的主要是基因组DNA,使用方法目前以二代测序为主,将基因组拆成小片段后再用生物信息学算法进行迭代组装。当然这仅仅是第一步,随后还有繁琐的基因注释等数据分析工作。转录组学研究的是某个时间点的mRNA总和,可以用芯片,也可以用测序。芯片是用已知的基因探针,测序则有可能发现新的mRNA,蛋白组学针对的是全体蛋白,组要以2D-Gel和质谱为主,分为top-down和bottom-up分析方法。理念和基因组类似,将蛋白用特定的物料化学手段分解成小肽段,在通过质量反推蛋白序列,最后进行搜索,标识已知未知的蛋白序列。代谢组分析的代谢产物,是大分子和小分子的混合物,主要也是用液相和质谱。总而言之,这些技术都想从全局找变量,都是一种top-down的研究方法,原因很简单:避免‘只缘身在此山中"的尴尬。但因为技术局限,都各有缺点,尤其是转录组和蛋白组数据,基本上颠覆了以前一直认为的mRNA水平能代表蛋白水平的观念,因为这两组数据的重合度太低。所以目前很多研究都开始使用交叉验证方法。无论如何,都需要对数据进行分析,有经验的分析往往能化腐朽为神奇。
2023-09-12 07:22:501

蛋白质组学的蛋白质组学技术

蛋白质组学技术的发展已经成为现代生物技术快速发展的重要支撑,并将引领生物技术取得关键性的突破。为帮助生命科学领域的工作者全面掌握蛋白质组学的技术与方法、实验难点与关键点、研究前沿与热点,本技术平台将为客户提供蛋白组学技术服务,包括双向凝胶电泳、等电聚焦、生物质谱分析及非凝胶技术。 ESI- MS是利用高电场使质谱进样端的毛细管柱流出的液滴带电,在N2气流的作用下,液滴溶剂蒸发,表面积缩小,表面电荷密度不断增加,直至产生的库仑力与液滴表面张力达到雷利极限,液滴爆裂为带电的子液滴,这一过程不断重复使最终的液滴非常细小呈喷雾状,这时液滴表面的电场非常强大,使分析物离子化并以带单电荷或多电荷的离子形式进入质量分析器。ESI-MS从液相中产生离子,一般说来,肽段的混合物经过液相色谱分离后,经过偶联的与在线连接的离子阱质谱分析,给出肽片段的精确的氨基酸序列,但是 分析时间一般较长。目前,许多实验室两种质谱方法连用,获得有意义的蛋白质的肽段序列,设计探针或引物来获得有意义的基因。随着蛋白质组研究的深入,又有多种新型质谱仪出现,主要是在上述质谱仪的基础上进行改进与重新组合。
2023-09-12 07:23:001

蛋白质组研究的研究意义

2001年的Science杂志已把蛋白质组学列为六大研究热点之一,其“热度”仅次于干细胞研究,名列第二。蛋白质组学的受关注程度如今已令人刮目相看。随着人类基因组计划的实施和推进,生命科学研究已进入了后基因组时代。在这个时代,生命科学的主要研究对象是功能基因组学,包括结构基因组研究和蛋白质组研究等。尽管现在已有多个物种的基因组被测序,但在这些基因组中通常有一半以上基因的功能是未知的。目前功能基因组中所采用的策略,如基因芯片、基因表达序列分析(Serial analysis of gene expression, SAGE)等,都是从细胞中mRNA的角度来考虑的,其前提是细胞中mRNA的水平反映了蛋白质表达的水平。但事实并不完全如此,从DNA mRNA 蛋白质,存在三个层次的调控,即转录水平调控(Transcriptional control ),翻译水平调控(Translational control),翻译后水平调控(Post-translational control )。从mRNA角度考虑,实际上仅包括了转录水平调控,并不能全面代表蛋白质表达水平。实验也证明,组织中mRNA丰度与蛋白质丰度的相关性并不好,尤其对于低丰度蛋白质来说,相关性更差。更重要的是,蛋白质复杂的翻译后修饰、蛋白质的亚细胞定位或迁移、蛋白质-蛋白质相互作用等则几乎无法从mRNA水平来判断。毋庸置疑,蛋白质是生理功能的执行者,是生命现象的直接体现者,对蛋白质结构和功能的研究将直接阐明生命在生理或病理条件下的变化机制。蛋白质本身的存在形式和活动规律,如翻译后修饰、蛋白质间相互作用以及蛋白质构象等问题,仍依赖于直接对蛋白质的研究来解决。虽然蛋白质的可变性和多样性等特殊性质导致了蛋白质研究技术远远比核酸技术要复杂和困难得多,但正是这些特性参与和影响着整个生命过程。 传统的对单个蛋白质进行研究的方式已无法满足后基因组时代的要求。这是因为:(1) 生命现象的发生往往是多因素影响的,必然涉及到多个蛋白质。(2) 多个蛋白质的参与是交织成网络的,或平行发生,或呈级联因果。(3) 在执行生理功能时蛋白质的表现是多样的、动态的,并不像基因组那样基本固定不变。因此要对生命的复杂活动有全面和深入的认识,必然要在整体、动态、网络的水平上对蛋白质进行研究。因此在上世纪90年代中期,国际上产生了一门新兴学科-蛋白质组学(Proteomics),它是以细胞内全部蛋白质的存在及其活动方式为研究对象。可以说蛋白质组研究的开展不仅是生命科学研究进入后基因组时代的里程碑,也是后基因组时代生命科学研究的核心内容之一。
2023-09-12 07:23:251

什么是组学?

参考这个公众号的介绍https://mp.weixin.qq.com/s?__biz=MzI4MDU3NjMxNg==&tempkey=FLKG1g0KJTc7ms2pLe%2FSIR8BWnpaDDq2gSzoIGoo%2FQ88kviAeu3LHoSIeh4cIMLmd07eoB%2FAvw8rUFGXj6g2emwYnhIvWjlz4DUoK2hEwjU6dDLOiyywtDGLSVwj8i976l3aWBWkvFdaT1CXYNOCTw%3D%3D&chksm=6bb729515cc0a04799f7944e1997727aa811e74797dadf34a38ca5d732e5dd4fb0f2dda5aa12#rd
2023-09-12 07:23:522

蛋白质组学主要包括哪些分析技术及各自特点

为探究生物进程的分子机制,需要确定介导这个过程的蛋白质-蛋白质间的相互作用。研究蛋白质间相互作用的主要技术总结如下:一、酵母双杂交系统酵母双杂交系统是当前广泛用于蛋白质相互作用组学研究的一种重要方法。其原理是当靶蛋白和诱饵蛋白特异结合后,诱饵蛋白结合于报道基因的启动子,启动报道 基因在酵母细胞内的表达,如果检测到报道基因的表达产物,则说明两者之间有相互作用,反之则两者之间没有相互作用。将这种技术微量化、阵列化后则可用于大 规模蛋白质之间相互作用的研究。在实际工作中,人们根据需要发展了单杂交系统、三杂交系统和反向杂交系统等。Angermayr等设计了一个SOS蛋白介 导的双杂交系统。可以研究膜蛋白的功能,丰富了酵母双杂交系统的功能。此外,酵母双杂交系统的作用也已扩展至对蛋白质的鉴定。二、噬茵体展示技术在编码噬菌体外壳蛋白基因上连接一单克隆抗体的DNA序列,当噬菌体生长时,表面就表达出相应的单抗,再将噬菌体过柱,柱上若含目的蛋白,就会与相应抗体 特异性结合,这被称为噬菌体展示技术。此技术也主要用于研究蛋白质之间的相互作用,不仅有高通量及简便的特点,还具有直接得到基因、高选择性的筛选复杂混 合物、在筛选过程中通过适当改变条件可以直接评价相互结合的特异性等优点。目前,用优化的噬菌体展示技术,已经展示了人和鼠的两种特殊细胞系的cDNA文 库,并分离出了人上皮生长因子信号传导途径中的信号分子。三、等离子共振技术表 面等离子共振技术(Surface Plasmon Resonance,SPR)已成为蛋白质相互作用研究中的新手段。它的原理是利用一种纳米级的薄膜吸附上“诱饵蛋白”,当待测蛋白与诱饵蛋白结合后,薄 膜的共振性质会发生改变,通过检测便可知这两种蛋白的结合情况。SPR技术的优点是不需标记物或染料,反应过程可实时监控。测定快速且安全,还可用于检测 蛋白一核酸及其它生物大分子之间的相互作用。………………详细资料请参考:on http://product.bio1000.com/101969/
2023-09-12 07:24:021

简述亚细胞蛋白质组学和全细胞蛋白质组学有哪些优势

蛋白质组(Proteome)的概念最先由Marc Wilkins提出,指由一个基因组(genOME),或一个细胞、组织表达的所有蛋白质(PROTein). 蛋白质组的概念与基因组的概念有许多差别,它随着组织、甚至环境状态的不同而改变. 在转录时,一个基因可以多种mRNA形式剪接,一个蛋白质组不是一个基因组的直接产物,蛋白质组中蛋白质的数目有时可以超过基因组的数目. 蛋白质组学(Proteomics)处于早期“发育”状态,这个领域的专家否认它是单纯的方法学,就像基因组学一样,不是一个封闭的、概念化的稳定的知识体系,而是一个领域. 蛋白质组学的研究内容  主要有两方面,一是结构蛋白质组学,二是功能蛋白质组学。其研究前沿大致分为三个方面: ① 针对有关基因组或转录组数据库的生物体或组织细胞,建立其蛋白质组或亚蛋白质组及其蛋白质组连锁群,即组成性蛋白质组学。 ② 以重要生命过程或人类重大疾病为对象,进行重要生理病理体系或过程的局部蛋白质组或比较蛋白质组学。 ③ 通过多种先进技术研究蛋白质之间的相互作用,绘制某个体系的蛋白,即相互作用蛋白质组学,又称为“细胞图谱”蛋白质组学。 此外,随着蛋白质组学研究的深入,又出现了一些新的研究方向,如亚细胞蛋白质组学、定量蛋白质组学等。蛋白质组学是系统生物学的重要研究方法.
2023-09-12 07:24:131