barriers / 阅读 / 详情

怎么将提取的蛋白序列,用blastp搜索5个同源蛋白

2023-06-16 02:10:31
TAG: blastp
共1条回复
Chen

首先除了氨基酸序列以外其它信息不要包括

检查氨基酸序列,看是否有U存在。

相关推荐

BLAST套件的blastn、blastp、blastx、tblastn和tblastx子工具的用途什么?

blastn是将给定的核酸序列与核酸数据库中的序列进行比较;Blastp是使用蛋白质序列与蛋白质数据库中的序列进行比较,可以寻找较远的关系;Blastx将给定的核酸序列按照六种阅读框架将其翻译成蛋白质与蛋白质数据库中的序列进行比对,对分析新序列和EST很有用;Tblastn将给定的氨基酸序列与核酸数据库中的序列(双链)按不同的阅读框进行比对,对于寻找数据库中序列没有标注的新编码区很有用
2023-06-16 00:39:382

blastp名词解释

blastp 爆破爆破 [ bào pò ] 生词本基本释义 详细释义 [ bào pò ]用炸药的爆炸威力破坏物体。军事上用以杀伤敌人,炸毁敌方技术兵器,破坏军事目标等。经济建设中用于采矿、筑路和兴修水利等。
2023-06-16 00:39:521

blastp,psi-blast和phi-blast的异同

zz步骤① 首先用常规的blastp在目标数据库中进行比对搜索。② 位点特异性反复比对,从第①步得到的结果中构建多列比对。然后为每个比对建立一个专门的搜索矩阵(position-specific scoring matrix PSSM) 0③ 用第②得到的定点评分矩阵再一次搜索原来的数据库④ PSI-BLAST评估统计显著性(E values)。⑤ 重复②u301c④,一般要重复5次。
2023-06-16 00:39:592

用一个蛋白质序列blastp和对应的cds序列blastn结果有什么异同,,,

你好,很高兴回答阁下的问题!blastp是用氨基酸序列比对蛋白序列数据库,blastn是用核苷酸序列比对核苷酸序列数据库。另外,还有一些比对方法,比如tblastn 是输入核苷酸序列比对蛋白序列数据库,本质都是比对,只是使用时输入和输出序列格式不同。如阁下所问,如果是对应的氨基酸序列和核苷酸序列,结果应该是一致的。纯手工书写,如有需要,可进一步追问,希望采纳啊!
2023-06-16 00:40:061

BLAST是用来干什么的?

所谓BLAST既是:basic local alignment search tool 局部序列比对基本检索工具,在NCBI上分为多种,常用的有N-BLAST(核苷酸序列比对检索)和P-BLAST(蛋白比对检索)。此外还有primer Blast等,这个你到NCBI上可以自己看下。BLAST的作用顾名思义,就是用于各种核苷酸序列,蛋白质序列等在数据库内与已知数据的比对检索,可以找出相似的序列,用于蛋白质和核酸等的功能结构预测分析。
2023-06-16 00:40:142

blast 抗性筛选 什么意思

用杀稻瘟菌素(blasticidin)筛选转染细胞
2023-06-16 00:40:292

BLASTp outfmt 6输出格式的解读

跑了blastp发现输出格式没有标题: 查找了一下,列名分别为: 参考资料: http://www.metagenomics.wiki/tools/blast/blastn-output-format-6
2023-06-16 00:40:361

NCBI上做blastP有Refseq-protein和Non-Reqprotein两个database,区别是什么?另外Accession的意义是什么?

是否包含蛋白序列的数据库 Accession是蛋白的序号
2023-06-16 00:40:441

BLAST中,E值和P值分别是什么,它们有什么

BLAST(是一种用于在数据库当寻找任何蛋白质或者基因序列与你的目标序列一致的程序),S值表示两序列的同源性,分值越高表明它们之间相似的程度越大。E值就是S值可靠性的评价。它表明在随机的情况下,其它序列与目标序列相似度要大于这条显示的序列的可能性。所以它的分值越低越好。
2023-06-16 00:40:521

基因的共线性分析怎么做,做进化分析

简单一些的,直接去找MCScanX这个软件,按照软件说明,使用基因组的蛋白序列进行blastp比对,比完之后直接作为这个软件的输入文件运行分析,这个软件也提供了一些后续分析手段。复杂一些,共线性分析通常分成两大步骤,第一个是寻找同源对应关系,前面说的blastp就是一个方法,还有文献会在blastp的基础上,进一步设定计算公式以获取筛选过的、更可靠的对应关系,找个基因组文章看看,一般都有。第二个步骤是在对应关系基础上搜索共线性,也有两个选择,一个是精确要求基因顺序具有排列上的共线性,另一个是根据基因的顺序,将基因分组(数个基因作为一个单元),允许单元内部基因共线性有差异,但在单元间具有共线性,这种就是所谓的“同线性”关系。软件很多的,MCScanX及其原型MCScan,还有MCScan的原型,貌似lastz、last等软甲还可以比较DNA水平上的共线性关系,我是觉得MCScanX最简单,所以就给你推荐了。
2023-06-16 00:41:011

如何用BLAST发现新基因?

从一个一直蛋白质序列开始,通过tBLASTn工具搜索一个DNA数据库,可以找到相应的匹配,如与DNA编码的已知蛋白质的匹配或者与DNA编码的相关蛋白质的匹配。然后通过BLASTx或BLASTp在蛋白质数据库中搜索DNA或蛋白质序列来“确定”一个新基因。
2023-06-16 00:41:211

同一个氨基酸序列先后用NCBI的protein blastp后得到的保守结构域不同是为什么?

不同的软件对蛋白保守结构域的预测都是不同的,因为不同网站里的数据库与数据计算方式都可能不一样,结果也就会有差异。个人通常选择NCBI预测,但是如果是研究蛋白结构方面的内容,建议多选择几种蛋白预测网站试试。
2023-06-16 00:41:361

用Homologene或BlastP从蛋白质数据库中找出15种以上与其高度同源(Coverage>80%, 相似性>80%)的蛋白质序,

不需要设置参数,直接按照默认值搜就行了,然后在结果中进行筛选。其中最重要的参数就是e-value, 一般对蛋白而言设置在e-10。筛选:1用眼睛看。 2.用程序筛。 需要类似的工具可以联系我,帮你定制。
2023-06-16 00:41:441

blast什么意思?

BLAST (Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。如果您想进一步了解BLAST算法,您可以参考NCBI的BLAST Course ,该页有BLAST算法的介绍。 BLAST功能是什么?BLAST对一条或多条序列(可以是任何形式的序列)在一个或多个核酸或蛋白序列库中进行比对。BLAST还能发现具有缺口的能比对上的序列。BLAST是基于Altschul等人在J.Mol.Biol上发表的方法(J.Mol.Biol.215:403-410(1990)),在序列数据库中对查询序列进行同源性比对工作。从最初的BLAST发展到现在NCBI提供的BLAST2.0,已将有缺口的比对 序列也考虑在内了。BLAST可处理任何数量的序列,包括蛋白序列和核算序列;也可选择多个数据库但数据库必须是同一类型的,即要么都是蛋白数据库要么都是核酸数据库。所查询的序列和调用的数据库则可 以是任何形式的组合,既可以是核酸序列到蛋白库中作查询,也可以是蛋白序列到蛋白库中作查询,反之亦然。GCG及EMBOSS等软件包中包含有五种BLAST:1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。由于这种比对? 母丛有裕虼薚BLASTX在比对中对缺口不予以考虑。 通常根据查询序列的类型(蛋白或核酸)来决定选用何种BLAST。假如是作核酸-核酸查询,有两种BLAST供选择,通常默认为BLASTN。如要用TBLASTX也可,但记住此时不考虑缺口。 BLAST适用于本地查询。可以下载公共数据库,对于该数据库的更新和维护是必不可少的。如果要直接到网上查询也可以(即NetBlast),但记住如果你认为自己的序列很有价值的话,还是谨慎为宜。
2023-06-16 00:41:521

你好,我在百度上看过你对在ncbi上如何查询核苷酸序列的回答

你好,我在百度上看过你对在ncbi上如何查询核苷酸序列的回答 直接在首页输入你的序列名称 物种种类 然后选择nucleotide 然后search 就行了 不懂再问 怎样查询t7启动子的核苷酸序列 这里有个查询方法 你可以看下 :wenku.baidu./link?url=qT7m1rvOiU1Ea23s-PIrn0MiO48FpEkR1I_2KJYocrVb79u-m15edfXn96gFXCE1_Vh4f5imS1fsaMggxeRZnhBwd8QNdddveQCn3z_eFrS ******************************* 您好,答案已经给出,请您浏览一遍 有什么不懂的地方欢迎回复我! 如果满意请及时点选【采纳回答】按钮 或者客户端的朋友在右上角评价点【满意】 您的采纳, 是我答题的动力 也同时给您带来知识和财富值 *************************************************** 怎么用NCBI查询FeSOD的蛋白质序列、氨基酸序列和核苷酸序列呢? 一般进入NCBI介面,选择GENE,输入FeSOD,物种名,比如人,homo, 查询就可以汇出,氨基酸序列也会跟着出来,如果没有,可以通过超连结查询,或者把GENE改成protein,同样查询 所有限制酶识别的核苷酸序列均由6个核苷酸组成 不一定, 有的是四个, 但绝对都是“回文序列”, 这一点你们老师一定讲, 所以切割的都是偶数个, 而不一定是六个; 你们大学要是学的生物系, 到时候肯定也会细说。。。 如何使用已知核苷酸序列在DNA和RNA上得到未知的侧翼序列 反向PCR :baike.baidu./view/896324.htm?func=retitle 热不对称交错PCR :bbioo./bio101/2008/21817.htm 这两种应该都可以 如何使用ncbi核苷酸blast Blast(Basic Local Alignment Search Tool)是一套在蛋白质资料库或DNA资料库中进行相似性比较的分析工具。BLAST程式能迅速与公开资料库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。 BLAST 采用一种区域性的演算法获得两个序列中具有相似性的序列。 Blast中常用的程式介绍: 1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。 如何排版核苷酸和氨基酸的序列 蛋白质的氨基酸序列就是蛋白质的组成分子----氨基酸的排列顺序核苷酸序列指编码这个蛋白质的mRNA上的碱基排序 naa中 脱氧核苷酸序列代表什么? 遗传资讯 dna连线酶能识别特定核苷酸序列吗 DNA连线酶只能识别特定碱基,与核苷酸序列关系不直接。 除限制性内切酶和聚合酶外,转录和翻译也需要从特定的序列开始,因此启动这个机制的那些酶应该也具有识别特定核苷酸序列的能力。 遗传资讯是指(  )A.有遗传效应的脱氧核苷酸序列B.脱氧核苷酸C.氨基酸序列D.核苷 A、遗传资讯的是指有遗传效应的脱氧核苷酸序列,A正确; B、脱氧核苷酸是组成DNA的基本单位,不能代表遗传资讯,B错误; C、遗传资讯储存在核酸上,C错误; D、核苷酸是组成核酸的基本单位,不能代表遗传资讯,D错误. 故选:A.
2023-06-16 00:41:591

如何进行BLAST比对?

Basic BLAST根据需要选一个(见下面),点击进入就行了。如果你是要确定是哪种菌,就近第一个Blastn。序列粘贴或者导入,其中Choose Search Set中的Database你要选Others (nr etc.)。然后点击Blast就行了。如果同源性有99.99%以上的就说明是那个物种里的。Blastn 核酸序列搜索逐一核酸数据库中的序列 Blastp 蛋白质序列搜索逐一蛋白质数据库中的序列Blastx 核酸序列翻译成蛋白质序列后和蛋白质数据库中的序列逐一搜索。 Tblastn 蛋白质序列和核酸数据库中的核酸序列翻译后的蛋白质序列逐一比对TBlastx 核酸序列翻译成蛋白质序列,再和核酸数据库中的核酸序列6框翻译成的蛋白质序列逐一进行比对
2023-06-16 00:42:141

各位能人,帮忙看下这几道题怎么解呀?弄了一晚上还是焦头烂额的~~

生物信息学课逃了吧? 都是很简单的东西。比如第一个 在NCBI主页输入P26374 搜索,protein这一项有一个结果,点之,发现是这个东西 Rab proteins geranylgeranyltransferase component A 2 (Rab escort protein 2) (REP-2) (Choroideraemia-like protein)gi|47117837|sp|P26374.2|RAE2_HUMAN[47117837] 点之, 文件说明里有序列ORIGIN 1 madnlptefd vviigtglpe silaaacsrs gqrvlhidsr syyggnwasf sfsgllswlk 61 eyqqnndige estvvwqdli heteeaitlr kkdetiqhte afcyasqdme dnveeigalq 121 knpslgvsnt ftevldsalp eesqlsyfns dempakhtqk sdteislevt dveesvekek 181 ycgdktcmht vsdkdgdkde skstvedkad epirnritys qivkegrrfn idlvskllys 241 qgllidllik sdvsryvefk nvtrilafre gkveqvpcsr advfnskelt mvekrmlmkf 301 ltfcleyeqh pdeyqafrqc sfseylktkk ltpnlqhfvl hsiamtsess cttidglnat 361 knflqclgrf gntpflfply gqgeipqgfc rmcavfggiy clrhkvqcfv vdkesgrcka 421 iidhfgqrin akyfivedsy lseetcsnvq ykqisravli tdqsilktdl dqqtsilivp 481 paepgacavr vtelcsstmt cmkdtylvhl tcsssktare dlesvvkklf tpyteteine 541 eeltkprllw alyfnmrdss gisrssyngl psnvyvcsgp dcglgnehav kqaetlfqei 601 fpteefcppp pnpediifdg ddkqpeapgt nnvvmakles seesknlesp ekhlqncopy下来,在http://www.ncbi.nlm.nih.gov/blast/Blast.cgi 下面选blastp把蛋白序列输进去查找最接近的序列。10个最接近的序列。Sequences producing significant alignments: (Bits) Valueref|NP_001812.2| choroideremia-like Rab escort protein 2 [Hom... 1366 0.0 emb|CAA45979.1| hCHML [Homo sapiens] 1361 0.0 ref|XP_514301.1| PREDICTED: choroideremia-like Rab escort pro... 1356 0.0 ref|XP_537217.1| PREDICTED: similar to Rab proteins geranylge... 1142 0.0 ref|XP_001491397.1| PREDICTED: similar to choroideremia-like ... 1122 0.0 ref|XP_863080.1| PREDICTED: similar to Rab proteins geranylge... 1114 0.0 ref|XP_610836.1| PREDICTED: similar to choroideremia-like pro... 1098 0.0 ref|XP_863055.1| PREDICTED: similar to Rab proteins geranylge... 1095 0.0 sp|Q9QZD5.2|RAE2_MOUSE Rab proteins geranylgeranyltransferase... 1035 0.0 ref|NP_067325.2| choroideremia-like [Mus musculus] >gb|AAO157... 1032 0.0
2023-06-16 00:42:291

怎样使用生物信息学来获取弃列?举例最好了。急!!!!

楼主问得问题太专业,百度知道主要提供小学生中学生的问题答案,呵呵。建议你去生物信息学论坛http://www.ieee.org.cn/list.asp?boardid=46=========================================== 生物信息学是是采用数学、统计学和计算机方法对生物学数据信息进行采集、存储、传播、分析、归类、解释的科学[1] 。Internet网络是信息传输、检索、获取、交流的重要手段。当前 ,在Internet网上可以查询到大量的生物信息学数据库 ,其中SWISS PROT蛋白质序列数据库是网上生物信息学最核心的 3个数据库之一。通过该数据库 ,可以较完整地获得生物大分子的序列信息。同时 ,研究者也可以将测定的序列信息通过该数据库予以认定、发表、交流。本文主要探讨SWISS PROT蛋白质序列数据库的特点、检索方法及利用I…
2023-06-16 00:42:501

怎样用david数据库进行基因功能分析

Pathway功能分析及显著性判断对差异表达基因进行Pathway功能分析,并计算Pvalue进行显著性判断,Pvalue越小,表明该pathway变化越显著,并可对每条Pathway通路图进行展示,同时在相应的位置标注差异表达基因。2. Pathway中基因相关性分析根据每两个基因共出现在同一pathway中的次数统计,绘制基因共相关点线图,进而得到不同pathway上基因的关联情况。在分析工具上点击“cell differentiation”,在“Term Information”中描述了细胞分化术语的基本信息,包括树形及与父结点、子节点关系。对于未知基因名的序列,可以用序列直接检索GO数据库。点击AmiGO首页上方的“BLAST”,进入检索界面。在检索框输入氨基酸或核酸序列或上传序列文件,检索工具能自动识别并相应地选择BLASTP或BLASTX来与数据库中的序列进行比对。以大肠杆菌DNA聚合酶Ⅱ基因polB为例,“High Scoring Gene Products”栏内显示基因产物的名称、物种信息、p值。
2023-06-16 00:43:051

怎样在NCBI进行相似性搜索?(最好有例子图片)

要做相似性搜索,需要用到blast(http://blast.ncbi.nlm.nih.gov/Blast.cgi)在线比对工具。如果有一条DNA序列,可以做blastn,blastx,tblastx比对;寻找和此DNA相似性高的DNA或蛋白质。如果有一条蛋白质序列,可以做blastp,tblastn比对,寻找和此蛋白质相似性较高的蛋白质或DNA。图示blastp
2023-06-16 00:43:131

1、 查询拟南芥(Arabidopsis thaliana)BIK1基因的相关信息,BIK1基因的注册号?

你是不是在做生物信息学作业
2023-06-16 00:43:281

哈茨木霉(T.harzianum)和盖姆斯木霉(T.gamsii)的基因组

本书作者团队利用鸟枪法对两株生防木霉菌T.harzianum和T.gamsii的基因组进行了测序,并分析了有关基因结构。其中,T.harzianum测序深度为132倍,共得到28336787个reads,利用velvet和bow-tie等软件将这些数据组装成1346个contig和99个scaffold,大小约为42.8Mb,GC含量为48.5%。采用RepeatScout软件对基因组进行分析,共从中发现101个重复单元,最小的为50 bp,最大的为859 bp。使用Genemark软件预测基因,共挑选出13781个基因,预测基因的GC含量为50.3%,平均长度为1474 bp。将13781个预测基因的编码蛋白,通过BLASTP,分别与NR、UNIPORT和KEGG 3个数据库进行比对,条件设为E value <1 e-3,分别有13407、10990和4451个蛋白能找到匹配信息。利用SignalP和TMHMM等软件,对所有编码蛋白进行亚细胞定位预测,结果表明,在基因组中共编码890个胞外蛋白、2648个跨膜蛋白和10243个胞内蛋白。T.gamsii测序深度为132倍,共得到24570069个reads,利用velvet和bowtie等软件将这些数据组装成 949个 contig和1346个 scaffold,大小约为37.1Mb,GC 含量为49.7%。采用RepeatScout软件对基因组进行分析,共从中发现72个重复单元,最小为3336 bp,最大为859 bp。使用Genemark软件预测基因,共挑选出11025个基因,预测基因的GC 含量为55.7%,平均长度为1525 bp。将11025个预测基因的编码蛋白,通过BLASTP,分别与NR,UNIPORT和KEGG 这3个数据库进行比对,条件设为E value <1 e-3,分别有10755,7413和3263个蛋白能找到匹配信息。利用SignalP和TMHMM等软件,对所有编码蛋白进行亚细胞定位预测,结果表明,在基因组中共编码793个胞外蛋白、2034个跨膜蛋白和8198个胞内蛋白。
2023-06-16 00:43:361

NCBI BLAST search of P12653-00-00-01 against nr 是什么意思?

NCBI NCBI(美国国立生物技术信息中心) Entrez 功能强大,在于它的大多数记录可相互链接,既可在同一数据库内链接,也可在数据库之间进行链接。当运用BLAST软件比较某氨基酸或DNA序列与库中其他氨基酸或DNA序列差异即进行相似性检索时,则会涉及到蛋白质库或核苷酸库的库内链接。库间链接发生在核苷酸数据库内的记录与PubMed库中已发表序列的引文间的链接,或蛋白质序列记录与核苷酸序列库中编码它的核苷酸序列间的链接。 NCBI数据库检索 NCBI数据库的检索方法很简单,在检索框中输入检索词,检索词间默认逻辑关系为AND,检索规则基本同PubMed。图2是显示检索结果页面。 可以通过下拉菜单选择记录的显示格式,通常选择GenBank Report格式或FASTA Report格式。当选择GenBank Report格式后,屏幕显示较完整的基因记录,其内容包括:基因位点(Locus)、基因定义(Definition)、基因存取号(Accession)、 核酸编号(NID )、关键词(Keywords)、 来源(Source)、组织分类(Organism)、参考文献(Reference)、 著者(Author)、题目(Title)、期刊Journal)、Medline存取号(Medline)、序列特征(Features)、基因(Gene)、CDS(cDNA)、等位基因(Allele) 对等的肽(Mat-Peptide )、计算碱基数(Base Count)、原序列(Origin)。而FASTA Report格式仅包括检出序列的简要特征描述。在一个庞大的数据库中查找某一个序列的类似序列,没有BLAST的帮助可以说无法想象。目前在Internet网上有许多在线的Blast查找程序,专门用于查找各大数据库中与用户提交的序列类似的序列。分成五个不同的程序,分别为:blastp(提交蛋白质序列,在蛋白质序列数据库中查序列)、blastn(提交核酸序列,在核酸序列数据库中查找同源序列) blastx(提交核酸序列,在蛋白质序列数据库中查找同源序列)、tblastn (提交蛋白质序列,在核酸序列数据库中查找同源序列)、tblastx(提交核酸序列,在核酸序列数据库中查找同源序列)。通常通过在线方式或Email方式提交查询序列,得到查询结果。如果需要在本地使用的话,可以下载BLAST程序与相应数据库,便能在本地使用了。 综上,这是一个做DNA比对的命令~~
2023-06-16 00:43:433

运用NCBI-BLAST和PDB搜索工具搜P03958序列的相似序列和相似的结构,并对结果进行解?

纳尼?? 居然有这问题
2023-06-16 00:43:593

blast结果如何分析

筹dentities是同源性(相似性),例中所示比对的1588个碱基中只有3个不配,其他99%相同,同源性相当好几乎是一样的;Gaps是指多出或少的碱基或缺失的碱基数;Strand=plus/plus指两条序列方向相同,如果是plus/minus,即意味着一条是5"到3",一条是3"到5",或一条是正向,另一条是反向序列。具体的一些指标的定义或计算方法可以参考有关的生物信息学教材。|||因为Blast采用另一种统计方法,其典型的输出结果并不需要柱状圆,但仍包括相似序列的清单与并列分析的结果。在相似序列的清单中的Highscore是这一相似序列中最相似的区域之得分,这是一个与FastA非常不同之处。在FastA中,会插入空隙以连接数个相似区(对角线),因此在最後会列出「一个」最相似的区域。Blast并不试图连接各相似的片段,换言之它不允许空隙的存在,所以它会计算每一个相似区的得分,并将此序列中得分最高的片段的分数列出。HSP(High-scoringSegmentPair)仅代表一些分较高的片段,它们单独存在时或许无法通过统计上的测验,可是数个连在一起,则通过测验,在清单中的「Smallestsumprobability」就代表将数HSP连在一起之後之统计资料。其中N代表所参与的HSP的个数,P(N)代表在给定条件的搜寻中,找到与highscore得分相同或更高分的片段的机率。每一个蛋白质的长度不同,即使得分相同,其机率也不相同。在相似序列的排列顺序上,并不是根据得分排序,而是根据机率排序,所以有些得分较高的序列反而被排在後面,对蛋白质的比较来说,机率小於0.02就被认为是同源的。因为程式预设保留250个序列,若被认为有意义的序列超过此数字,程式会自动警告你。如果被认为有意义的序列总数超过1000,可能是在序列中有一些重覆序列,必须将其滤掉,以免干扰搜寻的结果。|||认为是同源的。因为程式预设保留250个序列,若被认为有意义的序列超过此数字,程式会自动警告你。如果被认为有意义的序列总数超过1000,可能是在序列中有一些重覆序列,必须将其滤掉,以免干扰搜寻的结果。|||Score得分值越高说明同源性越好;Expect期望值越小比对结果越好,说明因某些原因而引起的误差越小;Identities是同源性(相似性),例中所示比对的1588个碱基中只有3个不配,其他99%相同,同源性相当好几乎是一样的;Gaps是指多出或少的碱基或缺失的碱基数;Strand=plus/plus指两条序列方向相同,如果是plus/minus,即意味着一条是5"到3",一条是3"到5",或一条是正向,另一条是反向序列。
2023-06-16 00:44:241

我想要应用NCBI的BLAST找到人和鼠的MyD88氨基酸序列,并比较它们之间的同源性,想请教您

1 进入NCBI首页http://www.ncbi.nlm.nih.gov/2 蛋白库中输入MyD88,可找到人和鼠的MyD88,人(http://www.ncbi.nlm.nih.gov/protein/AAC50954.1),小鼠(http://www.ncbi.nlm.nih.gov/protein/AAC53013.1)3 可以下载序列用软件做本地比对4 或在NCBI上比较http://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastp&BLAST_PROGRAMS=blastp&PAGE_TYPE=BlastSearch&SHOW_DEFAULTS=on&BLAST_SPEC=blast2seq&LINK_LOC=blasttab&LAST_PAGE=blastn&BLAST_INIT=blast2seq
2023-06-16 00:44:471

列举常用的生物信息学数据库及序列对比常用软件及特点

太多了 说不完
2023-06-16 00:44:573

知道一条蛋白质的氨基酸序列,该如何了解它的三维结构是否已知呢?

1. 先用blast (http://blast.ncbi.nlm.nih.gov/Blast.cgi) 里面的protein blast (http://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastp&BLAST_PROGRAMS=blastp&PAGE_TYPE=BlastSearch&SHOW_DEFAULTS=on&LINK_LOC=blasthome)功能查询。在“Enter accession number(s), gi(s), or FASTA sequence(s) ”输入你要查询的氨基酸序列,然后点击左下角的“blast”,搜索结果是好多个蛋白质的氨基酸序列,每个序列会列出:该序列与你查询的序列有百分之多少相同,相同的是哪一部分。你随便点击任何一个序列,新出现的界面上面有该序列的信息。其中有一项是PUBMED, 后面是阿拉伯数字编码。你点开这个编码,直接就到了PUBMED的界面,会有次序列出处的文献标题、abstract等。2. 到PDB (Protein Data Bank) http://www.pdb.org/pdb/home/home.do查询,选择PUBMED Abstract.把该文献的Title输入进去,就可以查到是否有结构式。最好的方法还是,读一下你所查到的文献,找到该蛋白质的名字,直接到PBD上搜索该蛋白质的名称。这样查询,既快速又准确。
2023-06-16 00:45:052

急问……生物 genbank 如何在genbank中查询一条已知序列索引号的序列?

楼主把你要查的内容贴出来,我查了帮你发过去,再告诉你怎么查,你上面的表述实在是没有几个人能看懂你在说什么。
2023-06-16 00:45:285

blastx是什么?

blast全称是Basic Local Alignment Search Tool,是一种基于序列比对而判断核酸或蛋白的算法。当你获得了一段DNA序列(或者mRNA序列、蛋白序列等),却不知道它属于哪段基因、有什么作用,就可以尝试用blast,从已知的基因库中找出序列相同或者最相似的基因。blast有许多不同的子集,比如输入核酸序列寻找核酸的blastn,输入蛋白序列寻找蛋白的blastp。blastx也是其中一个。用blastx你可以输入DNA序列,寻找蛋白。未知的DNA序列可能是正义链也可能是反义链,读码框也有各3种可能,一共是6种可能。blastx会帮你把这一段序列的6种可能全部翻译成蛋白,分别从库中查找一遍,然后寻找最相似的几个返回结果。
2023-06-16 00:45:441

已知真核生物某氨基酸序列如何找到其对应基因序列

合成包含所有密码子的mRNA,并赋予适宜环境,合成蛋白质,看其与哪个密码子配对,并判断
2023-06-16 00:45:544

我做真菌分子生物学鉴定,用引物ITS1和ITS4测序结果在blast比对后有很多不一个属的物种相似度都99%,怎么办

blastp试试
2023-06-16 00:46:013

请教下NCBI中blastn和p,x还有tblastn,x有什么区别?

blastn 是用DNA序列去检索其匹配序列时的选项,告诉程序你的序列是核酸序列,你希望检索核酸库,是最常用的一种检索方式。balstp是用蛋白序列去检索时的选项。blastx是你希望数据库把你提交的序列去同时检索DNA库和蛋白库。tblastn是你提交的是DNA序列,你希望程序自动将其翻译后去检索相匹配的蛋白序列。所以,选择什么检索方式是根据你提交的序列种类和你希望检索出来的序列种类来决定的。
2023-06-16 00:46:101

如何找一个基因的特异性序列

把不同种生物的这种基因做一个Align,一般会发现以一个区域的同源性很高,这个区域就叫做保守序列。这里可以做免费的Alignhttp://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastn&BLAST_PROGRAMS=megaBlast&PAGE_TYPE=BlastSearch&SHOW_DEFAULTS=on&BLAST_SPEC=blast2seq&LINK_LOC=blasttab&LAST_PAGE=blastp&BLAST_INIT=blast2seq
2023-06-16 00:46:371

NCBI中进行BLAST比对时“Somewhat similar sequences”与 “Highly similar sequences ”两者各有何用途?

Blastp/PSI-BLAST/PHI-BLAST 的详细介绍http://www.liucheng.name/?p=1010BlastN/MegaBlast/Discontiguous MegaBlast 的区别http://www.liucheng.name/?p=1009
2023-06-16 00:46:441

什么是blast 序列数据库检索的假阳性结果和假阴性结果

这是期中作业吧
2023-06-16 00:47:162

BLAST中,E值和P值分别是什么,它们有什么

BLAST(是一种用于在数据库当寻找任何蛋白质或者基因序列与你的目标序列一致的程序),S值表示两序列的同源性,分值越高表明它们之间相似的程度越大。E值就是S值可靠性的评价。它表明在随机的情况下,其它序列与目标序列相似度要大于这条显示的序列的可能性。所以它的分值越低越好。
2023-06-16 00:47:231

blastp结果中加号含义是什么?再就是怎么看结果呢?

基本是化学性质相同的氨基酸
2023-06-16 00:47:321

BLAST中,E值和P值分别是什么,它们有什么

BLAST(是一种用于在数据库当寻找任何蛋白质或者基因序列与你的目标序列一致的程序),S值表示两序列的同源性,分值越高表明它们之间相似的程度越大。E值就是S值可靠性的评价。它表明在随机的情况下,其它序列与目标序列相似度要大于这条显示的序列的可能性。所以它的分值越低越好。
2023-06-16 00:47:391

请教BLAST分析的含义和操作

BLAST (Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的计说明。BLAST对一条或多条序列(可以是任何形式的序列)在一个或多个核酸或蛋白序列库中进行比对。BLAST还能发现具有缺口的能比对上的序列。 BLAST是基于Altschul等人在J.Mol.Biol上发表的方法(J.Mol.Biol.215:403-410(1990)),在序列数据库中对查询序列进行同源性比对工作。从最初的BLAST发展到现在NCBI提供的BLAST2.0,已将有缺口的比对 序列也考虑在内了。BLAST可处理任何数量的序列,包括蛋白序列和核算序列;也可选择多个数据库但数据库必须是同一类型的,即要么都是蛋白数据库要么都是核酸数据库。所查询的序列和调用的数据库则可 以是任何形式的组合,既可以是核酸序列到蛋白库中作查询,也可以是蛋白序列到蛋白库中作查询,反之亦然。 1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。 至于如何进行,你先进入NCBI,然后点BLAST,选择你所需要的BLAST的类型,然后输入你要BLAST的序列,就可以看到与你所输入的序列的同源性序列了 …………………… 详细资料请参考: 荧光斑点分析: http://product.bio1000.com/101773/采纳哦
2023-06-16 00:47:461

真菌鉴定blast应该选什么库

Blast(Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。 BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。 Blast中常用的程序介绍: 1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。
2023-06-16 00:48:011

如何用blast 发现新基因

Blast是一个基因库,可以用来比对,如果你手头上有段序列的话,可以将自己的序列粘贴到NCBI网站上,进行比对,看看与那些物种的基因相近,至于是不是新物种,还要很多的实验程序。
2023-06-16 00:48:113

本地Blast代码

1.cmd中执行cd C:last-2.9.0+in 变为在bin中执行 2.建库 C:last-2.9.0+in>makeblastdb.exe -in name.fa -dbtype prot -out name.db 3.比对 C:last-2.9.0+in>blastp.exe -query name.fa -out blast.out.txt -db name.db -evalue 1e-10 -outfmt 6
2023-06-16 00:48:181

如何使blast结果中具有taxid

Blast(Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。 BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。 Blast中常用的程序介绍: 1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。
2023-06-16 00:48:371

如何将批量blast结果一一对应

Blast(Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。 BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。 Blast中常用的程序介绍: 1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。
2023-06-16 00:48:441

建细菌进化树的策略

标题: Extensive Unexplored Human Microbiome Diversity Revealed by Over 150,000 Genomes from Metagenomes Spanning Age, Geography, and Lifestyle 杂志:CELL 时间:2019 PhyloPhlAn软件 400 universal PhyloPhlAn markers构建phylogeny phylophlan参数:--diversity high --accurate --min_num_markers 80 Internal steps: diamond: blastx --quiet --threads 1 --outfmt 6 --more-sensitive --id 50 --max-hsps 35 -k 0 diamond: blastp --quiet --threads 1 --outfmt 6 --more-sensitive --id 50 --max-hsps 35 -k 0 mafft --anysymbol 对齐 trimal -gappyout 修剪 RAxML -m PROTCATLG -p 1989 建树 PhyloPhlAn软件 400 PhyloPhlAn markers reconstruct phylogeny phylophlan参数:--diversity high --fast --min_num_markers 80 Internal steps: diamond: blastx --quiet --threads 1 --outfmt 6 --more-sensitive --id 50 --max-hsps 35 -k 0 diamond: blastp --quiet --threads 1 --outfmt 6 --more-sensitive --id 50 --max-hsps 35 -k 0 mafft --anysymbol 对齐 trimal -gappyout 修剪 RAxML -m PROTCATLG -p 1989 建树 IQ-TREE -nt AUTO -m LG 建树 Roary identified set of cores genes at 95% PhyloPhlAn --diversity low --fast --min_num_markers <50% of the number of core genes identified> --min_num_entries <90% of the number of input genomes> blastn -outfmt 6 -max_target_seqs 1000000 mafft --anysymbol --auto 对齐 trimal -gappyout 修剪 FastTree -mlacc 2 -slownni -spr 4 -fastest -mlnni 4 -no2nd -gtr -nt 建树 RAxML -p 1989 -m GTRCAT -t <phylogenetic tree computed by FastTree> The non-metric multidimensional scaling plots were computed on pairwise genetic distances between core gene alignments produced by Roary using the nmds function in the ecodist R package The phylogenetic trees were generated using GraPhlAn and the phylogenies were generated using FigTree 文章: Insights on the Evolutionary Genomics of the Blautia Genus: Potential New Species and Genetic Content Among Lineages 杂志:Frontiers in Microbiology 时间:2021 OrthoFinder 获取conserved gene families (Orthogroups) perl retrieve protein sequence MAFFT (L-INS-i mode)对齐Orthogroups ModelTest-NG : Akaike information criterion (AIC) IQ-TREE 2 : 1000 replicates of ultrafast bootstrap UFBOOT trees by NNI (–bnni) SH-like approximate likelihood ratio test (–alrt) panX core genome to construct single nucleotide polymorphism (SNP)-based tree cophylo 比较phylogenomic aminoacid and the SNP-based trees TypeMat from the Microbial Genomes Atlas (MiGA) 进行细菌分类剔除anomalous classification
2023-06-16 00:48:511

blast结果如何分析

Blast比对结果中,Score得分值越高说明同源性越好;Expect期望值越小比对结果越好,说明因某些原因而引起的误差越小;Identities是同源性(相似性),例中所示比对的1588个碱基中只有3个不配,其他99%相同,同源性相当好几乎是一样的;Gaps是指多出或少的碱基或缺失的碱基数;Strand=plus/plus指两条序列方向相同,如果是plus/minus,即意味着一条是5"到3",一条是3"到5",或一条是正向,另一条是反向序列。具体的一些指标的定义或计算方法可以参考有关的生物信息学教材。|||因为Blast采用另一种统计方法,其典型的输出结果并不需要柱状圆,但仍包括相似序列的清单与并列分析的结果。在相似序列的清单中的Highscore是这一相似序列中最相似的区域之得分,这是一个与FastA非常不同之处。在FastA中,会插入空隙以连接数个相似区(对角线),因此在最後会列出「一个」最相似的区域。Blast并不试图连接各相似的片段,换言之它不允许空隙的存在,所以它会计算每一个相似区的得分,并将此序列中得分最高的片段的分数列出。HSP(High-scoringSegmentPair)仅代表一些分较高的片段,它们单独存在时或许无法通过统计上的测验,可是数个连在一起,则通过测验,在清单中的「Smallestsumprobability」就代表将数HSP连在一起之後之统计资料。其中N代表所参与的HSP的个数,P(N)代表在给定条件的搜寻中,找到与highscore得分相同或更高分的片段的机率。每一个蛋白质的长度不同,即使得分相同,其机率也不相同。在相似序列的排列顺序上,并不是根据得分排序,而是根据机率排序,所以有些得分较高的序列反而被排在後面,对蛋白质的比较来说,机率小於0.02就被认为是同源的。因为程式预设保留250个序列,若被认为有意义的序列超过此数字,程式会自动警告你。如果被认为有意义的序列总数超过1000,可能是在序列中有一些重覆序列,必须将其滤掉,以免干扰搜寻的结果。|||认为是同源的。因为程式预设保留250个序列,若被认为有意义的序列超过此数字,程式会自动警告你。如果被认为有意义的序列总数超过1000,可能是在序列中有一些重覆序列,必须将其滤掉,以免干扰搜寻的结果。|||Score得分值越高说明同源性越好;Expect期望值越小比对结果越好,说明因某些原因而引起的误差越小;Identities是同源性(相似性),例中所示比对的1588个碱基中只有3个不配,其他99%相同,同源性相当好几乎是一样的;Gaps是指多出或少的碱基或缺失的碱基数;Strand=plus/plus指两条序列方向相同,如果是plus/minus,即意味着一条是5"到3",一条是3"到5",或一条是正向,另一条是反向序列。|||因为Blast采用另一种统计方法,其典型的输出结果并不需要柱状圆,但仍包括相似序列的清单与并列分析的结果。
2023-06-16 00:48:591

如何使用agrigo进行靶基因功能分析

  1. Pathway功能分析及显著性判断  对差异表达基因进行Pathway功能分析,并计算Pvalue进行显著性判断,Pvalue越小,表明该pathway变化越显著,并可对每条Pathway通路图进行展示,同时在相应的位置标注差异表达基因。  2. Pathway中基因相关性分析  根据每两个基因共出现在同一pathway中的次数统计,绘制基因共相关点线图,进而得到不同pathway上基因的关联情况。在分析工具上点击“cell differentiation”,在“Term Information”中描述了细胞分化术语的基本信息,包括树形及与父结点、子节点关系。  对于未知基因名的序列,可以用序列直接检索GO数据库。点击AmiGO首页上方的“BLAST”,进入检索界面。在检索框输入氨基酸或核酸序列或上传序列文件,检索工具能自动识别并相应地选择BLASTP或BLASTX来与数据库中的序列进行比对。以大肠杆菌DNA聚合酶Ⅱ基因polB为例,“High Scoring Gene Products”栏内显示基因产物的名称、物种信息、p值。
2023-06-16 00:49:071

SiRNA设计后BLAST同其他基因组有部分匹配有关系吗

Blast(Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。 BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。 Blast中常用的程序介绍: 1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。
2023-06-16 00:49:151

BLAST 结果分析!

筹dentities是同源性(相似性),例中所示比对的1588个碱基中只有3个不配,其他99%相同,同源性相当好几乎是一样的;Gaps是指多出或少的碱基或缺失的碱基数;Strand=plus/plus指两条序列方向相同,如果是plus/minus,即意味着一条是5"到3",一条是3"到5",或一条是正向,另一条是反向序列。具体的一些指标的定义或计算方法可以参考有关的生物信息学教材。|||因为Blast采用另一种统计方法,其典型的输出结果并不需要柱状圆,但仍包括相似序列的清单与并列分析的结果。在相似序列的清单中的Highscore是这一相似序列中最相似的区域之得分,这是一个与FastA非常不同之处。在FastA中,会插入空隙以连接数个相似区(对角线),因此在最後会列出「一个」最相似的区域。Blast并不试图连接各相似的片段,换言之它不允许空隙的存在,所以它会计算每一个相似区的得分,并将此序列中得分最高的片段的分数列出。HSP(High-scoringSegmentPair)仅代表一些分较高的片段,它们单独存在时或许无法通过统计上的测验,可是数个连在一起,则通过测验,在清单中的「Smallestsumprobability」就代表将数HSP连在一起之後之统计资料。其中N代表所参与的HSP的个数,P(N)代表在给定条件的搜寻中,找到与highscore得分相同或更高分的片段的机率。每一个蛋白质的长度不同,即使得分相同,其机率也不相同。在相似序列的排列顺序上,并不是根据得分排序,而是根据机率排序,所以有些得分较高的序列反而被排在後面,对蛋白质的比较来说,机率小於0.02就被认为是同源的。因为程式预设保留250个序列,若被认为有意义的序列超过此数字,程式会自动警告你。如果被认为有意义的序列总数超过1000,可能是在序列中有一些重覆序列,必须将其滤掉,以免干扰搜寻的结果。|||认为是同源的。因为程式预设保留250个序列,若被认为有意义的序列超过此数字,程式会自动警告你。如果被认为有意义的序列总数超过1000,可能是在序列中有一些重覆序列,必须将其滤掉,以免干扰搜寻的结果。|||Score得分值越高说明同源性越好;Expect期望值越小比对结果越好,说明因某些原因而引起的误差越小;Identities是同源性(相似性),例中所示比对的1588个碱基中只有3个不配,其他99%相同,同源性相当好几乎是一样的;Gaps是指多出或少的碱基或缺失的碱基数;Strand=plus/plus指两条序列方向相同,如果是plus/minus,即意味着一条是5"到3",一条是3"到5",或一条是正向,另一条是反向序列。请采纳答案,支持我一下。
2023-06-16 00:49:221