福利,如何看懂Blast結果圖
眾所周知,同源性是預測基因和蛋白質功能的主要線索,而序列同源性的判斷則離不開兩個或多個序列之間相似性的檢測。一般來說,序列間的相似度越高,它們是同源序列的可能性就越高。
其中,序列比對無疑是評估序列相似性的最簡單方法。顯然,Blast就是序列比對檢測的中堅力量。Blast自1990年首次亮相以來,憑借從各大數據庫(EST、PDB數據庫等)獲取信息的能力,迅速成為序列比對界的領頭羊。?
![福利,如何看懂Blast結果圖 福利,如何看懂Blast結果圖]()
老實說,Blast的界面非常友好,點擊相應模塊后,大家只需在序列框中丟上自己的靶序列,勾選好物種基因組,點擊搜索即可!?
![福利,如何看懂Blast結果圖 福利,如何看懂Blast結果圖]()
可看著結果界面涌現出的幾十個、數百個甚至數千個候選匹配序列,不少選擇困難癥的童鞋表示頭疼不已:結果辣么多,究竟哪個才是最優解?本文以NM_001206932為例,分解BLAST結果頁面,讓大家迅速擺脫Blast新手身份。
Blast結果解析:
首先會看到一個表頭,即本次比對的基本信息,如比對類型、序列長度、所選的數據庫等等。如果所選的數據庫不合適,請及時迷途知返哦。?
![福利,如何看懂Blast結果圖 福利,如何看懂Blast結果圖]()
接下來就是Blast的結果顯示圖(Graphic Summary):顏色比例尺,其中相似度從高到低排列分別為:紅、紫、綠、藍、黑,紅色區域越多則表示有較好的比對結果。
?![福利,如何看懂Blast結果圖 福利,如何看懂Blast結果圖]()
而在Blast結果的描述區域,兩個衡量標準最為重要:Max Score和E值(E value),前者匹配片段越長,相似性越高則Score值越大;后者是得到上述Score值的概率的大小。E值越小表示隨機情況下得到該Score值的可能性越低。
![福利,如何看懂Blast結果圖 福利,如何看懂Blast結果圖]()
而點擊相應注釋名稱,又或者在結果顯示圖(Graphic Summary)中點擊對應的線條,均可以查看比對結果的詳細信息。
其中,Expect(E值)、Identities(一致性)、Gaps(缺失或插入)三項是評價blast結果的標準。E值接近零或者為零時,具體上就是完全匹配了;一致性:匹配上的堿基數占總序列長的百分數。
![福利,如何看懂Blast結果圖 福利,如何看懂Blast結果圖]()
如此,就可對Blast結果做到了如指掌。
序列比對常用在線工具:
1.?????SimiTriX-SimiTetra
功能:多序列比對相似性展示
網址:http://cotton.hzau.edu.cn/EN/tools/BioERCP/simitrix.php
2.?????MUSCLE
功能:運行速度比較快的多序列比對
網址:http://www.ebi.ac.uk/Tools/msa/muscle/#
3.?????Clustal Omega
功能:DNA、RNA、蛋白的多序列比對
網址:http://www.ebi.ac.uk/Tools/msa/clustalo/
4.?????ClustalW2
功能:應用較廣泛的多序列比對
網址:http://www.ebi.ac.uk/Tools/msa/clustalw2/
5.?????T-Coffee
功能:準確度高,速度慢的多序列比對
網址:http://www.ebi.ac.uk/Tools/msa/tcoffee/