BLAST:

"one-against-all" input sequence(query sequence)를 넣으면 이걸 가지고 다른 모든 종류의 sequences와 비교한다. 예를들어, 아래 그림처럼 박테리아2 sequence를 우리가 얻었고, 이것이 뭔지 궁금하다면 이걸 BLAST를 통해 찾을 수 있다. 이처럼 우리가 알고자 하는 sequence를 input sequence 또는 query sequence라 한다.

 

 

복사&붙여넣기한다. DNA라서 nucleotide databse라고 설정해야한다.

 

 

 

 

 

그럼 아래와 같은 결과가 나온다.

 

 

 

 

그럼 첫번째 가장 위에있는게 우리가 알고자하는 것이다. 각 염기서열마다 match가되면 그걸 bits score라고하는데 이 점수가 높을수록 e-value는 낮아진다. 따라서 박테리아2 Pseudomonas aeruginosa gene이 되겠다.

 

 

그래서 이걸 클릭하게되면 더 많은 정보를 얻을 수 있다. accession GenBank에도 조회할 수 있다.

 

 

 

 

 

 

 

 ClustalW

: "many-against-each-other" 검색방법으로 각각 주어진 sequences들을 비교하는것이다.  

아래 샘플로 human, mouse, rat, monkey, chimpanzee를 비교해보자.  

 

 

 

 

종류는 프로틴이고 스타일은 black/white로 한다. black은 같은서열을 의미하고 white는 다른서열을 의미하지만, white라고해도 같은서열일수도 있다. 아래 설명 참고.  

아래처럼 결과같이 나오는데... 아래그림에서 파란색 글씨 view tree를 클릭해보면,


 

 

 

 

이처럼 tree로 보여줘서 각 species간의 similarity를 알 수 있다. 굳이 tree가 아니더라도, human과 가장 비슷한 종류로는 chimpanzee라는걸 위에 수치를보면 알 수 있다. (침팬지 99.5%) 가장 동떨어진건 mouse 93.8%이다.

 

 

 

 

 

black부분은 같은염기서열을 말하고, white부분은 다른염기서열을 말하지만 diference를 알고자 할때는 white라 할지라도 염기서열이 달라야한다. , human chimpanzee의 염기서열은 white부분만 따져보면 9개가 다르지만, 염기서열도 다른지 따져야하므로 빨간색 화살표 부분 1곳만 르다는것을 알 수 있다.

 

 

 

 

반응형

+ Recent posts