BLAST:
"one-against-all" 즉 input sequence(query sequence)를 넣으면 이걸 가지고 다른 모든 종류의 sequences와 비교한다. 예를들어, 아래 그림처럼 박테리아2 sequence를 우리가 얻었고, 이것이 뭔지 궁금하다면 이걸 BLAST를 통해 찾을 수 있다. 이처럼 우리가 알고자 하는 sequence를 input sequence 또는 query sequence라 한다.
복사&붙여넣기한다. DNA라서 nucleotide databse라고 설정해야한다.
그럼 아래와 같은 결과가 나온다.
그럼 첫번째 가장 위에있는게 우리가 알고자하는 것이다. 각 염기서열마다 match가되면 그걸 bits score라고하는데 이 점수가 높을수록 e-value는 낮아진다. 따라서 박테리아2는 Pseudomonas aeruginosa gene이 되겠다.
그래서 이걸 클릭하게되면 더 많은 정보를 얻을 수 있다. accession 은 GenBank에도 조회할 수 있다.
ClustalW
: "many-against-each-other" 검색방법으로 각각 주어진 sequences들을 비교하는것이다.
아래 샘플로 human, mouse, rat, monkey, chimpanzee를 비교해보자.
종류는 프로틴이고 스타일은 black/white로 한다. black은 같은서열을 의미하고 white는 다른서열을 의미하지만, 꼭 white라고해도 같은서열일수도 있다. 아래 설명 참고.
아래처럼 결과같이 나오는데... 아래그림에서 파란색 글씨 view tree를 클릭해보면,
이처럼 tree로 보여줘서 각 species간의 similarity를 알 수 있다. 굳이 tree가 아니더라도, human과 가장 비슷한 종류로는 chimpanzee라는걸 위에 수치를보면 알 수 있다. (침팬지 99.5%) 가장 동떨어진건 mouse로 93.8%이다.
black부분은 같은염기서열을 말하고, white부분은 다른염기서열을 말하지만 diference를 알고자 할때는 white라 할지라도 염기서열이 달라야한다. 즉, human과 chimpanzee의 염기서열은 white부분만 따져보면 9개가 다르지만, 염기서열도 다른지 따져야하므로 빨간색 화살표 부분 1곳만 르다는것을 알 수 있다.
'공부정리 > 생물학' 카테고리의 다른 글
[분자생물학] 단백질 번역(Translation)과 과정, 리보솜(Ribosome), Quality Control (Elogation Factor), 번역 개시와 종료, Proetin Folding (3) | 2014.10.11 |
---|---|
[분자생물학] DNA의 Transcription (전사) - mRNA로 유전정보 전달, RNA polymerase (RNA 중합효소), 진핵생물과 원핵생물 전사 차이점 (4) | 2014.08.31 |
단백질 2차구조, 알파 나선구조와 베타 병풍구조의 차이점 (0) | 2014.08.29 |
단백질 구조 (1) | 2014.08.28 |
DNA 복제, 플라스미드, Agarose Gel Electrophoresis (0) | 2014.08.28 |